筛选
模型列表
共 151 个模型
DeepSeek OCR 2
DeepSeek-OCR 2 是 DeepSeek AI 发布的一款多模态文档识别模型,作为 DeepSeek-OCR 的升级版本。通过引入 DeepEncoder V2 架构,它实现了视觉编码范式从“固定扫描”到“语义推理”的转变。该模型用轻量级语言模型(Qwen2-0.5B)替代了原始的 CLIP 编码器,并加入了因果流查询机制,同时保留了 DeepSeek-3B-MoE 解码器。该模型仅需 256 到 1120 个视觉 token 即可覆盖复杂文档页面。
图片识别、OCR
输入:¥ 0.00038 / 千 tokens
输出:¥ 0.00038 / 千 tokens
KAT Coder Pro V2
KAT-Coder-Pro V2 是 KwaiKAT 的 KAT-Coder 系列中最新的高性能模型,专为复杂的企业级软件工程和 SaaS 集成而设计。它延续了前代版本在智能体编码方面的优势,重点面向大规模生产环境、多系统协同以及跨现代软件技术栈的无缝集成,同时还支持网页美学生成,可生成可直接用于生产的落地页和演示文稿。
文本生成、代码补全、适配OpenClaw
输入:¥ 0.0023 / 千 tokens
输出:¥ 0.009 / 千 tokens
MiMo V2 Pro
MiMo-V2-Pro 是小米的旗舰级基础模型,总参数量超过 1 万亿,支持 100 万上下文长度,专为智能体场景深度优化。该模型对 OpenClaw 等通用智能体框架具有高度适应性,在 PinchBench 和 ClawBench 等标准基准测试中稳居全球第一梯队,感知性能已接近 Opus 4.6 水平。MiMo-V2-Pro 旨在作为智能体系统的"大脑",能够编排复杂的工作流程,驱动生产工程任务,并提供可靠的结果交付。
文本生成、深度思考
MiMo V2 Omni
MiMo-V2-Omni 是一款前沿的全模态模型,能够在统一架构中原生处理图像、视频和音频输入。它融合了强大的多模态感知能力与智能体功能——包括视觉定位、多步规划、工具使用和代码执行——使其非常适合处理跨越多种模态的复杂现实世界任务。
文本生成、深度思考、多模态
输入:¥ 0.005 / 千 tokens
输出:¥ 0.021 / 千 tokens
MiniMax M2.7
MiniMax M2.7 是 MiniMax 的新一代大语言模型,专为自主化、真实世界的生产力提升以及持续优化而设计。MiniMax M2.7 通过多智能体协作,主动参与自身演进,并将先进的智能体能力整合其中,使其能够在动态环境中规划、执行并改进复杂任务。M2.7 经过面向生产级性能的训练,能够处理诸如实时调试、根因分析、财务建模,以及跨 Word、Excel 和 PowerPoint 的完整文档生成等工作流程。
文本生成、深度思考、专业能力
输入:¥ 0.003 / 千 tokens
输出:¥ 0.012 / 千 tokens
GLM 5 Turbo
GLM-5 Turbo 是智谱推出的新型号,专为快速推理设计,在 OpenClaw(龙虾)等智能体驱动场景中表现强劲。该模型针对涉及长执行链的现实世界智能体工作流进行了深度优化,在复杂指令分解、工具使用、计划与持久化执行以及扩展任务的整体稳定性方面均有显著提升。
文本生成、深度思考、OpenClaw优化
输入:¥ 0.012 / 千 tokens
输出:¥ 0.04 / 千 tokens
Qwen3.5 9B
Qwen3.5-9B 是 Qwen3.5 系列中的多模态基础模型,采用高效的 90 亿参数架构,具备强大的推理、编程和视觉理解能力。该模型采用统一视觉语言设计,通过多模态 token 的早期融合技术,能够在同一上下文内处理和推理文本与图像信息。
文本生成、多模态
输入:¥ 0.0012 / 千 tokens
输出:¥ 0.00175 / 千 tokens
Baidu ERNIE 5.0
Baidu ERNIE 5.0 是百度文心新一代原生全模态大模型,采用原生的全模态统一建模技术,将文本、图像、音频、视频联合建模,具备综合的全模态能力。百度文心 5.0 模型基础能力全面升级,基准测试集表现出色,多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等表现尤其出色。
文本生成、深度思考、多模态
Qwen3.5 35B A3B
Qwen3.5 系列 35B-A3B 原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。该模型的综合表现接近于 Qwen3.5-27B。
深度思考、视觉理解、文本生成
Qwen3.5 122B A10B
Qwen3.5 系列 122B-A10B 原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。该模型的综合表现仅次于 Qwen3.5-397B-A17B,文本能力显著优于 Qwen3-235B-2507,视觉能力优于 Qwen3-VL-235B。
深度思考、视觉理解、文本生成
Qwen3.5 27B
Qwen3.5 系列 27B 原生视觉语言 Dense 模型,融合了线性注意力机制;响应速度快,兼具推理速度和性能。该模型的综合能力接近于 Qwen3.5-122B-A10B。
深度思考、视觉理解、文本生成
Qwen3.5 Flash
Qwen3.5 原生视觉语言系列 Flash 模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。模型效果在纯文本与多模态方面相较 Qwen3 系列均实现飞跃式进步;响应速度快,兼具推理速度和性能。
深度思考
Qwen3.5 397B A17B
Qwen 3.5 系列 397B-A17B 原生视觉语言模型采用了混合架构,该架构将线性注意力机制与稀疏混合专家模型相结合,实现了更高的推理效率。该模型在语言理解、逻辑推理、代码生成、智能体相关任务、图像理解、视频理解以及图形用户界面交互等多个任务中展现出顶尖性能,达到业界领先水平。凭借强大的代码生成和智能体能力,该模型在各类智能体应用中表现出卓越的泛化性能。
文本生成、深度思考、多模态
Doubao Seed 2.0 Pro
Doubao Seed 2.0 是面向高频企业场景兼顾性能与成本的均衡型模型,综合能力超越上一代 Doubao Seed 1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作,支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。Doubao Seed 2.0 Pro 侧重长链路推理能力与复杂任务稳定性,适配真实业务中的复杂场景。
文本生成、深度思考、多模态
Qwen 3.5 Plus
Qwen 3.5 原生视觉语言系列 Plus 模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在多项任务评测中,3.5 系列均展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果在纯文本与多模态方面相较 3 系列均实现飞跃式进步。
文本生成、深度思考、多模态
Doubao Seed 2.0 Code
Doubao Seed 2.0 Code 面向真实编程环境优化的 Coding 模型,能稳定调用 Claude Code 等常见 IDE 中的工具。模型特别优化了前端能力,在使用常见的前端框架时能有良好表现。模型支持使用 Skills,可以配合多种自定义技能使用。Doubao Seed 2.0 Code 是Seed 2.0 的编程加强版,更适合 Agentic Coding。
代码补全、深度思考
GLM 5
GLM-5 是智谱的旗舰开源基础模型,专为复杂系统设计与长期智能体工作流打造。它面向专业开发者,在大规模编程任务中展现出生产级性能,与领先的闭源模型并驾齐驱。凭借高级智能体规划、深度后端推理与迭代自我修正能力,GLM-5 已超越代码生成,迈向全系统构建与自主执行。
文本生成、深度思考、代码补全
MiniMax M2.5
MiniMax-M2.5 是一款最先进的大语言模型,专为提升实际生产力而设计。通过在多样化的复杂真实数字工作环境中训练,M2.5 在 M2.1 编码专长的基础上扩展至通用办公领域,能够熟练生成和操作 Word、Excel、PowerPoint 文件,在不同软件环境间进行上下文切换,并与各类智能体及人类团队协同工作。M2.5 在 SWE-Bench Verified、Multi-SWE-Bench 和 BrowseComp 上分别取得 80.2%、51.3% 和 76.3% 的得分,同时相比前代模型具有更高的词元效率——这得益于其通过规划优化自身行动与输出的训练机制。
内容生成、 深度思考、代码补全
输入:¥ 0.003 / 千 tokens
输出:¥ 0.01 / 千 tokens
Qwen3 Max Thinking
Qwen3-Max-Thinking 是 Qwen3 系列中的旗舰推理模型,专为需要深度、多步推理的高难度认知任务而设计。通过大幅扩展模型容量与强化学习计算规模,该模型在事实准确性、复杂推理、指令遵循、人类偏好对齐及智能体行为方面均取得了显著提升。
文本生成、深度思考
Qwen3 Coder Next
Qwen3-Coder-Next 是一款开放权重的自回归(因果)语言模型,针对编程智能体与本地开发工作流进行了优化。它采用稀疏专家模型(Mixture-of-Experts,MoE)设计,总参数量为 80B(约 800 亿),但每个 token 仅激活 3B(约 30 亿)参数,能够提供与那些每次激活计算量高 10 到 20 倍的模型相当的性能,因此非常适合对成本敏感且需要常驻运行的智能体部署。 模型在训练中强调代理能力(agentic focus),在长时程的编码任务、复杂工具调用以及从执行失败中恢复方面具有可靠表现。模型原生支持 256k 的上下文窗口,能够无缝集成到真实世界的命令行(CLI)和集成开发环境(IDE)中,并能很好地适配现代编码工具常用的代理框架。该模型仅在非“思考”模式(non-thinking mode)下运行,不会输出 `<think>` 块,从而简化了在生产级编码智能体中的集成。
文本生成、深度思考、代码补全
输入:¥ 0.0015 / 千 tokens
输出:¥ 0.009 / 千 tokens