筛选

模型系列
模型类型
排序
可输入类型
可输出类型
模型能力

模型列表

共 151 个模型

DeepSeek OCR 2

DeepSeek-OCR 2 是 DeepSeek AI 发布的一款多模态文档识别模型,作为 DeepSeek-OCR 的升级版本。通过引入 DeepEncoder V2 架构,它实现了视觉编码范式从“固定扫描”到“语义推理”的转变。该模型用轻量级语言模型(Qwen2-0.5B)替代了原始的 CLIP 编码器,并加入了因果流查询机制,同时保留了 DeepSeek-3B-MoE 解码器。该模型仅需 256 到 1120 个视觉 token 即可覆盖复杂文档页面。

图片识别、OCR

输入:¥ 0.00038 / 千 tokens

输出:¥ 0.00038 / 千 tokens

KAT Coder Pro V2

KAT-Coder-Pro V2 是 KwaiKAT 的 KAT-Coder 系列中最新的高性能模型,专为复杂的企业级软件工程和 SaaS 集成而设计。它延续了前代版本在智能体编码方面的优势,重点面向大规模生产环境、多系统协同以及跨现代软件技术栈的无缝集成,同时还支持网页美学生成,可生成可直接用于生产的落地页和演示文稿。

文本生成、代码补全、适配OpenClaw

输入:¥ 0.0023 / 千 tokens

输出:¥ 0.009 / 千 tokens

MiMo V2 Pro

MiMo-V2-Pro 是小米的旗舰级基础模型,总参数量超过 1 万亿,支持 100 万上下文长度,专为智能体场景深度优化。该模型对 OpenClaw 等通用智能体框架具有高度适应性,在 PinchBench 和 ClawBench 等标准基准测试中稳居全球第一梯队,感知性能已接近 Opus 4.6 水平。MiMo-V2-Pro 旨在作为智能体系统的"大脑",能够编排复杂的工作流程,驱动生产工程任务,并提供可靠的结果交付。

文本生成、深度思考

MiMo V2 Omni

MiMo-V2-Omni 是一款前沿的全模态模型,能够在统一架构中原生处理图像、视频和音频输入。它融合了强大的多模态感知能力与智能体功能——包括视觉定位、多步规划、工具使用和代码执行——使其非常适合处理跨越多种模态的复杂现实世界任务。

文本生成、深度思考、多模态

输入:¥ 0.005 / 千 tokens

输出:¥ 0.021 / 千 tokens

MiniMax M2.7

MiniMax M2.7 是 MiniMax 的新一代大语言模型,专为自主化、真实世界的生产力提升以及持续优化而设计。MiniMax M2.7 通过多智能体协作,主动参与自身演进,并将先进的智能体能力整合其中,使其能够在动态环境中规划、执行并改进复杂任务。M2.7 经过面向生产级性能的训练,能够处理诸如实时调试、根因分析、财务建模,以及跨 Word、Excel 和 PowerPoint 的完整文档生成等工作流程。

文本生成、深度思考、专业能力

输入:¥ 0.003 / 千 tokens

输出:¥ 0.012 / 千 tokens

GLM 5 Turbo

GLM-5 Turbo 是智谱推出的新型号,专为快速推理设计,在 OpenClaw(龙虾)等智能体驱动场景中表现强劲。该模型针对涉及长执行链的现实世界智能体工作流进行了深度优化,在复杂指令分解、工具使用、计划与持久化执行以及扩展任务的整体稳定性方面均有显著提升。

文本生成、深度思考、OpenClaw优化

输入:¥ 0.012 / 千 tokens

输出:¥ 0.04 / 千 tokens

Qwen3.5 9B

Qwen3.5-9B 是 Qwen3.5 系列中的多模态基础模型,采用高效的 90 亿参数架构,具备强大的推理、编程和视觉理解能力。该模型采用统一视觉语言设计,通过多模态 token 的早期融合技术,能够在同一上下文内处理和推理文本与图像信息。

文本生成、多模态

输入:¥ 0.0012 / 千 tokens

输出:¥ 0.00175 / 千 tokens

Baidu ERNIE 5.0

Baidu ERNIE 5.0 是百度文心新一代原生全模态大模型,采用原生的全模态统一建模技术,将文本、图像、音频、视频联合建模,具备综合的全模态能力。百度文心 5.0 模型基础能力全面升级,基准测试集表现出色,多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等表现尤其出色。

文本生成、深度思考、多模态

Qwen3.5 35B A3B

Qwen3.5 系列 35B-A3B 原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。该模型的综合表现接近于 Qwen3.5-27B。

深度思考、视觉理解、文本生成

Qwen3.5 122B A10B

Qwen3.5 系列 122B-A10B 原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。该模型的综合表现仅次于 Qwen3.5-397B-A17B,文本能力显著优于 Qwen3-235B-2507,视觉能力优于 Qwen3-VL-235B。

深度思考、视觉理解、文本生成

Qwen3.5 27B

Qwen3.5 系列 27B 原生视觉语言 Dense 模型,融合了线性注意力机制;响应速度快,兼具推理速度和性能。该模型的综合能力接近于 Qwen3.5-122B-A10B。

深度思考、视觉理解、文本生成

Qwen3.5 Flash

Qwen3.5 原生视觉语言系列 Flash 模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。模型效果在纯文本与多模态方面相较 Qwen3 系列均实现飞跃式进步;响应速度快,兼具推理速度和性能。

深度思考

Qwen3.5 397B A17B

Qwen 3.5 系列 397B-A17B 原生视觉语言模型采用了混合架构,该架构将线性注意力机制与稀疏混合专家模型相结合,实现了更高的推理效率。该模型在语言理解、逻辑推理、代码生成、智能体相关任务、图像理解、视频理解以及图形用户界面交互等多个任务中展现出顶尖性能,达到业界领先水平。凭借强大的代码生成和智能体能力,该模型在各类智能体应用中表现出卓越的泛化性能。

文本生成、深度思考、多模态

Doubao Seed 2.0 Pro

Doubao Seed 2.0 是面向高频企业场景兼顾性能与成本的均衡型模型,综合能力超越上一代 Doubao Seed 1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作,支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。Doubao Seed 2.0 Pro 侧重长链路推理能力与复杂任务稳定性,适配真实业务中的复杂场景。

文本生成、深度思考、多模态

Qwen 3.5 Plus

Qwen 3.5 原生视觉语言系列 Plus 模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在多项任务评测中,3.5 系列均展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果在纯文本与多模态方面相较 3 系列均实现飞跃式进步。

文本生成、深度思考、多模态

Doubao Seed 2.0 Code

Doubao Seed 2.0 Code 面向真实编程环境优化的 Coding 模型,能稳定调用 Claude Code 等常见 IDE 中的工具。模型特别优化了前端能力,在使用常见的前端框架时能有良好表现。模型支持使用 Skills,可以配合多种自定义技能使用。Doubao Seed 2.0 Code 是Seed 2.0 的编程加强版,更适合 Agentic Coding。

代码补全、深度思考

GLM 5

GLM-5 是智谱的旗舰开源基础模型,专为复杂系统设计与长期智能体工作流打造。它面向专业开发者,在大规模编程任务中展现出生产级性能,与领先的闭源模型并驾齐驱。凭借高级智能体规划、深度后端推理与迭代自我修正能力,GLM-5 已超越代码生成,迈向全系统构建与自主执行。

文本生成、深度思考、代码补全

MiniMax M2.5

MiniMax-M2.5 是一款最先进的大语言模型,专为提升实际生产力而设计。通过在多样化的复杂真实数字工作环境中训练,M2.5 在 M2.1 编码专长的基础上扩展至通用办公领域,能够熟练生成和操作 Word、Excel、PowerPoint 文件,在不同软件环境间进行上下文切换,并与各类智能体及人类团队协同工作。M2.5 在 SWE-Bench Verified、Multi-SWE-Bench 和 BrowseComp 上分别取得 80.2%、51.3% 和 76.3% 的得分,同时相比前代模型具有更高的词元效率——这得益于其通过规划优化自身行动与输出的训练机制。

内容生成、 深度思考、代码补全

输入:¥ 0.003 / 千 tokens

输出:¥ 0.01 / 千 tokens

Qwen3 Max Thinking

Qwen3-Max-Thinking 是 Qwen3 系列中的旗舰推理模型,专为需要深度、多步推理的高难度认知任务而设计。通过大幅扩展模型容量与强化学习计算规模,该模型在事实准确性、复杂推理、指令遵循、人类偏好对齐及智能体行为方面均取得了显著提升。

文本生成、深度思考

Qwen3 Coder Next

Qwen3-Coder-Next 是一款开放权重的自回归(因果)语言模型,针对编程智能体与本地开发工作流进行了优化。它采用稀疏专家模型(Mixture-of-Experts,MoE)设计,总参数量为 80B(约 800 亿),但每个 token 仅激活 3B(约 30 亿)参数,能够提供与那些每次激活计算量高 10 到 20 倍的模型相当的性能,因此非常适合对成本敏感且需要常驻运行的智能体部署。 模型在训练中强调代理能力(agentic focus),在长时程的编码任务、复杂工具调用以及从执行失败中恢复方面具有可靠表现。模型原生支持 256k 的上下文窗口,能够无缝集成到真实世界的命令行(CLI)和集成开发环境(IDE)中,并能很好地适配现代编码工具常用的代理框架。该模型仅在非“思考”模式(non-thinking mode)下运行,不会输出 `<think>` 块,从而简化了在生产级编码智能体中的集成。

文本生成、深度思考、代码补全

输入:¥ 0.0015 / 千 tokens

输出:¥ 0.009 / 千 tokens

最受关注模型

DeepSeek V4 Pro

文本生成、深度思考

DeepSeek V4 Flash

文本生成、深度思考

Qwen 3.6 Plus

文本生成、深度思考、视觉理解

XiaoMi MiMo V2.5 Pro

文本生成、深度思考

Tencent Hunyuan Hy3 Preview

文本生成、深度思考

Kimi K2.6

文本生成、深度思考、工具调用

Qwen3.7 Max

文本生成、深度思考

XiaoMi MiMo V2.5

文本生成、深度思考

DeepSeek OCR 2

图片识别、OCR

Doubao Seed 2.0 Lite

文本生成、深度思考、多模态

Embedding Models

GLM Embedding 3

文本向量化

Qwen3 Embedding 8B

文本嵌入、文本向量化

Doubao Embedding Large Text 250515

文本向量化

Qwen Text Embedding V4

文本向量化

Qwen Text Embedding V1

文本向量化

Qwen Text Embedding V2

文本向量化

Doubao Embedding Large

文本向量化

Doubao Embedding

文本向量化

Qwen Text Embedding V3

文本向量化

Hunyuan Embedding

文本向量化