模型列表

共 151 个模型

Qwen3 Coder Plus

Qwen3 Coder Plus 是基于 Qwen3 的代码生成模型，具有强大的 Coding Agent 能力，擅长工具调用和环境交互，能够实现自主编程、代码能力卓越的同时兼具通用能力。

文本生成、代码补全

2025-09-23

通义千问 Qwen3 Max

Qwen3 Max 是通义千问 3 系列 Max 模型，相较 preview 版本在智能体编程与工具调用方向进行了专项升级。本次发布的正式版模型达到领域 SOTA 水平，适配场景更加复杂的智能体需求。

文本生成、深度思考

2025-09-23

通义深度研究（Tongyi DeepResearch）是由通义实验室开发的智能体大型语言模型，总参数量达300亿但每词元仅激活30亿参数。该模型专为长周期深度信息检索任务优化，在Humanity's Last Exam、BrowserComp、BrowserComp-ZH、WebWalkerQA、GAIA、xbench-DeepSearch及FRAMES等基准测试中均达到顶尖水平。相较于先前模型，它在复杂智能搜索、推理和多步骤问题解决方面表现更为卓越。模型采用全自动合成数据管道，支持可扩展的预训练、微调与强化学习。通过对多样化智能体数据进行大规模持续预训练，持续增强推理能力并保持知识新鲜度。其特色包括端到端同策略强化学习框架，配备定制化的组相对策略优化机制——包含词元级梯度计算与负样本过滤技术以确保训练稳定性。模型支持ReAct框架进行核心能力验证，并提供基于迭代研究（IterResearch）的"重型"模式，通过测试时扩展实现极致性能。特别适用于高级研究智能体、工具调用及复杂推理工作流场景。

文本生成、深度研究

2025-09-19

输入：¥ 0.00125 / 千 tokens

输出：¥ 0.0055 / 千 tokens

Qwen3 Next 80B A3B Instruct

Qwen3-Next-80B-A3B-Instruct 是 Qwen3-Next 系列中经过指令微调的对话模型，专为快速稳定的响应而优化，不输出"思维"轨迹。该模型面向推理、代码生成、知识问答和多语言应用等复杂任务，同时在对齐能力和格式规范性方面保持稳健表现。相较此前 Qwen3 指令微调版本，其重点提升了超长输入和多轮对话下的吞吐量与稳定性，特别适合需要最终答案一致性而非显式思维链的 RAG、工具调用及智能体工作流程。该模型采用扩展高效训练与解码技术，显著提升参数效率与推理速度，并在广泛公开基准测试中验证了其性能——在多个类别达到或接近更大规模 Qwen3 系统的水平，同时超越早先的中等规模基线模型。作为通用助手、编程协作者和长上下文任务处理工具，它最适用于生产环境中需要确定性指令跟随输出的场景。

文本生成

2025-09-12

输入：¥ 0.00175 / 千 tokens

输出：¥ 0.0175 / 千 tokens

Qwen3 Next 80B A3B Thinking

Qwen3-Next-80B-A3B-Thining 是 Qwen3-Next 系列中优先推理的对话模型，默认输出结构化的"思维"轨迹。该模型专为复杂多步骤问题设计，涵盖数学证明、代码合成/调试、逻辑推理和智能体规划等领域，在知识理解、推理能力、编程实践、对齐性能及多语言评估中均表现卓越。相比此前Qwen3系列版本，该模型显著提升了长链思维下的稳定性与推理时的高效扩展性，经过调优后能够遵循复杂指令，同时减少重复性或偏离任务的行为。该模型适用于智能体框架与工具调用（函数调用）、高频率检索的工作流程，以及需要分步解决方案的标准化基准测试。它支持生成长篇详细的内容完成结果，并采用面向吞吐量的技术（如多令牌预测）以加速生成过程。需注意该模型仅运行在纯思维模式下。

文本生成、深度思考

2025-09-12

输入：¥ 0.00175 / 千 tokens

输出：¥ 0.0175 / 千 tokens

通义千问 Qwen VL Plus

通义千问VL-Plus（qwen-vl-plus），即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力，支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能。

图片理解

2025-09-08

输入：¥ 0.001 / 千 tokens

输出：¥ 0.00225 / 千 tokens

Kimi K2 0905

Kimi K2 0905 是Kimi K2 0711的九月更新版。该模型由月之暗面（Moonshot AI）研发，是采用专家混合架构（MoE）的超大规模语言模型，总参数量达万亿规模，前向推理激活参数量为 320 亿。其上下文窗口长度从之前的 128K 扩展至 256K tokens，支持长上下文推理。本次更新显著提升了智能体编码能力，在各类编程框架中展现出更高准确性和更强泛化能力；同时增强了前端编程表现，能为网页、3D等任务生成兼具美学价值与功能性的代码。Kimi K2 专门针对智能体能力进行优化，涵盖高级工具使用、复杂推理和代码合成三大核心领域，在编程（LiveCodeBench、SWE-bench）、推理（ZebraLogic、GPQA）和工具使用（Tau2、AceBench）等基准测试中均表现卓越。该模型采用创新训练框架，集成MuonClip优化器，确保超大规模MoE模型的稳定训练。

文本生成

2025-09-05

输入：¥ 0.00625 / 千 tokens

输出：¥ 0.025 / 千 tokens

Baidu ERNIE 4.5 Turbo 128K

文心 4.5 Turbo 在去幻觉、逻辑推理和代码能力等方面也有着明显增强。模型能力均衡，支持 128K 上下文长度，可以很好满足多轮长历史对话处理、长文档理解问答任务。

文本生成

2025-08-29

输入：¥ 0.001 / 千 tokens

输出：¥ 0.0035 / 千 tokens

Qwen3 30B A3B Thinking 2507

Qwen3-30B-A3B-Thinking-2507 是一款拥有300亿参数的专家混合推理模型，专门针对需要多步骤深度思考的复杂任务进行优化。该模型专为"思维模式"设计，其核心特性是将内部推理过程与最终答案分离。相较于早期发布的 Qwen3-30B 版本，本模型在逻辑推理、数理科学、编程开发及多语言基准测试方面均实现性能提升，同时展现出更强的指令遵循能力、工具使用能力以及与人类价值观的对齐能力。凭借更高的推理效率和扩展的输出容量，该模型特别适用于前沿学术研究、竞技级问题求解，以及需要结构化长上下文推理的智能体应用场景。

文本生成

2025-08-29

输入：¥ 0.00125 / 千 tokens

输出：¥ 0.00375 / 千 tokens

DeepSeek V3.1

DeepSeek V3.1 是一个大型混合推理模型（6710 亿参数，其中 370 亿为活跃参数），通过提示模板支持带“thinking”（思考）和非思考两种模式。DeepSeek V3.1 在 V3 的基础上进行了扩展，采用双阶段长上下文训练流程，最大支持 128 K tokens，并使用 FP8 微缩放以提高推理效率。模型可以通过 `"reasoning": {"enabled": true}` 参数来控制推理行为。 DeepSeek V3.1 改进了工具使用、代码生成和推理效率，在一些基准测试上可达到与 DeepSeek R1 相当的性能，同时响应更快。DeepSeek V3.1 支持结构化工具调用、代码代理与搜索代理，适用于科研、编写代码和智能体工作流。

文本生成

2025-08-24

输入：¥ 0.0035 / 千 tokens

输出：¥ 0.0125 / 千 tokens

DeepSeek V3.1

DeepSeek-V3.1 是深度求索全新推出的混合推理模型，支持思考与非思考2种推理模式，较 DeepSeek-R1-0528 思考效率更高。经 Post-Training 优化，Agent 工具使用与智能体任务表现大幅提升。支持 128k 上下文窗口，输出长度支持最大 64k tokens。

文本生成

2025-08-23

输入：¥ 0.0021 / 千 tokens

输出：¥ 0.0079 / 千 tokens

Qwen VL Max

通义千问 VL Max（qwen-vl-max），即通义千问超大规模视觉语言模型。相比增强版，Qwen VL Max 再次提升视觉推理能力和指令遵循能力，提供更高的视觉感知和认知水平，在更多复杂任务上提供最佳的性能。

图片理解、视频理解

2025-08-13

输入：¥ 0.00175 / 千 tokens

输出：¥ 0.00425 / 千 tokens

Doubao Seed 1.6 Vision

Doubao-Seed-1.6-vision，适用于视频理解、Grounding、GUI Agent 等高复杂度的场景。与 Doubao-1.5-thinking-vision-pro 相比，在教育、图像审核、巡检与安防和 AI 搜索问答等场景下展现出更强的通用多模态理解和推理能力。

视觉识别、深度思考

2025-08-05

Qwen Flash

Qwen Flash 是 Qwen3 系列 Flash 模型，实现思考模式和非思考模式的有效融合，可在对话中切换模式。复杂推理类任务性能优秀，指令遵循、文本理解等能力显著提高。支持 1M 上下文长度，按照上下文长度进行阶梯计费。

文本生成、深度思考

2025-08-05

Qwen3 Coder Flash

Qwen3 Coder Flash 是基于 Qwen3 的代码生成模型，继承 Qwen3 Coder Plus 的 coding agent 能力，支持多轮工具交互，重点优化仓库级别理解能力并增加工具调用稳定性。

文本生成、代码补全

2025-08-05

Qwen3 Coder 30B A3B Instruct

Qwen3-Coder-30B-A3B-Instruct是一款拥有305亿参数的混合专家（MoE）模型，采用128个专家组件（每次前向传播激活8个），专为高级代码生成、仓库级代码理解与智能体工具调用而设计。该模型基于Qwen3架构构建，原生支持256K token的上下文长度（可通过Yarn扩展至100万token），在函数调用、浏览器操作和结构化代码补全等任务中表现卓越。

代码生成

2025-08-03

输入：¥ 0.00125 / 千 tokens

输出：¥ 0.00375 / 千 tokens

Qwen3 30B A3B Instruct 2507

Qwen3-30B-A3B-Instruct-2507是千问团队开发的305亿参数专家混合语言模型，每次推理仅激活33亿参数。该模型采用非思考模式运行，专注于高质量指令遵循、多语言理解和代理工具使用能力。经过指令数据后训练后，在推理（AIME、斑马逻辑）、编程（MultiPL-E、LiveCodeBench）和对齐（IFEval、写作评测）等基准测试中展现出卓越性能。该模型在主观开放任务上显著优于非指令微调版本，同时保持了强劲的事实问答和代码生成能力。

文本生成

2025-08-01

输入：¥ 0.0008 / 千 tokens

输出：¥ 0.0032 / 千 tokens

通义千问 Qwen Plus 2025-07-28

通义千问超大规模语言模型的增强版，支持中文英文等不同语言输入。

文本生成

2025-07-28

Qwen3 235B A22B Thinking 2507

Qwen3-235B-A22B-Thinking-2507 是一款高性能开放权重专家混合模型（MoE），专为复杂推理任务优化。该模型在前向推理过程中激活2350亿总参数中的220亿参数，原生支持高达262,144个token的上下文长度。此"纯思考"变体增强了结构化逻辑推理、数理科学及长文本生成能力，在AIME、SuperGPQA、LiveCodeBench和MMLU-Redux等基准测试中表现卓越。该模型经过指令微调，在逐步推理、工具使用、智能体工作流和多语言任务方面表现突出。此次发布的版本是Qwen3-235B系列中能力最强的开源变体，在结构化推理用例中超越诸多闭源模型。

文本生成

2025-07-28

输入：¥ 0.00275 / 千 tokens

输出：¥ 0.0095 / 千 tokens

GLM 4.5

GLM-4.5 是智谱团队最新推出的旗舰级基础模型，专为智能体应用打造。GLM-4.5 模型采用专家混合架构（MoE），支持高达 128K tokens 的上下文长度，在推理能力、代码生成和智能体对齐方面实现显著提升。GLM-4.5 提供双模式混合推理：专为复杂推理和工具使用设计的"思考模式"，以及针对即时响应优化的"非思考模式"。模型可以通过 `"reasoning": {"enabled": true}` 参数来控制推理行为。

文本生成

2025-07-28

输入：¥ 0.0055 / 千 tokens

输出：¥ 0.02 / 千 tokens

最受关注模型

2026-04-24

Embedding Models

2026-04-20

筛选

模型列表

最受关注模型

DeepSeek V4 Pro

DeepSeek V4 Flash

Qwen 3.6 Plus

XiaoMi MiMo V2.5 Pro

Tencent Hunyuan Hy3 Preview

Kimi K2.6

Qwen3.7 Max

XiaoMi MiMo V2.5

DeepSeek OCR 2

Doubao Seed 2.0 Lite

Embedding Models

GLM Embedding 3

Qwen3 Embedding 8B

Doubao Embedding Large Text 250515

Qwen Text Embedding V4

Qwen Text Embedding V1

Qwen Text Embedding V2

Doubao Embedding Large

Doubao Embedding

Qwen Text Embedding V3

Hunyuan Embedding