筛选
模型列表
共 151 个模型
Qwen3 Coder Plus
Qwen3 Coder Plus 是基于 Qwen3 的代码生成模型,具有强大的 Coding Agent 能力,擅长工具调用和环境交互,能够实现自主编程、代码能力卓越的同时兼具通用能力。
文本生成、代码补全
通义千问 Qwen3 Max
Qwen3 Max 是通义千问 3 系列 Max 模型,相较 preview 版本在智能体编程与工具调用方向进行了专项升级。本次发布的正式版模型达到领域 SOTA 水平,适配场景更加复杂的智能体需求。
文本生成、深度思考
Tongyi DeepResearch 30B A3B
通义深度研究(Tongyi DeepResearch)是由通义实验室开发的智能体大型语言模型,总参数量达300亿但每词元仅激活30亿参数。该模型专为长周期深度信息检索任务优化,在Humanity's Last Exam、BrowserComp、BrowserComp-ZH、WebWalkerQA、GAIA、xbench-DeepSearch及FRAMES等基准测试中均达到顶尖水平。相较于先前模型,它在复杂智能搜索、推理和多步骤问题解决方面表现更为卓越。模型采用全自动合成数据管道,支持可扩展的预训练、微调与强化学习。通过对多样化智能体数据进行大规模持续预训练,持续增强推理能力并保持知识新鲜度。其特色包括端到端同策略强化学习框架,配备定制化的组相对策略优化机制——包含词元级梯度计算与负样本过滤技术以确保训练稳定性。模型支持ReAct框架进行核心能力验证,并提供基于迭代研究(IterResearch)的"重型"模式,通过测试时扩展实现极致性能。特别适用于高级研究智能体、工具调用及复杂推理工作流场景。
文本生成、深度研究
输入:¥ 0.00125 / 千 tokens
输出:¥ 0.0055 / 千 tokens
Qwen3 Next 80B A3B Instruct
Qwen3-Next-80B-A3B-Instruct 是 Qwen3-Next 系列中经过指令微调的对话模型,专为快速稳定的响应而优化,不输出"思维"轨迹。该模型面向推理、代码生成、知识问答和多语言应用等复杂任务,同时在对齐能力和格式规范性方面保持稳健表现。相较此前 Qwen3 指令微调版本,其重点提升了超长输入和多轮对话下的吞吐量与稳定性,特别适合需要最终答案一致性而非显式思维链的 RAG、工具调用及智能体工作流程。该模型采用扩展高效训练与解码技术,显著提升参数效率与推理速度,并在广泛公开基准测试中验证了其性能——在多个类别达到或接近更大规模 Qwen3 系统的水平,同时超越早先的中等规模基线模型。作为通用助手、编程协作者和长上下文任务处理工具,它最适用于生产环境中需要确定性指令跟随输出的场景。
文本生成
输入:¥ 0.00175 / 千 tokens
输出:¥ 0.0175 / 千 tokens
Qwen3 Next 80B A3B Thinking
Qwen3-Next-80B-A3B-Thining 是 Qwen3-Next 系列中优先推理的对话模型,默认输出结构化的"思维"轨迹。该模型专为复杂多步骤问题设计,涵盖数学证明、代码合成/调试、逻辑推理和智能体规划等领域,在知识理解、推理能力、编程实践、对齐性能及多语言评估中均表现卓越。相比此前Qwen3系列版本,该模型显著提升了长链思维下的稳定性与推理时的高效扩展性,经过调优后能够遵循复杂指令,同时减少重复性或偏离任务的行为。该模型适用于智能体框架与工具调用(函数调用)、高频率检索的工作流程,以及需要分步解决方案的标准化基准测试。它支持生成长篇详细的内容完成结果,并采用面向吞吐量的技术(如多令牌预测)以加速生成过程。需注意该模型仅运行在纯思维模式下。
文本生成、深度思考
输入:¥ 0.00175 / 千 tokens
输出:¥ 0.0175 / 千 tokens
通义千问 Qwen VL Plus
通义千问VL-Plus(qwen-vl-plus),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能。
图片理解
输入:¥ 0.001 / 千 tokens
输出:¥ 0.00225 / 千 tokens
Kimi K2 0905
Kimi K2 0905 是Kimi K2 0711的九月更新版。该模型由月之暗面(Moonshot AI)研发,是采用专家混合架构(MoE)的超大规模语言模型,总参数量达万亿规模,前向推理激活参数量为 320 亿。其上下文窗口长度从之前的 128K 扩展至 256K tokens,支持长上下文推理。本次更新显著提升了智能体编码能力,在各类编程框架中展现出更高准确性和更强泛化能力;同时增强了前端编程表现,能为网页、3D等任务生成兼具美学价值与功能性的代码。Kimi K2 专门针对智能体能力进行优化,涵盖高级工具使用、复杂推理和代码合成三大核心领域,在编程(LiveCodeBench、SWE-bench)、推理(ZebraLogic、GPQA)和工具使用(Tau2、AceBench)等基准测试中均表现卓越。该模型采用创新训练框架,集成MuonClip优化器,确保超大规模MoE模型的稳定训练。
文本生成
输入:¥ 0.00625 / 千 tokens
输出:¥ 0.025 / 千 tokens
Baidu ERNIE 4.5 Turbo 128K
文心 4.5 Turbo 在去幻觉、逻辑推理和代码能力等方面也有着明显增强。模型能力均衡,支持 128K 上下文长度,可以很好满足多轮长历史对话处理、长文档理解问答任务。
文本生成
输入:¥ 0.001 / 千 tokens
输出:¥ 0.0035 / 千 tokens
Qwen3 30B A3B Thinking 2507
Qwen3-30B-A3B-Thinking-2507 是一款拥有300亿参数的专家混合推理模型,专门针对需要多步骤深度思考的复杂任务进行优化。该模型专为"思维模式"设计,其核心特性是将内部推理过程与最终答案分离。相较于早期发布的 Qwen3-30B 版本,本模型在逻辑推理、数理科学、编程开发及多语言基准测试方面均实现性能提升,同时展现出更强的指令遵循能力、工具使用能力以及与人类价值观的对齐能力。凭借更高的推理效率和扩展的输出容量,该模型特别适用于前沿学术研究、竞技级问题求解,以及需要结构化长上下文推理的智能体应用场景。
文本生成
输入:¥ 0.00125 / 千 tokens
输出:¥ 0.00375 / 千 tokens
DeepSeek V3.1
DeepSeek V3.1 是一个大型混合推理模型(6710 亿参数,其中 370 亿为活跃参数),通过提示模板支持带“thinking”(思考)和非思考两种模式。DeepSeek V3.1 在 V3 的基础上进行了扩展,采用双阶段长上下文训练流程,最大支持 128 K tokens,并使用 FP8 微缩放以提高推理效率。模型可以通过 `"reasoning": {"enabled": true}` 参数来控制推理行为。 DeepSeek V3.1 改进了工具使用、代码生成和推理效率,在一些基准测试上可达到与 DeepSeek R1 相当的性能,同时响应更快。DeepSeek V3.1 支持结构化工具调用、代码代理与搜索代理,适用于科研、编写代码和智能体工作流。
文本生成
输入:¥ 0.0035 / 千 tokens
输出:¥ 0.0125 / 千 tokens
DeepSeek V3.1
DeepSeek-V3.1 是深度求索全新推出的混合推理模型,支持思考与非思考2种推理模式,较 DeepSeek-R1-0528 思考效率更高。经 Post-Training 优化,Agent 工具使用与智能体任务表现大幅提升。支持 128k 上下文窗口,输出长度支持最大 64k tokens。
文本生成
输入:¥ 0.0021 / 千 tokens
输出:¥ 0.0079 / 千 tokens
Qwen VL Max
通义千问 VL Max(qwen-vl-max),即通义千问超大规模视觉语言模型。相比增强版,Qwen VL Max 再次提升视觉推理能力和指令遵循能力,提供更高的视觉感知和认知水平,在更多复杂任务上提供最佳的性能。
图片理解、视频理解
输入:¥ 0.00175 / 千 tokens
输出:¥ 0.00425 / 千 tokens
Doubao Seed 1.6 Vision
Doubao-Seed-1.6-vision,适用于视频理解、Grounding、GUI Agent 等高复杂度的场景。与 Doubao-1.5-thinking-vision-pro 相比,在教育、图像审核、巡检与安防和 AI 搜索问答等场景下展现出更强的通用多模态理解和推理能力。
视觉识别、深度思考
Qwen Flash
Qwen Flash 是 Qwen3 系列 Flash 模型,实现思考模式和非思考模式的有效融合,可在对话中切换模式。复杂推理类任务性能优秀,指令遵循、文本理解等能力显著提高。支持 1M 上下文长度,按照上下文长度进行阶梯计费。
文本生成、深度思考
Qwen3 Coder Flash
Qwen3 Coder Flash 是基于 Qwen3 的代码生成模型,继承 Qwen3 Coder Plus 的 coding agent 能力,支持多轮工具交互,重点优化仓库级别理解能力并增加工具调用稳定性。
文本生成、代码补全
Qwen3 Coder 30B A3B Instruct
Qwen3-Coder-30B-A3B-Instruct是一款拥有305亿参数的混合专家(MoE)模型,采用128个专家组件(每次前向传播激活8个),专为高级代码生成、仓库级代码理解与智能体工具调用而设计。该模型基于Qwen3架构构建,原生支持256K token的上下文长度(可通过Yarn扩展至100万token),在函数调用、浏览器操作和结构化代码补全等任务中表现卓越。
代码生成
输入:¥ 0.00125 / 千 tokens
输出:¥ 0.00375 / 千 tokens
Qwen3 30B A3B Instruct 2507
Qwen3-30B-A3B-Instruct-2507是千问团队开发的305亿参数专家混合语言模型,每次推理仅激活33亿参数。该模型采用非思考模式运行,专注于高质量指令遵循、多语言理解和代理工具使用能力。经过指令数据后训练后,在推理(AIME、斑马逻辑)、编程(MultiPL-E、LiveCodeBench)和对齐(IFEval、写作评测)等基准测试中展现出卓越性能。该模型在主观开放任务上显著优于非指令微调版本,同时保持了强劲的事实问答和代码生成能力。
文本生成
输入:¥ 0.0008 / 千 tokens
输出:¥ 0.0032 / 千 tokens
Qwen3 235B A22B Thinking 2507
Qwen3-235B-A22B-Thinking-2507 是一款高性能开放权重专家混合模型(MoE),专为复杂推理任务优化。该模型在前向推理过程中激活2350亿总参数中的220亿参数,原生支持高达262,144个token的上下文长度。此"纯思考"变体增强了结构化逻辑推理、数理科学及长文本生成能力,在AIME、SuperGPQA、LiveCodeBench和MMLU-Redux等基准测试中表现卓越。该模型经过指令微调,在逐步推理、工具使用、智能体工作流和多语言任务方面表现突出。此次发布的版本是Qwen3-235B系列中能力最强的开源变体,在结构化推理用例中超越诸多闭源模型。
文本生成
输入:¥ 0.00275 / 千 tokens
输出:¥ 0.0095 / 千 tokens
GLM 4.5
GLM-4.5 是智谱团队最新推出的旗舰级基础模型,专为智能体应用打造。GLM-4.5 模型采用专家混合架构(MoE),支持高达 128K tokens 的上下文长度,在推理能力、代码生成和智能体对齐方面实现显著提升。GLM-4.5 提供双模式混合推理:专为复杂推理和工具使用设计的"思考模式",以及针对即时响应优化的"非思考模式"。模型可以通过 `"reasoning": {"enabled": true}` 参数来控制推理行为。
文本生成
输入:¥ 0.0055 / 千 tokens
输出:¥ 0.02 / 千 tokens