模型列表

共 151 个模型

Step 3.5 Flash

Step 3.5 Flash 是阶跃星辰目前最强大的开源基座模型。它专为极致效率而生，具备前沿的推理能力和卓越的智能体（Agent）性能。该模型基于稀疏混合专家（MoE）架构，拥有 1960 亿参数，但处理每个 Token 时仅需选择性激活 110 亿参数。这种极高的“智能密度”使其推理深度足以媲美顶级闭源模型，同时兼顾了实时交互所需的敏捷响应速度。

文本生成、代码补全、深度思考

2026-01-30

输入：¥ 0.0012 / 千 tokens

输出：¥ 0.0035 / 千 tokens

Kimi K2.5

Kimi K2.5 是月之暗面（Moonshot AI）自主研发的多模态模型，具备顶尖的视觉编码能力与自主智能体集群范式。该模型基于 Kimi K2 架构，通过对约 15 万亿视觉与文本混合 Token 进行持续预训练，在通用推理、视觉编码及智能体工具调用方面表现卓越。

文本生成、视觉识别、深度思考、多模态

2026-01-28

输入：¥ 0.0055 / 千 tokens

输出：¥ 0.029 / 千 tokens

MiniMax M2-her是一款以对话为核心的大型语言模型，专为沉浸式角色扮演、人物驱动型聊天以及富有表现力的多轮对话而打造。该模型设计上注重保持语调与个性的言行一致性，支持丰富的消息角色类型（如用户系统、群组、示例用户消息、示例AI消息），并能通过示例对话学习，从而更好地匹配用户场景的风格与节奏。对于追求自然流畅的对话节奏和生动交互体验的故事叙述、虚拟伙伴及对话式应用场景而言，它是理想的选择。

文本生成、角色扮演

2026-01-24

输入：¥ 0.00375 / 千 tokens

输出：¥ 0.015 / 千 tokens

Baidu ERNIE 5.0 Thinking Preview

文心新一代模型文心5.0是原生全模态大模型，采用原生的全模态统一建模技术，将文本、图像、音频、视频联合建模，具备综合的全模态能力。文心5.0基础能力全面升级，基准测试集表现出色，多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等表现尤其出色。

深度思考、多模态

2026-01-22

GLM 4.7 Flash

作为具备300亿参数规模的先进模型，GLM-4.7-Flash在性能与效率之间实现了新的平衡。该模型进一步针对智能编程场景进行优化，增强了代码生成、长程任务规划及工具协作能力，在多项主流公开基准测试中均取得同规模开源模型的领先表现，为追求高效能计算的应用提供了卓越选择。

文本生成、深度思考

2026-01-20

输入：¥ 0.00125 / 千 tokens

输出：¥ 0.0055 / 千 tokens

Qwen Flash Character

Qwen Flash Character 是通义千问系列多语言角色扮演模型，本模型是动态更新版本，模型更新会提前通知，适合拟人化的角色扮演，同时优化了限定人设指令遵循、话题推进、倾听共情等能力，支持个性化角色的深度还原。

文本生成、角色扮演

2026-01-13

输入：¥ 0.00027 / 千 tokens

输出：¥ 0.00175 / 千 tokens

Doubao Seed 1.8

Doubao-Seed-1.8 面向多模态 Agent 场景定向优化。Agent 能力上，Tool Use、复杂指令遵循等能力均大幅增强。多模态理解方面，视觉基础能力显著提升，可低帧率理解超长视频，视频运动理解、复杂空间理解及文档结构化解析能力也有所优化，还原生支持智能上下文管理，用户可配置上下文策略。

多模态、深度思考

2026-01-05

GLM 4.7

GLM-4.7是智谱推出的最新旗舰级模型，主要在两大方面实现升级：增强的编程能力与更稳定的多步骤推理与执行。该模型在执行复杂智能体任务时展现出显著提升，同时能够提供更为自然的对话体验和出色的前端美学。

文本生成、深度思考

2025-12-23

输入：¥ 0.005 / 千 tokens

输出：¥ 0.02 / 千 tokens

MiniMax M2.1

MiniMax-M2.1 是一款轻量级、尖端的大型语言模型，专门针对编码、智能体工作流和现代应用开发进行了优化。尽管仅拥有100亿激活参数，它在实际应用中实现了能力的大幅跃升，同时保持了卓越的低延迟、高扩展性和出色的成本效益。相比前代模型，M2.1 能够生成更清晰、更简洁的输出结果，并具备更快的感知响应速度。它在主流系统和应用语言中展现出领先的多语言编码性能——在 Multi-SWE-Bench 基准测试中达到 49.4%，在 SWE-Bench Multilingual 中取得 72.5% 的优异成绩。该模型可作为集成开发环境、编程工具及通用助手中的多功能智能“大脑”。为确保模型性能不受影响，MiniMax 强烈建议在各轮对话间保持推理过程的连贯性。

文本生成、深度思考

2025-12-23

输入：¥ 0.00375 / 千 tokens

输出：¥ 0.015 / 千 tokens

Qwen3 VL Plus

Qwen3 系列视觉理解模型，实现思考模式和非思考模式的有效融合，视觉智能体能力在 OS World 等公开测试集上达到世界顶尖水平。此版本在视觉 Coding、空间感知、多模态思考等方向全面升级；视觉感知与识别能力大幅提升，支持超长视频理解。

图片识别、视觉理解、深度思考

2025-12-19

通义千问 QwQ Plus

通义千问 QwQ 推理模型增强版，基于 Qwen2.5 模型训练的 QwQ 推理模型，通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标（AIME 24/25、livecodebench）以及部分通用指标（IFEval、LiveBench等）达到 DeepSeek-R1 水平。

文本生成、深度思考

2025-12-18

输入：¥ 0.00175 / 千 tokens

输出：¥ 0.0045 / 千 tokens

Tencent Hunyuan Vision 1.5 Instruct

Tencent HY Vision 1.5 Instruct 是基于混元最新 turbos 的新一代视觉语言旗舰大模型，在图文理解相关的任务上，包括基于图片的实体识别、知识问答、文案创作、拍照解题等上面相比前一代模型全面提升。

视觉识别

2025-12-18

输入：¥ 0.0031 / 千 tokens

输出：¥ 0.0091 / 千 tokens

MiMo V2 Flash

MiMo-V2-Flash 是小米研发的开源基础语言模型。这是一款采用混合注意力架构的混合专家模型，总参数量达 3090 亿，其中激活参数为 150 亿。MiMo-V2-Flash 支持混合思维开关及 25.6 万上下文窗口，在推理、代码生成和智能体应用场景中表现优异。在 SWE-bench Verified 和 SWE-bench Multilingual 基准测试中，该模型位列全球开源模型榜首，性能可比肩 Claude Sonnet 4.5，但成本仅为后者的约 3.5%。

文本生成、深度思考

2025-12-15

输入：¥ 0.0012 / 千 tokens

输出：¥ 0.0032 / 千 tokens

GLM 4.6V

GLM-4.6V是一款大型多模态模型，专注于实现高保真视觉理解及针对图像、文档与混合媒体的长上下文推理能力。该模型支持高达128K token的上下文长度，能直接处理复杂页面布局与图表等视觉输入，并集成原生多模态函数调用功能，将感知系统与下游工具执行无缝衔接。此外，模型支持图文交错生成与界面重构工作流，包括截图转HTML合成及迭代式视觉编辑等应用场景。

图片识别、深度思考

2025-12-09

输入：¥ 0.00375 / 千 tokens

输出：¥ 0.0115 / 千 tokens

DeepSeek V3.2

DeepSeek-V3.2 是一款大型语言模型，致力于实现高计算效率与强大的推理及智能体工具使用性能的平衡。它引入了**深度求索稀疏注意力（DSA）**机制，这是一种细粒度的稀疏注意力架构，可在保证长上下文处理质量的同时显著降低训练与推理成本。通过可扩展的强化学习训练后优化框架，模型推理能力得到进一步增强，其报告性能已达到GPT-5级别，并在2025年国际数学奥林匹克（IMO）和国际信息学奥林匹克（IOI）中斩获金牌。DeepSeek V3.2 同样采用大规模智能体任务合成训练流程，能够更有效地将推理能力与工具使用场景相结合，从而提升在交互环境中的指令遵循与泛化能力。

文本生成

2025-12-02

输入：¥ 0.00235 / 千 tokens

输出：¥ 0.00355 / 千 tokens

Hunyuan 2.0 instruct 20251111

HY 2.0 采用混合专家（MoE）架构，总参数 406B，激活参数 32B，支持 256K 上下文窗口，推理能力与效率居国内顶尖行列，且在文本创作与复杂指令遵循等实用场景上表现突出。相比上一版本（Hunyuan-T1-20250822）模型， HY 2.0 Think 显著改进了预训练数据和强化学习策略，在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队，泛化性大幅提升。

文本生成

2025-12-01

输入：¥ 0.0009 / 千 tokens

输出：¥ 0.0021 / 千 tokens

Hunyuan 2.0 thinking 20251109

HY 2.0 采用混合专家（MoE）架构，总参数 406B，激活参数 32B，推理能力与效率居国内顶尖行列，且在文本创作与复杂指令遵循等实用场景上表现突出。相比上一版本（Hunyuan-T1-20250822）模型， HY 2.0 Think 显著改进了预训练数据和强化学习策略，在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队，泛化性大幅提升。Hunyuan 2.0 Think 是 Hunyuan 2.0 Instruct 的深度思考版本。

文本生成、深度思考

2025-12-01

输入：¥ 0.0011 / 千 tokens

输出：¥ 0.0041 / 千 tokens

通义千问 Qwen Plus

通义千问超大规模语言模型的增强版，支持中文英文等不同语言输入。

文本生成

2025-12-01

DeepSeek V3.2 Speciale

DeepSeek-V3.2-Speciale 是 DeepSeek-V3.2 的高性能计算变体，专为最大化推理与智能体性能而优化。该模型基于 DeepSeek 稀疏注意力（DSA）架构，实现了高效的长上下文处理，并通过大规模训练后强化学习进一步突破基础模型的能力边界。根据公布的评估结果，Speciale 在复杂推理任务上表现超越 GPT-5，其综合能力可与 Gemini-3.0-Pro 相媲美，同时在代码生成与工具调用方面保持卓越的可靠性。与 DeepSeek V3.2 相同，Speciale 模型受益于大规模智能体任务合成训练流程，显著提升了在交互环境中的指令遵循与泛化能力。

文本生成、深度思考

2025-12-01

输入：¥ 0.00215 / 千 tokens

输出：¥ 0.00325 / 千 tokens

Qwen MT Lite

Qwen MT Lite 是基于 Qwen3 全面升级的基础级文本翻译大模型，支持 32 个语种互译，模型性能和翻译效果全面升级，并提供更稳定的术语定制、格式还原度、领域提示能力，让译文更精准、自然。

文本生成、文本翻译

2025-11-20

输入：¥ 0.00065 / 千 tokens

输出：¥ 0.00175 / 千 tokens

最受关注模型

2026-04-24

Embedding Models

2026-04-20

筛选

模型列表

最受关注模型

DeepSeek V4 Pro

DeepSeek V4 Flash

Qwen 3.6 Plus

XiaoMi MiMo V2.5 Pro

Tencent Hunyuan Hy3 Preview

Kimi K2.6

Qwen3.7 Max

XiaoMi MiMo V2.5

DeepSeek OCR 2

Doubao Seed 2.0 Lite

Embedding Models

GLM Embedding 3

Qwen3 Embedding 8B

Doubao Embedding Large Text 250515

Qwen Text Embedding V4

Qwen Text Embedding V1

Qwen Text Embedding V2

Doubao Embedding Large

Doubao Embedding

Qwen Text Embedding V3

Hunyuan Embedding