筛选
模型列表
共 151 个模型
Step 3.5 Flash
Step 3.5 Flash 是阶跃星辰目前最强大的开源基座模型。它专为极致效率而生,具备前沿的推理能力和卓越的智能体(Agent)性能。该模型基于稀疏混合专家(MoE)架构,拥有 1960 亿参数,但处理每个 Token 时仅需选择性激活 110 亿参数。这种极高的“智能密度”使其推理深度足以媲美顶级闭源模型,同时兼顾了实时交互所需的敏捷响应速度。
文本生成、代码补全、深度思考
输入:¥ 0.0012 / 千 tokens
输出:¥ 0.0035 / 千 tokens
Kimi K2.5
Kimi K2.5 是月之暗面(Moonshot AI)自主研发的多模态模型,具备顶尖的视觉编码能力与自主智能体集群范式。该模型基于 Kimi K2 架构,通过对约 15 万亿视觉与文本混合 Token 进行持续预训练,在通用推理、视觉编码及智能体工具调用方面表现卓越。
文本生成、视觉识别、深度思考、多模态
输入:¥ 0.0055 / 千 tokens
输出:¥ 0.029 / 千 tokens
MiniMax M2-her
MiniMax M2-her是一款以对话为核心的大型语言模型,专为沉浸式角色扮演、人物驱动型聊天以及富有表现力的多轮对话而打造。该模型设计上注重保持语调与个性的言行一致性,支持丰富的消息角色类型(如用户系统、群组、示例用户消息、示例AI消息),并能通过示例对话学习,从而更好地匹配用户场景的风格与节奏。对于追求自然流畅的对话节奏和生动交互体验的故事叙述、虚拟伙伴及对话式应用场景而言,它是理想的选择。
文本生成、角色扮演
输入:¥ 0.00375 / 千 tokens
输出:¥ 0.015 / 千 tokens
Baidu ERNIE 5.0 Thinking Preview
文心新一代模型文心5.0是原生全模态大模型,采用原生的全模态统一建模技术,将文本、图像、音频、视频联合建模,具备综合的全模态能力。文心5.0基础能力全面升级,基准测试集表现出色,多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等表现尤其出色。
深度思考、多模态
GLM 4.7 Flash
作为具备300亿参数规模的先进模型,GLM-4.7-Flash在性能与效率之间实现了新的平衡。该模型进一步针对智能编程场景进行优化,增强了代码生成、长程任务规划及工具协作能力,在多项主流公开基准测试中均取得同规模开源模型的领先表现,为追求高效能计算的应用提供了卓越选择。
文本生成、深度思考
输入:¥ 0.00125 / 千 tokens
输出:¥ 0.0055 / 千 tokens
Qwen Flash Character
Qwen Flash Character 是通义千问系列多语言角色扮演模型,本模型是动态更新版本,模型更新会提前通知,适合拟人化的角色扮演,同时优化了限定人设指令遵循、话题推进、倾听共情等能力,支持个性化角色的深度还原。
文本生成、角色扮演
输入:¥ 0.00027 / 千 tokens
输出:¥ 0.00175 / 千 tokens
Doubao Seed 1.8
Doubao-Seed-1.8 面向多模态 Agent 场景定向优化。Agent 能力上,Tool Use、复杂指令遵循等能力均大幅增强。多模态理解方面,视觉基础能力显著提升,可低帧率理解超长视频,视频运动理解、复杂空间理解及文档结构化解析能力也有所优化,还原生支持智能上下文管理,用户可配置上下文策略。
多模态、深度思考
GLM 4.7
GLM-4.7是智谱推出的最新旗舰级模型,主要在两大方面实现升级:增强的编程能力与更稳定的多步骤推理与执行。该模型在执行复杂智能体任务时展现出显著提升,同时能够提供更为自然的对话体验和出色的前端美学。
文本生成、深度思考
输入:¥ 0.005 / 千 tokens
输出:¥ 0.02 / 千 tokens
MiniMax M2.1
MiniMax-M2.1 是一款轻量级、尖端的大型语言模型,专门针对编码、智能体工作流和现代应用开发进行了优化。尽管仅拥有100亿激活参数,它在实际应用中实现了能力的大幅跃升,同时保持了卓越的低延迟、高扩展性和出色的成本效益。 相比前代模型,M2.1 能够生成更清晰、更简洁的输出结果,并具备更快的感知响应速度。它在主流系统和应用语言中展现出领先的多语言编码性能——在 Multi-SWE-Bench 基准测试中达到 49.4%,在 SWE-Bench Multilingual 中取得 72.5% 的优异成绩。该模型可作为集成开发环境、编程工具及通用助手中的多功能智能“大脑”。 为确保模型性能不受影响,MiniMax 强烈建议在各轮对话间保持推理过程的连贯性。
文本生成、深度思考
输入:¥ 0.00375 / 千 tokens
输出:¥ 0.015 / 千 tokens
Qwen3 VL Plus
Qwen3 系列视觉理解模型,实现思考模式和非思考模式的有效融合,视觉智能体能力在 OS World 等公开测试集上达到世界顶尖水平。此版本在视觉 Coding、空间感知、多模态思考等方向全面升级;视觉感知与识别能力大幅提升,支持超长视频理解。
图片识别、视觉理解、深度思考
通义千问 QwQ Plus
通义千问 QwQ 推理模型增强版,基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、livecodebench)以及部分通用指标(IFEval、LiveBench等)达到 DeepSeek-R1 水平。
文本生成、深度思考
输入:¥ 0.00175 / 千 tokens
输出:¥ 0.0045 / 千 tokens
Tencent Hunyuan Vision 1.5 Instruct
Tencent HY Vision 1.5 Instruct 是基于混元最新 turbos 的新一代视觉语言旗舰大模型,在图文理解相关的任务上,包括基于图片的实体识别、知识问答、文案创作、拍照解题等上面相比前一代模型全面提升。
视觉识别
输入:¥ 0.0031 / 千 tokens
输出:¥ 0.0091 / 千 tokens
MiMo V2 Flash
MiMo-V2-Flash 是小米研发的开源基础语言模型。这是一款采用混合注意力架构的混合专家模型,总参数量达 3090 亿,其中激活参数为 150 亿。MiMo-V2-Flash 支持混合思维开关及 25.6 万上下文窗口,在推理、代码生成和智能体应用场景中表现优异。在 SWE-bench Verified 和 SWE-bench Multilingual 基准测试中,该模型位列全球开源模型榜首,性能可比肩 Claude Sonnet 4.5,但成本仅为后者的约 3.5%。
文本生成、深度思考
输入:¥ 0.0012 / 千 tokens
输出:¥ 0.0032 / 千 tokens
GLM 4.6V
GLM-4.6V是一款大型多模态模型,专注于实现高保真视觉理解及针对图像、文档与混合媒体的长上下文推理能力。该模型支持高达128K token的上下文长度,能直接处理复杂页面布局与图表等视觉输入,并集成原生多模态函数调用功能,将感知系统与下游工具执行无缝衔接。此外,模型支持图文交错生成与界面重构工作流,包括截图转HTML合成及迭代式视觉编辑等应用场景。
图片识别、深度思考
输入:¥ 0.00375 / 千 tokens
输出:¥ 0.0115 / 千 tokens
DeepSeek V3.2
DeepSeek-V3.2 是一款大型语言模型,致力于实现高计算效率与强大的推理及智能体工具使用性能的平衡。它引入了**深度求索稀疏注意力(DSA)**机制,这是一种细粒度的稀疏注意力架构,可在保证长上下文处理质量的同时显著降低训练与推理成本。通过可扩展的强化学习训练后优化框架,模型推理能力得到进一步增强,其报告性能已达到GPT-5级别,并在2025年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)中斩获金牌。DeepSeek V3.2 同样采用大规模智能体任务合成训练流程,能够更有效地将推理能力与工具使用场景相结合,从而提升在交互环境中的指令遵循与泛化能力。
文本生成
输入:¥ 0.00235 / 千 tokens
输出:¥ 0.00355 / 千 tokens
Hunyuan 2.0 instruct 20251111
HY 2.0 采用混合专家(MoE)架构,总参数 406B,激活参数 32B,支持 256K 上下文窗口,推理能力与效率居国内顶尖行列,且在文本创作与复杂指令遵循等实用场景上表现突出。相比上一版本(Hunyuan-T1-20250822)模型, HY 2.0 Think 显著改进了预训练数据和强化学习策略,在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化性大幅提升。
文本生成
输入:¥ 0.0009 / 千 tokens
输出:¥ 0.0021 / 千 tokens
Hunyuan 2.0 thinking 20251109
HY 2.0 采用混合专家(MoE)架构,总参数 406B,激活参数 32B,推理能力与效率居国内顶尖行列,且在文本创作与复杂指令遵循等实用场景上表现突出。相比上一版本(Hunyuan-T1-20250822)模型, HY 2.0 Think 显著改进了预训练数据和强化学习策略,在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化性大幅提升。Hunyuan 2.0 Think 是 Hunyuan 2.0 Instruct 的深度思考版本。
文本生成、深度思考
输入:¥ 0.0011 / 千 tokens
输出:¥ 0.0041 / 千 tokens
DeepSeek V3.2 Speciale
DeepSeek-V3.2-Speciale 是 DeepSeek-V3.2 的高性能计算变体,专为最大化推理与智能体性能而优化。该模型基于 DeepSeek 稀疏注意力(DSA)架构,实现了高效的长上下文处理,并通过大规模训练后强化学习进一步突破基础模型的能力边界。根据公布的评估结果,Speciale 在复杂推理任务上表现超越 GPT-5,其综合能力可与 Gemini-3.0-Pro 相媲美,同时在代码生成与工具调用方面保持卓越的可靠性。与 DeepSeek V3.2 相同,Speciale 模型受益于大规模智能体任务合成训练流程,显著提升了在交互环境中的指令遵循与泛化能力。
文本生成、深度思考
输入:¥ 0.00215 / 千 tokens
输出:¥ 0.00325 / 千 tokens
Qwen MT Lite
Qwen MT Lite 是基于 Qwen3 全面升级的基础级文本翻译大模型,支持 32 个语种互译,模型性能和翻译效果全面升级,并提供更稳定的术语定制、格式还原度、领域提示能力,让译文更精准、自然。
文本生成、文本翻译
输入:¥ 0.00065 / 千 tokens
输出:¥ 0.00175 / 千 tokens