筛选
模型列表
共 151 个模型
GLM 5.2
GLM-5.2 是智谱面向长程任务时代的旗舰模型。凭借真正可用的 100 万 tokens 上下文窗口,它能够处理项目级工程上下文,更可靠地执行长时间运行的任务,更一致地遵循工程标准,并在单个任务中完成从需求到多平台部署的完整开发工作流。
深度思考、长任务能力
输入:¥ 0.009 / 千 tokens
输出:¥ 0.03 / 千 tokens
Kimi K2.7 Code
Kimi K2.7 Code 是一款基于 Kimi K2.6 构建、专注于编码的智能体模型。它在真实世界的长周期编码任务上实现了显著改进,增强了跨复杂软件工程工作流的端到端任务完成能力,同时提升了 token 效率,与 Kimi K2.6 相比,思考 token 的使用量减少了约 30%。
代码补全、编程工具
输入:¥ 0.007 / 千 tokens
输出:¥ 0.028 / 千 tokens
Qwen3.7 Plus
Qwen3.7 Plus 是 Qwen3.7 系列中高性价比 Plus 模型,在强大文本能力的基础上全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。其核心特色为多模态交互混合智能体能力,能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用。
文本生成、深度思考、视觉理解
MiniMax M3
MiniMax M3 凭借业界领先的 Coding 与 Agentic 能力、1M 超长上下文窗口以及原生多模态特性,可出色胜任企业级长文档理解、高质量内容生成、代码编写、Bug 修复及原生应用构建等任务;强大的 Agentic 能力端到端贯通工作流,原生多模态更带来流畅自然的图文混合交互体验。
文本生成、深度思考、专业能力
输入:¥ 0.005 / 千 tokens
输出:¥ 0.019 / 千 tokens
Qwen3.7 Max
Qwen3.7 Max 是 Qwen3.7 系列中规模最大、综合能力最强的 Max 模型,当前开放纯文本模型能力供体验。Qwen3.7 是面向智能体时代的新一代旗舰模型,核心优势在于智能体能力的广度与深度:在编程、办公与生产力、长周期自主执行方面均能出色胜任各项任务。
文本生成、深度思考
输入:¥ 0.0129 / 千 tokens
输出:¥ 0.0385 / 千 tokens
Doubao Seed 2.0 Mini
Doubao Seed 2.0 是面向高频企业场景兼顾性能与成本的均衡型模型,综合能力超越上一代 Doubao Seed 1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作,支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。Doubao Seed 2.0 Mini 面向低时延、高并发与成本敏感场景,强调快速响应与灵活推理部署,支持四档位思考与多模态理解能力。
文本生成、深度思考、多模态
Doubao Seed 2.0 Lite
Doubao Seed 2.0 是面向高频企业场景兼顾性能与成本的均衡型模型,综合能力超越上一代 Doubao-Seed-1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作,支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。Doubao Seed 2.0 Lite 兼顾生成质量与响应速度,适合作为通用生产级模型。
文本生成、深度思考、多模态
XiaoMi MiMo V2.5
MiMo V2.5 是一款原生全模态模型,具备强大的智能体能力,在统一架构内支持文本、图像、视频和音频理解。此模型基于 MiMo-V2-Flash 主干网络构建,并扩展了专用的视觉和音频编码器,在多模态感知、长上下文推理以及智能体工作流方面表现出色。MiMo V2.5 总计在约 48T 的 Tokens 上完成训练。
文本生成、深度思考
XiaoMi MiMo V2.5 Pro
MiMo V2.5 Pro 是一个开源的混合专家(MoE)语言模型,总参数量为 1.02T,激活参数量为 42B。模型采用了 MiMo-V2-Flash 中引入的混合注意力架构和 3 层多令牌预测(MTP),支持高达 1M tokens 的上下文长度。MiMo V2.5 Pro 是小米迄今为止能力最强的模型,专为要求最苛刻的智能体、复杂软件工程和长周期任务而设计。它能够在 1M tokens 的上下文窗口中,维持跨越数千次工具调用的复杂执行轨迹,并具备强大的指令遵循能力和连贯性。
文本生成、深度思考
DeepSeek V4 Pro
DeepSeek V4 Pro 是 DeepSeek V4 系列的两款强大的专家混合(Mixture-of-Experts, MoE)语言模型之一,性能比肩顶级闭源模型,Agent 能力大幅提高,且具有丰富的世界知识和世界顶级推理性能,在数学、STEM、竞赛型代码的测评中,DeepSeek V4 Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。
文本生成、深度思考
输入:¥ 0.0032 / 千 tokens
输出:¥ 0.0065 / 千 tokens
DeepSeek V4 Flash
DeepSeek V4 Flash 是 DeepSeek V4 系列的两款强大的专家混合(Mixture-of-Experts, MoE)语言模型之一,拥有 284B 参数(13B 激活参数),支持 100 万 Tokens(1M Tokens)的上下文长度,支持非思考模式与思考模式。在 Agent 测评中,DeepSeek-V4-Flash 在简单任务上与 Pro 版本旗鼓相当,但在高难度任务上仍有差距。
文本生成、深度思考
输入:¥ 0.00105 / 千 tokens
输出:¥ 0.0021 / 千 tokens
Qwen3.6 27B
Qwen3.6 27B 是 Qwen3.6 系列原生视觉语言 Dense 模型,模型效果相较 Qwen3.5 27B 重点提升了 Agentic Coding 能力、模型 STEM 与推理能力进一步增强;视觉模态方面在空间智能、物体定位与检测能力上显著增强,视频理解、文档 OCR 及视觉 Agent 能力稳步提升。
文本生成、深度思考、视觉识别
输入:¥ 0.0032 / 千 tokens
输出:¥ 0.0195 / 千 tokens
Tencent Hunyuan Hy3 Preview
Hunyuan Hy3 preview 面向 Agent 工作负载设计,采用 295B/21B 激活的 MoE 架构。在同一个模型内提供 no_think(极速响应)、think_low(快速思考)、think_high(深度推理)三档模式,适配从高频交互到复杂工程任务的不同延迟与深度需求。在 SWE-bench Verified 等代码基准上接近当前最强水平,256K 上下文支持跨文件代码重构与长文档分析。
文本生成、深度思考
Qwen3.6 Max Preview
Qwen3.6 Max Preview 是 Qwen3.6 系列中规模最大、综合能力最强的 Max 模型 Preview 版本,当前开放纯文本模型能力供体验。相较于此前发布的 Qwen3-Max 和 Qwen3.6-Plus ,本模型在 Vibe Coding 能力上进一步提升、Coding Agent 执行更加高效、前端编程开发能力显著提升,长尾知识能力进一步升级。
文本生成、深度思考
Kimi K2.6
Kimi K2.6 是月之暗面推出的新一代多模态模型,专为长程编码、编码驱动的 UI/UX 生成以及多智能体协同编排而设计。它能够处理跨越 Python、Rust 和 Go 语言的复杂端到端编码任务,并可将提示词与视觉输入转化为生产就绪的界面。其智能体集群架构可扩展至数百个并行子智能体,实现任务的自主拆解——单次运行即可交付文档、网站与电子表格,全程无需人工干预。
文本生成、深度思考、工具调用
输入:¥ 0.007 / 千 tokens
输出:¥ 0.029 / 千 tokens
GLM Embedding 3
Embedding 3 是智谱 AI 推出的第三代文本向量化模型,在前代基础上全面升级,提供更强的语义理解能力和更灵活的向量维度选择。该模型支持自定义向量维度,在保持高质量语义表示的同时,为不同应用场景提供了更优的性能和成本平衡。
文本向量化
输入:¥ 0.00055 / 千 tokens
输出:¥ 0 / 千 tokens
Qwen3.6 Flash
Qwen3.6 Flash 是 Qwen3.6 原生视觉语言系列 Flash 模型,模型效果相较 Qwen3.5 Flash 显著提升。本模型重点提升 Agentic Coding 能力(在多项代码智能体基准上大幅超越前代)、数学推理和代码推理能力;视觉方面在空间智能能力上显著增强,物体定位与目标检测提升尤为突出。
文本生成、深度思考、视觉识别
Qwen3.6 35B A3B
Qwen3.6 35B A3B 是 Qwen3.6 系列原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。Qwen3.6 35B A3B 模型效果相较 Qwen3.5 35B A3B 显著提升了 Agentic Coding 能力、数学推理和代码推理能力、空间智能能力、物体定位与目标检测能力。
文本生成、深度思考、视觉识别
输入:¥ 0.002 / 千 tokens
输出:¥ 0.0115 / 千 tokens
GLM 5.1
GLM-5.1 在编码能力上实现了重大飞跃,尤其在处理长周期任务方面提升显著。与此前基于分钟级交互构建的模型不同,GLM-5.1 可针对单一任务自主持续工作超过 8 小时,全程独立完成规划、执行与自我优化,最终交付完整的工程级成果。
文本生成、深度思考
Qwen 3.6 Plus
Qwen 3.6 原生视觉语言系列 Plus 模型,展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果相较 Qwen 3.5 系列显著提升。模型在 Agentic coding、前端编程、Vibe coding 等代码能力、多模态万物识别、OCR、物体定位等能力上显著增强。
文本生成、深度思考、视觉理解