筛选
模型列表
共 151 个模型
Qwen3 8B
Qwen3-8B 是 Qwen3 系列中的密集型 82 亿参数因果语言模型,专为高强度推理任务与高效对话场景打造。该模型支持在数学运算、编程及逻辑推理所需的"思维"模式与通用对话的"非思维"模式间无缝切换,经过精细调优可胜任指令跟随、智能体集成、创意写作以及覆盖 100 多种语言和方言的多语言应用。此模型原生支持 32K token 的上下文窗口。
文本生成
输入:¥ 0.0005 / 千 tokens
输出:¥ 0.004 / 千 tokens
豆包 1.5 UI TARS
UI-TARS 是一款原生面向图形界面交互(GUI)的Agent模型。通过感知、推理和行动等类人的能力,与 GUI 进行无缝交互。
GUI Agent 模型、图形界面交互、图片理解
输入:¥ 0.00375 / 千 tokens
输出:¥ 0.0125 / 千 tokens
ERNIE 4.5 Turbo 32K
文本创作、知识问答等能力提升显著。输出长度及整句时延相较ERNIE 4.5有所增加。
文本生成
输入:¥ 0.0009 / 千 tokens
输出:¥ 0.0035 / 千 tokens
ERNIE 4.5 Turbo VL 32K
图片理解、创作、翻译、代码等能力显著提升,首次支持32K上下文长度,首Token时延显著降低。
图片理解
输入:¥ 0.0035 / 千 tokens
输出:¥ 0.01 / 千 tokens
ERNIE X1 Turbo 32K
文心大模型X1具备更强的理解、规划、反思、进化能力。作为能力更全面的深度思考模型,文心X1兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。
深度思考、文本生成
输入:¥ 0.0012 / 千 tokens
输出:¥ 0.0045 / 千 tokens
Hunyuan-Turbos-Vision 视觉大模型
此模型适用于图文理解场景,是基于混元最新 turbos 的新一代视觉语言旗舰大模型,聚焦图文理解相关任务,包括基于图片的实体识别、知识问答、文案创作、拍照解题等方面,相比前一代模型全面提升。
图片理解
输入:¥ 0.0035 / 千 tokens
输出:¥ 0.01015 / 千 tokens
Qwen2.5 VL 32B Instruct
Qwen2.5-VL-32B 是一款通过强化学习微调的多模态视觉语言模型,其数学推理能力、结构化输出和视觉问题解决能力显著增强。该模型在视觉分析任务中表现卓越,包括图像中的物体识别、文本解析以及长视频中的精确事件定位。在 MMMU、MathVista 和 VideoMME 等多模态基准测试中展现出顶尖性能,同时在 MMLU 文本理解、数学问题求解和代码生成等基于文本的任务中保持强大的推理能力与输出清晰度。
图片理解
输入:¥ 0.0025 / 千 tokens
输出:¥ 0.0075 / 千 tokens
通义千问-Plus-Character
通义千问系列角色扮演模型,本模型是动态更新版本,模型更新会提前通知,适合拟人化的角色扮演,同时优化了限定人设指令遵循、话题推进、倾听共情等能力,支持个性化角色的深度还原。
文本生成、角色扮演
输入:¥ 0.001 / 千 tokens
输出:¥ 0.00225 / 千 tokens
Qwen-Long
Qwen-Long是在通义千问针对超长上下文处理场景的大语言模型,支持中文、英文等不同语言输入,支持最长1000万tokens(约1500万字或1.5万页文档)的超长上下文对话。
文本生成
输入:¥ 0.00055 / 千 tokens
输出:¥ 0.00225 / 千 tokens
QwQ 32B
QwQ 是 Qwen 系列的推理模型。相较于传统的指令微调模型,具备思维与推理能力的 QwQ 能在下游任务(尤其是难题处理)中实现显著增强的性能表现。QwQ-32B 作为中等参数规模的推理模型,能够与 DeepSeek-R1、o1-mini 等顶尖推理模型实现竞争性的性能表现。
文本生成
输入:¥ 0.00195 / 千 tokens
输出:¥ 0.00555 / 千 tokens
Qwen2.5 VL 72B Instruct
指令跟随、数学、解题、代码整体提升,万物识别能力提升,支持多样格式直接精准定位视觉元素,支持对长视频文件(最长10分钟)进行理解和秒级别的事件时刻定位,能理解时间先后和快慢,基于解析和定位能力支持操控OS或Mobile的Agent,关键信息抽取能力和Json格式输出能力强,此版本为72B版本,本系列能力最强的版本。
图片识别
输入:¥ 0.00375 / 千 tokens
输出:¥ 0.00975 / 千 tokens
腾讯 Hunyuan-large
Hunyuan-large 模型总参数量约 389B,激活参数量约 52B,是当前业界参数规模最大、效果最好的 Transformer 架构的开源 MoE 模型。
文本生成
输入:¥ 0.0045 / 千 tokens
输出:¥ 0.0135 / 千 tokens
DeepSeek R1 Distill Qwen 32B
DeepSeek R1 Distill Qwen 32B 是基于 Qwen 2.5 32B 蒸馏得到的大语言模型,其训练使用了 DeepSeek R1 的输出数据。模型在多项基准测试中超越 OpenAI 的 o1-mini,创造了密集模型的最新性能纪录。模型通过深度融合 DeepSeek R1 的输出进行精调,实现了与更大规模前沿模型相媲美的竞争性能。
文本生成
输入:¥ 0.00375 / 千 tokens
输出:¥ 0.00375 / 千 tokens
豆包 1.5 Lite 32k
Doubao-1.5-lite,全新一代轻量版模型,极致响应速度,效果与时延均达到全球一流水平。支持32k上下文窗口,输出长度支持最大 12k tokens。
文本生成
输入:¥ 0.00035 / 千 tokens
输出:¥ 0.0007 / 千 tokens
Doubao 1.5 Pro 32k
Doubao-1.5-pro-32k,全新一代主力模型,性能全面升级,在知识、代码、推理、等方面表现卓越。支持32k上下文窗口,输出长度支持最大 12k tokens。
文本生成
输入:¥ 0.001 / 千 tokens
输出:¥ 0.0025 / 千 tokens
Doubao 1.5 Vision Pro 32k
Doubao 1.5 Vision Pro 是全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。
图片识别
输入:¥ 0.0032 / 千 tokens
输出:¥ 0.0093 / 千 tokens
Qwen3 VL Flash
Qwen3 VL Flash 是 Qwen3 系列小尺寸视觉理解模型,实现思考模式和非思考模式的有效融合,效果优于开源版 Qwen3-VL-30B-A3B,响应速度快。全面升级图像/视频理解,支持长视频长文档等超长上下文、空间感知与万物识别;具备视觉 2D/3D 定位能力,胜任复杂现实任务。
视觉识别、深度思考
QwQ 32B Preview
QwQ 模型是由 Qwen 团队开发的实验性研究模型,专注于增强 AI 推理能力。
文本生成
输入:¥ 0.0022 / 千 tokens
输出:¥ 0.0063 / 千 tokens
Qwen Coder Plus
Qwen Coder Plus 是通义千问系列代码及编程模型是专门用于编程和代码生成的语言模型,性能出色,效果突出。
文本生成
输入:¥ 0.0036 / 千 tokens
输出:¥ 0.0072 / 千 tokens