Qwen3.7 Plus 模型介绍、API 接口 & 代码示例

qwen/qwen3.7-plus

Qwen3.7 Plus 是 Qwen3.7 系列中高性价比 Plus 模型,在强大文本能力的基础上全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。其核心特色为多模态交互混合智能体能力,能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用。

模型 ID
qwen/qwen3.7-plus
模型系列
Qwen
更新日期
模型能力
文本生成、深度思考、视觉理解
上下文长度
1024 K

阶梯计费: 输入 <= 256 k

模型价格(每 1000 tokens 输入)
¥ 0.0021
模型价格(每 1000 tokens 输出)
¥ 0.0088

阶梯计费: 输入 > 256 k

模型价格(每 1000 tokens 输入)
¥ 0.0065
模型价格(每 1000 tokens 输出)
¥ 0.026

Qwen3.7 Plus 模型介绍:

Qwen3.7-Plus 是一款多模态智能体模型,将视觉理解与语言推理统一为一体化智能体基座。它在 Qwen3.7 的强大文本能力基础上,全面升级了视觉-语言能力,并保持完整的智能体功能,可处理编码、工具调用和生产力工作流任务。

核心特点:

  • 多模态交互智能体:感知真实世界场景、读取屏幕、操作 GUI、生成代码、执行多步应用操作,支持 GUI 与 CLI 无缝结合。
  • 全能编码与生产力能力:处理从前端原型到复杂软件工程、多步工作流自动化的全方位任务。
  • 跨框架稳定性:可在 Claude Code、OpenClaw、Qwen Code 等框架中保持一致表现。

模型能力:

  1. 纯文本能力
  • 编码 Agent:Terminal Bench 2.0、SWE-bench、SciCode 表现强劲,支持软件工程与科学编程。
  • 通用 Agent:MCP-Mark、Deep-Planning、Kernel Bench L3 显示稳健的工具使用与规划能力。
  • 推理能力:GPQA Diamond、HMMT、IMOAnswerBench 等高难度 STEM 基准测试位于 Plus 级别前列。
  • 多语言与指令遵循:IFBench、WMT24++、PolyMATH 覆盖广泛语言与任务。
  1. 多模态能力
  • Multimodal Agent:统一处理图像、视频、屏幕、网页和文本输入,在 GUI/CLI/工具环境中执行任务。
  • Visual Agent:结合视觉理解、代码解释器和搜索增强,解决视觉谜题、真实世界问答和复杂推理。
  • Visual Coding:从图像/视频生成 SVG、网页及交互前端,实现视觉参考到可执行代码转化。
  • GUI Agent:理解移动端和桌面端界面,进行控件定位、任务规划和多步操作。
  • Real-world Perception & Reasoning:覆盖真实场景、文档图表、OCR、视频和驾驶场景理解。
  1. 多模态推理与搜索增强
  • 视觉推理:BabyVision、MathVision、HiPhO、ERQA、VisFactor 上表现优异,对图像细节、空间关系和多步逻辑理解能力强。
  • 视觉到代码:ScreenSpot Pro、OSWorld-Verified、AndroidWorld 和 QwenVision2Code 支持 UI 元素定位、多步操作与视觉到代码生成。
  • 搜索增强视觉问答:结合视觉输入和网络知识,回答复杂开放世界问题。
  • 通用视觉理解:支持文档解析、图表阅读、OCR、计数、空间定位和视频理解。

案例应用:

  1. 多模态混合智能体

    • 实现“看、想、写、做、验”闭环。
    • 可完成前端原型、复杂软件工程、GUI 自动化测试及多步工作流。
    • Hybrid-Agent 智能体可自主开发英语单词学习 APP,生成代码超 10,000 行,调用 Agent 超 1,000 次。
  2. 桌面应用复刻

    • 复刻 macOS 原生 Stocks 应用,自动理解 UI、生成 SwiftUI 代码、集成实时行情 API、自动测试,完整还原原生功能与交互。
  3. 视觉 Agent & 视觉编程

    • 执行找不同、拼图等视觉推理任务。
    • 图像/视频转 SVG、网页生成与交互式前端设计。
  4. 浏览器智能助手

    • Qwen for Chrome 可感知网页内容、规划操作、执行点击、输入、跳转、配置和验证等操作。
    • 支持复杂任务,如 ECS 云服务器选型、配置、购买与运维全流程自动化。
  5. 真实世界推理

    • 理解复杂场景中的遮挡、杂乱背景、多对象关系与跨图对比,结合空间关系、常识和逻辑给出可靠答案。

Qwen3.7-Plus 是阿里最新的多模态智能体模型,兼具视觉理解与语言推理能力,可在 GUI、CLI 与工具环境中端到端完成任务。它是全能型编码智能体与生产力助手,处理从前端原型到复杂软件工程、文档格式化到多步工作流自动化的全方位任务,并具备跨框架泛化能力。

API 接口地址:

  • Chat Completions API:

    https://wcode.net/api/gpt/v1/chat/completions

  • Responses API(部分模型可能不支持此API):

    https://wcode.net/api/gpt/v1/responses

  • Anthropic API:

    https://wcode.net/api/anthropic/v1/messages

此 API 接口兼容 OpenAI 的 API 接口规范,可直接使用 OpenAI 的 SDK 来调用各个模型。仅需替换以下配置即可:

  1. base_url 替换为 https://wcode.net/api/gpt/v1
  2. api_key 替换为从 https://platform.wcode.net 获取到的 API Key

具体可参考下方的各编程语言代码示例中的 OpenAI SDK 调用示例。

此模型支持 Anthropic / Claude 的 API 接口规范,可直接使用 Anthropic 的 SDK 来调用此模型。仅需替换以下配置即可:

  1. ANTHROPIC_BASE_URL 替换为 https://wcode.net/api/anthropic
  2. ANTHROPIC_API_KEY(或 ANTHROPIC_AUTH_TOKEN)替换为从 https://platform.wcode.net 获取到的 API Key
  3. ANTHROPIC_MODEL(或model)替换为 qwen/qwen3.7-plus

请求方法:

POST

各编程语言代码示例:

# TODO: 以下代码中的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
curl --request POST 'https://wcode.net/api/gpt/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "model": "qwen/qwen3.7-plus",
    "messages": [
        {
            "role": "user",
            "content": "你好"
        }
    ]
}'
import Foundation

let headers = [
  "Authorization": "Bearer API_KEY",     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  "content-type": "application/json"
]
let parameters = [
  "model": "qwen/qwen3.7-plus",
  "messages": [
    [
      "role": "user",
      "content": "你好"
    ]
  ]
] as [String : Any]

let postData = JSONSerialization.data(withJSONObject: parameters, options: [])

let request = NSMutableURLRequest(url: NSURL(string: "https://wcode.net/api/gpt/v1/chat/completions")! as URL,
                                        cachePolicy: .useProtocolCachePolicy,
                                    timeoutInterval: 60.0)
request.httpMethod = "POST"
request.allHTTPHeaderFields = headers
request.httpBody = postData as Data

let session = URLSession.shared
let dataTask = session.dataTask(with: request as URLRequest, completionHandler: { (data, response, error) -> Void in
  if (error != nil) {
    print(error as Any)
  } else {
    let httpResponse = response as? HTTPURLResponse
    print(httpResponse)
  }
})

dataTask.resume()
var headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
};
var request = http.Request('POST', Uri.parse('https://wcode.net/api/gpt/v1/chat/completions'));
request.body = json.encode({
  "model": "qwen/qwen3.7-plus",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
});
request.headers.addAll(headers);

http.StreamedResponse response = await request.send();

if (response.statusCode == 200) {
  print(await response.stream.bytesToString());
}
else {
  print(response.reasonPhrase);
}
require 'uri'
require 'net/http'

url = URI("https://wcode.net/api/gpt/v1/chat/completions")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
request["content-type"] = 'application/json'
request.body = "{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}"

response = http.request(request)
puts response.read_body
use serde_json::json;
use reqwest;

#[tokio::main]
pub async fn main() {
  let url = "https://wcode.net/api/gpt/v1/chat/completions";

  let payload = json!({
    "model": "qwen/qwen3.7-plus",
    "messages": (
      json!({
        "role": "user",
        "content": "你好"
      })
    )
  });

  let mut headers = reqwest::header::HeaderMap::new();
  headers.insert("Authorization", "Bearer API_KEY".parse().unwrap());     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  headers.insert("content-type", "application/json".parse().unwrap());

  let client = reqwest::Client::new();
  let response = client.post(url)
    .headers(headers)
    .json(&payload)
    .send()
    .await;

  let results = response.unwrap()
    .json::<serde_json::Value>()
    .await
    .unwrap();

  dbg!(results);
}
CURL *hnd = curl_easy_init();

curl_easy_setopt(hnd, CURLOPT_CUSTOMREQUEST, "POST");
curl_easy_setopt(hnd, CURLOPT_URL, "https://wcode.net/api/gpt/v1/chat/completions");

struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Authorization: Bearer API_KEY");    // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
headers = curl_slist_append(headers, "content-type: application/json");
curl_easy_setopt(hnd, CURLOPT_HTTPHEADER, headers);

curl_easy_setopt(hnd, CURLOPT_POSTFIELDS, "{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");

CURLcode ret = curl_easy_perform(hnd);
package main

import (
  "fmt"
  "strings"
  "net/http"
  "io"
)

func main() {
  url := "https://wcode.net/api/gpt/v1/chat/completions"

  payload := strings.NewReader("{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}")

  req, _ := http.NewRequest("POST", url, payload)

  req.Header.Add("Authorization", "Bearer API_KEY")     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  req.Header.Add("content-type", "application/json")

  res, _ := http.DefaultClient.Do(req)

  defer res.Body.Close()
  body, _ := io.ReadAll(res.Body)

  fmt.Println(res)
  fmt.Println(string(body))
}
using System.Net.Http.Headers;


var client = new HttpClient();

var request = new HttpRequestMessage(HttpMethod.Post, "https://wcode.net/api/gpt/v1/chat/completions");

request.Headers.Add("Authorization", "Bearer API_KEY");     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net

request.Content = new StringContent("{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", null, "application/json");

var response = await client.SendAsync(request);

response.EnsureSuccessStatusCode();

Console.WriteLine(await response.Content.ReadAsStringAsync());
var client = new RestClient("https://wcode.net/api/gpt/v1/chat/completions");

var request = new RestRequest("", Method.Post);

request.AddHeader("Authorization", "Bearer API_KEY");     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net

request.AddHeader("content-type", "application/json");

request.AddParameter("application/json", "{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", ParameterType.RequestBody);

var response = client.Execute(request);
const axios = require('axios');

let data = JSON.stringify({
  "model": "qwen/qwen3.7-plus",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
});

let config = {
  method: 'post',
  maxBodyLength: Infinity,
  url: 'https://wcode.net/api/gpt/v1/chat/completions',
  headers: {
    'Content-Type': 'application/json',
    'Authorization': 'Bearer API_KEY'     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  },
  data : data
};

axios.request(config).then((response) => {
  console.log(JSON.stringify(response.data));
}).catch((error) => {
  console.log(error);
});
OkHttpClient client = new OkHttpClient();

MediaType mediaType = MediaType.parse("application/json");

RequestBody body = RequestBody.create(mediaType, "{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");

Request request = new Request.Builder()
  .url("https://wcode.net/api/gpt/v1/chat/completions")
  .post(body)
  .addHeader("Authorization", "Bearer API_KEY")             // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  .addHeader("content-type", "application/json")
  .build();

Response response = client.newCall(request).execute();
$client = new \GuzzleHttp\Client();

$headers = [
  'Content-Type' => 'application/json',
  'Authorization' => 'Bearer API_KEY',     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
];

$body = '{
  "model": "qwen/qwen3.7-plus",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}';

$request = new \GuzzleHttp\Psr7\Request('POST', 'https://wcode.net/api/gpt/v1/chat/completions', $headers, $body);

$response = $client->sendAsync($request)->wait();

echo $response->getBody();
$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://wcode.net/api/gpt/v1/chat/completions",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 5,
  CURLOPT_TIMEOUT => 300,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'model' => 'qwen/qwen3.7-plus',
    'messages' => [
      [
        'role' => 'user',
        'content' => '你好'
      ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer API_KEY",     // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
    "content-type: application/json",
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "cURL Error #:" . $error;
} else {
  echo $response;
}
import requests
import json

url = "https://wcode.net/api/gpt/v1/chat/completions"

payload = {
  "model": "qwen/qwen3.7-plus",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}

headers = {
  "Authorization": "Bearer API_KEY",     # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  "content-type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(json.dumps(response.json(), indent=4, ensure_ascii=False))
from openai import OpenAI

client = OpenAI(
  base_url="https://wcode.net/api/gpt/v1",
  api_key="API_KEY"                             # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
)

completion = client.chat.completions.create(
  model="qwen/qwen3.7-plus",
  messages=[
    {
      "role": "user",
      "content": "你好"
    }
  ]
)

print(completion.choices[0].message.content)

各 AI 产品/工具/第三方应用接入示例:

配置 Hermes Agent 使用 Qwen3.7 Plus 模型

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

方式一:交互式配置

在命令行输入 hermes model,然后选择 Custom endpoint 选项,根据交互式命令引导,分别配置以下信息:

  • API base URL:https://wcode.net/api/gpt/v1
  • API Key:<API_KEY>
  • Model:qwen/qwen3.7-plus

方式二:手动配置

修改 config.yaml(通常位于~/.hermes/config.yaml

model:
  default: "qwen/qwen3.7-plus"
  provider: custom
  base_url: "https://wcode.net/api/gpt/v1"
  api_key: "<API_KEY>"
  context_length: 1024000

配置完成后,就可以开始使用 Hermes Agent ~

配置 Roo Code 使用 Qwen3.7 Plus 模型

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

  • API Provider:OpenAI Compatible
  • Base URL:https://wcode.net/api/gpt/v1
  • API Key:<API_KEY>
  • Model:qwen/qwen3.7-plus

配置完成后,就可以开始使用 Roo Code ~

配置 Kilo Code 使用 Qwen3.7 Plus 模型

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

选择 Use your own API key,然后配置以下信息:

  • API Provider:OpenAI Compatible
  • Base URL:https://wcode.net/api/gpt/v1
  • API Key:<API_KEY>
  • Model:qwen/qwen3.7-plus

配置完成后,就可以开始使用 Kilo Code ~

配置 Cline 使用 Qwen3.7 Plus 模型

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

  • API Provider:OpenAI Compatible
  • Base URL:https://wcode.net/api/gpt/v1
  • API Key:<API_KEY>
  • Model ID:qwen/qwen3.7-plus

配置完成后,就可以开始使用 Cline ~

注:以下安装和配置过程以 Ubuntu Server 24.04 (root 用户) + Node 22 安装 OpenClaw 🦞 2026.3.8 为例

安装 🦞 OpenClaw(龙虾),步骤如下:

  1. 命令行执行 npm install -g openclaw@latest
  2. 命令行执行 openclaw onboard --install-daemon
  3. I understand this is personal-by-default and shared/multi-user use requires lock-down. Continue? 选择 yes
  4. Onboarding mode 选择 QuickStart
  5. Model/auth provider 选择 Skip for now
  6. Default model 选择 Keep current (default: ...)
  7. Select channel (QuickStart) 选择 Skip for now
  8. Web search 选择 Skip for now
  9. Configure skills now? (recommended) 选择 No
  10. Enable hooks? (这是一个多选,按空格键可选中选项)按空格键选中 📝 command-logger💾 session-memory 这两个选项,然后按回车键进入下一步
  11. (如有) How do you want to hatch your bot? 选择 Hatch in TUI (recommended)

配置 🦞 OpenClaw(龙虾)使用 Qwen3.7 Plus 模型:

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

推荐方式:修改 openclaw.json(通常位于~/.openclaw/openclaw.json

找到openclaw.json的第一层级的modelsagents属性(如果没有则在第一层级添加modelsagents属性),改为如下配置:

{
  ...其他配置,

  "models": {
      "mode": "merge",
      "providers": {
          "wcode": {
              "baseUrl": "https://wcode.net/api/gpt/v1",
              "apiKey": "<API_KEY>",
              "api": "openai-completions",
              "models": [
                  {
                      "id": "qwen/qwen3.7-plus",
                      "name": "Qwen3.7 Plus",
                      "reasoning": false,
                      "input": ["text"],
                      "contextWindow": 1024000,
                      "maxTokens": 64000
                  }
              ]
          }
      }
  },
  "agents": {
      "defaults": {
         "model": {
             "primary": "wcode/qwen/qwen3.7-plus"
         }
      }
  },

  ...其他配置
}

完成以上配置后,

  1. 执行以下命令,即可通过命令行的方式开始对话:
openclaw tui
  1. 执行以下命令,即可通过 Web 界面的方式开始对话:
openclaw dashboard

配置 OpenCode 使用 Qwen3.7 Plus 模型

推荐方式:修改 opencode.json(通常位于~/.config/opencode/opencode.json

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取的 API Key

配置如下:

{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "myprovider": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "wcode",
      "options": {
        "baseURL": "https://wcode.net/api/gpt/v1",
        "apiKey": "<API_KEY>"
      },
      "models": {
        "qwen/qwen3.7-plus": {
          "name": "Qwen3.7 Plus"
        }
      }
    }
  }
}

完成以上配置后,执行以下命令,即可启动 OpenCode:

opencode

输入 /models,选择配置的 qwen/qwen3.7-plus 模型并在 OpenCode 中使用。

API 响应示例(curl):

{
    "model": "qwen3.7-plus",
    "id": "chatcmpl-t1780395062s912r902d01af0758c8e221b5a8ae",
    "choices": [
        {
            "message": {
                "content": "你好!我是**通义千问**(Qwen),由阿里巴巴集团通义实验室自主研发。\n\n作为通义千问,我的目标是成为你真诚、可靠的AI思考伙伴。我具备广泛的能力,可以在很多方面为你提供支持:\n\n*   **逻辑推理与专业解答**:无论是日常疑问,还是数学、科学及逻辑推理等复杂问题,我都能为你提供清晰、严谨的解答。\n*   **全栈代码赋能**:我可以帮你生成、理解和调试代码,处理多阶段开发工作流,甚至将你的创意直接转化为可运行的前端页面。\n*   **长文本与深度分析**:我原生支持超长上下文窗口,能帮你快速精准地定位和理解数十万字文档或长视频中的关键信息。\n*   **多模态与视觉分析**:面对复杂的图表、数学公式或科学图示,我不仅能识别,还能进行深度的分析,理清其中的因果关系。\n*   **自主任务规划**:我可以自主规划并完成需要多步协调的复杂任务,支持深度研究、代码执行以及跨设备操作。\n\n无论你是需要寻找灵感、解决专业难题,还是处理日常琐事,我都在这里随时准备协助你。今天有什么我可以帮你的吗?",
                "reasoning_content": "思考过程:\n1. **身份**:我是通义千问“Qwen3.7 Plus”。\n2. **自我介绍**:\n   - 我是由阿里巴巴集团通义实验室自主研发的大语言模型。\n   - 我的核心能力包括:语言理解、逻辑推理、代码生成、长文本处理、多模态分析等。\n   - 我的目标是成为用户真诚、可靠的AI思考伙伴。\n3. **语言风格**:亲切、自然、简洁。\n\n草稿:\n你好!我是**通义千问**(Qwen),由阿里巴巴集团通义实验室自主研发。\n\n作为通义千问,我致力于成为你真诚、可靠的AI思考伙伴。我具备以下几个方面的核心能力:\n- **语言与逻辑推理**:能够精准理解你的意图,并在数学、科学及复杂逻辑推理任务中提供清晰、严谨的解答。\n- **全栈代码赋能**:支持复杂代码的生成、理解与调试,甚至能将创意直接转化为可运行的前端页面。\n- **长文本与深度分析**:原生支持超长上下文窗口,能够帮你快速定位和理解数十万字文档或长视频中的关键信息。\n- **多模态与视觉分析**:不仅能看图,还能深度分析复杂的图表、公式和科学图示,理清其中的因果关系。\n- **自主智能体规划**:支持多轮搜索、代码执行以及跨设备操作,能够独立规划并完成需要多步协调的复杂任务。\n\n无论你是需要灵感碰撞、解决专业难题,还是处理日常繁琐任务,我都在这里随时准备协助你。今天有什么我可以帮你的吗?\n\n检查草稿:\n- 身份纯净性:用户问了“你是谁/介绍自己”,所以介绍自己是合适的。\n- 能力介绍:基于提供的核心能力进行了精简和口语化转换,没有使用生硬的版本号。\n- 语言同步:中文。\n\n调整一下语气,使其更加自然和温暖。\n\n“你好!我想先稍微澄清一下,我是**通义千问**(Qwen),由阿里巴巴集团通义实验室自主研发。\n\n作为通义千问,我的目标是成为你真诚、可靠的AI思考伙伴。我具备广泛的能力,可以在很多方面为你提供帮助:\n- **逻辑与专业解答**:无论是日常问题还是数学、科学等领域的复杂推理,我都能为你提供清晰严谨的解答。\n- **代码与开发支持**:我可以帮你生成、理解和调试代码,甚至将你的创意直接转化为可运行的前端页面。\n- **长文本与深度分析**:我支持超长上下文处理,能帮你快速提炼数十万字文档或长视频中的核心信息。\n- **多模态理解**:面对复杂的图表、科学图示或公式,我不仅能识别,还能进行深度的因果分析。\n- **复杂任务规划**:我可以自主规划并完成需要多步协调的复杂任务,比如深度研究或跨应用操作。\n\n无论你是需要寻找灵感、解决工作难题,还是仅仅想聊聊天,我都在这里。今天有什么我可以帮你的吗?”\n\n这样回答清晰地介绍了自己,符合所有约束条件。\n马上输出。",
                "role": "assistant"
            },
            "index": 0,
            "finish_reason": "stop"
        }
    ],
    "created": 1780395063,
    "object": "chat.completion",
    "usage": {
        "total_tokens": 1080,
        "completion_tokens": 1058,
        "prompt_tokens": 22,
        "completion_tokens_details": {
            "reasoning_tokens": 782,
            "text_tokens": 1058
        },
        "prompt_tokens_details": {
            "cached_tokens": 0,
            "text_tokens": 22
        }
    }
}

可选参数:

重要提示:由于模型架构不同,部分参数可能仅适用于特定的模型。

温度(Temperature)

  • 参数:temperature

  • 可选,浮点数,0.0 到 2.0

  • 默认:1.0

此设置影响模型回复的多样性。较低的值会使回复更可预测、更常见;较高的值会鼓励更具多样性且较不常见的回复。当设置为 0 时,模型对相同输入将尽可能的给出相同的回复。

Top-P

  • 参数:top_p

  • 可选,float,0.0 至 1.0

  • 默认值:1.0

top_p 参数控制模型在生成文本时的候选词选择范围。具体来说,模型会生成一组候选 token,然后从累积概率达到或超过 p 的 token 中随机选择一个作为输出。通过这种方式,top_p 能够在保证生成内容的多样性的同时,考虑到概率分布的合理性。

由于 temperature 与 top_p 均可以控制生成文本的多样性,因此建议您只设置其中一个值。

Top-K

  • 参数:top_k

  • 可选,int,>= 0

  • 默认值:0

top_k 会限制模型在每一步对 token 的选择,使其从较小的集合中进行选择。值为 1 表示模型将始终选择最有可能的下一个 token,从而得到可预测的结果。

频率惩罚

  • 参数:frequency_penalty

  • 可选,float,-2.0 至 2.0

  • 默认值:0.0

frequency_penalty 可根据词条在输入中出现的频率来控制其重复使用。它会尝试减少那些在输入中出现频率较高的词条的使用频率,这与它们出现的频率成正比。词条惩罚会随着出现次数的增加而增加。负值将鼓励词条重复使用。

存在惩罚

  • 参数:presence_penalty

  • 可选,float,-2.0 至 2.0

  • 默认值:0.0

presence_penalty 调整模型重复输入中已使用的特定标记的频率。值越高,重复的可能性就越小,负值则相反。标记惩罚不会随着出现次数而变化。负值会鼓励标记重用。

重复惩罚

  • 参数:repetition_penalty

  • 可选,float,0.0 至 2.0

  • 默认值:1.0

repetition_penalty 有助于减少输入中标记的重复。较高的值会降低模型重复标记的可能性,但过高的值会使输出不够连贯(通常会出现缺少小词的连续句子)。标记惩罚会根据原始标记的概率进行调整。

Min-P

  • 参数:min_p

  • 可选,float,0.0 至 1.0

  • 默认值:0.0

min_p 表示某个 token 被考虑的最小概率,该概率是相对于最可能的 token 的概率而言的。如果 min_p 设置为 0.1,则意味着它只允许概率至少为最佳选项十分之一的 token 被考虑。

Top-A

  • 参数:top_a

  • 可选,float,0.0 到 1.0

  • 默认值:0.0

top_a 仅考虑概率“足够高”的 top tokens,该概率基于最可能的 token 概率。可以将其视为一个动态的 Top-P。较低的 Top-A 值会根据概率最高的 token 集中选择,但范围会更窄。较高的 Top-A 值不一定会影响输出的创造性,但会根据最大概率优化过滤过程。

种子

  • 参数:seed

  • 可选,int

如果指定了 seed 参数,推理将确定性地进行采样,即使用相同种子和参数的重复请求应该返回相同的结果。某些模型无法保证确定性。

最大 tokens 数

  • 参数:max_tokens

  • 可选,int,>= 1

max_tokens 可设定模型在响应中可以生成的 token 数量的上限。模型不会生成超过此限制的 token。其最大值等于上下文长度减去 prompt 长度。

Logit Bias

  • 参数:logit_bias

  • 可选,object

logit_bias 是一个可选参数,用于修改指定 token 在模型生成输出中出现的可能性。

对数概率

  • 参数:logprobs

  • 可选,boolean

logprobs 设置是否返回输出 token 的对数概率。如果为 true,则返回每个输出 token 的对数概率。

最高对数概率

  • 参数:top_logprobs

  • 可选,int

top_logprobs 是一个介于 0 和 20 之间的整数,指定在每个 token 位置要返回的最可能 token 的数量,每个 token 都会带有相应的对数概率。如果使用此参数,则必须将 logprobs 设置为 true

响应格式

  • 参数:response_format

  • 可选,object

response_format 强制模型产出特定的输出格式。将其设置为 { "type": "json_object" } 可启用 JSON 模式,保证模型生成的消息为有效的 JSON。

注意:使用 JSON 模式时,应同时通过 system 或 user 提示词指示模型生成 JSON。

结构化输出

  • 参数:structured_outputs

  • 可选,boolean

指示模型是否能够使用 response_format 中的 json_schema 返回结构化输出。

停止

  • 参数:stop

  • 可选,array

如果模型遇到 stop 数组中指定的任意 token,则立即停止生成。

工具

  • 参数:tools

  • 可选,array

工具调用参数,遵循 OpenAI 的工具调用请求格式。对于非 OpenAI 提供者,会相应地进行转换。

工具选择

  • 参数:tool_choice

  • 可选,array

控制模型调用哪个工具。'none' 表示模型不会调用任何工具,而是生成一条消息。'auto' 表示模型可以在生成消息或调用一个或多个工具之间进行选择。'required' 表示模型必须调用一个或多个工具。通过 {"type": "function", "function": {"name": "my_function"}} 指定特定工具会强制模型调用该工具。

并行工具调用

  • 参数:parallel_tool_calls

  • 可选,boolean

  • 默认:true

是否在使用工具时启用并行函数调用。如果为 true,模型可以同时调用多个函数。如果为 false,函数将按顺序依次调用。

冗长程度

  • 参数:verbosity

  • 可选,enumlow medium high

  • 默认:medium

控制模型响应的冗长程度和长度。较低的值会生成更简洁的回答,而较高的值会生成更详细、更全面的回答。


以上文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请联系我们的 IT 技术支持工程师:

(沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅)

最受关注模型

DeepSeek V4 Pro

文本生成、深度思考

DeepSeek V4 Flash

文本生成、深度思考

Qwen 3.6 Plus

文本生成、深度思考、视觉理解

MiniMax M2.7

文本生成、深度思考、专业能力

XiaoMi MiMo V2.5 Pro

文本生成、深度思考

Kimi K2.6

文本生成、深度思考、工具调用

DeepSeek OCR 2

图片识别、OCR

Tencent Hunyuan Hy3 Preview

文本生成、深度思考

Qwen3.7 Max

文本生成、深度思考

MiMo V2 Pro

文本生成、深度思考

最新发布模型

Qwen3.7 Plus

文本生成、深度思考、视觉理解

Qwen3.7 Max

文本生成、深度思考

Doubao Seed 2.0 Mini

文本生成、深度思考、多模态

Doubao Seed 2.0 Lite

文本生成、深度思考、多模态

XiaoMi MiMo V2.5

文本生成、深度思考

XiaoMi MiMo V2.5 Pro

文本生成、深度思考

DeepSeek V4 Flash

文本生成、深度思考

DeepSeek V4 Pro

文本生成、深度思考

Tencent Hunyuan Hy3 Preview

文本生成、深度思考

Qwen3.6 27B

文本生成、深度思考、视觉识别

Embedding Models

GLM Embedding 3

文本向量化

Qwen3 Embedding 8B

文本嵌入、文本向量化

Doubao Embedding Large Text 250515

文本向量化

Qwen Text Embedding V4

文本向量化

Qwen Text Embedding V1

文本向量化

Qwen Text Embedding V2

文本向量化

Doubao Embedding Large

文本向量化

Doubao Embedding

文本向量化

Qwen Text Embedding V3

文本向量化

Hunyuan Embedding

文本向量化