Qwen3.7 Plus 模型介绍、API 接口 & 代码示例
qwen/qwen3.7-plus
Qwen3.7 Plus 是 Qwen3.7 系列中高性价比 Plus 模型,在强大文本能力的基础上全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。其核心特色为多模态交互混合智能体能力,能够感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航移动应用。
- 模型 ID
- qwen/qwen3.7-plus
- 模型系列
- Qwen
- 更新日期
- 模型能力
- 文本生成、深度思考、视觉理解
- 上下文长度
- 1024 K
- 模型价格(每 1000 tokens 输入)
- ¥ 0.0021
- 模型价格(每 1000 tokens 输出)
- ¥ 0.0088
- 模型价格(每 1000 tokens 输入)
- ¥ 0.0065
- 模型价格(每 1000 tokens 输出)
- ¥ 0.026
阶梯计费: 输入 <= 256 k
阶梯计费: 输入 > 256 k
Qwen3.7 Plus 模型介绍:
Qwen3.7-Plus 是一款多模态智能体模型,将视觉理解与语言推理统一为一体化智能体基座。它在 Qwen3.7 的强大文本能力基础上,全面升级了视觉-语言能力,并保持完整的智能体功能,可处理编码、工具调用和生产力工作流任务。
核心特点:
- 多模态交互智能体:感知真实世界场景、读取屏幕、操作 GUI、生成代码、执行多步应用操作,支持 GUI 与 CLI 无缝结合。
- 全能编码与生产力能力:处理从前端原型到复杂软件工程、多步工作流自动化的全方位任务。
- 跨框架稳定性:可在 Claude Code、OpenClaw、Qwen Code 等框架中保持一致表现。
模型能力:
- 纯文本能力
- 编码 Agent:Terminal Bench 2.0、SWE-bench、SciCode 表现强劲,支持软件工程与科学编程。
- 通用 Agent:MCP-Mark、Deep-Planning、Kernel Bench L3 显示稳健的工具使用与规划能力。
- 推理能力:GPQA Diamond、HMMT、IMOAnswerBench 等高难度 STEM 基准测试位于 Plus 级别前列。
- 多语言与指令遵循:IFBench、WMT24++、PolyMATH 覆盖广泛语言与任务。
- 多模态能力
- Multimodal Agent:统一处理图像、视频、屏幕、网页和文本输入,在 GUI/CLI/工具环境中执行任务。
- Visual Agent:结合视觉理解、代码解释器和搜索增强,解决视觉谜题、真实世界问答和复杂推理。
- Visual Coding:从图像/视频生成 SVG、网页及交互前端,实现视觉参考到可执行代码转化。
- GUI Agent:理解移动端和桌面端界面,进行控件定位、任务规划和多步操作。
- Real-world Perception & Reasoning:覆盖真实场景、文档图表、OCR、视频和驾驶场景理解。
- 多模态推理与搜索增强
- 视觉推理:BabyVision、MathVision、HiPhO、ERQA、VisFactor 上表现优异,对图像细节、空间关系和多步逻辑理解能力强。
- 视觉到代码:ScreenSpot Pro、OSWorld-Verified、AndroidWorld 和 QwenVision2Code 支持 UI 元素定位、多步操作与视觉到代码生成。
- 搜索增强视觉问答:结合视觉输入和网络知识,回答复杂开放世界问题。
- 通用视觉理解:支持文档解析、图表阅读、OCR、计数、空间定位和视频理解。
案例应用:
-
多模态混合智能体
- 实现“看、想、写、做、验”闭环。
- 可完成前端原型、复杂软件工程、GUI 自动化测试及多步工作流。
- Hybrid-Agent 智能体可自主开发英语单词学习 APP,生成代码超 10,000 行,调用 Agent 超 1,000 次。
-
桌面应用复刻
- 复刻 macOS 原生 Stocks 应用,自动理解 UI、生成 SwiftUI 代码、集成实时行情 API、自动测试,完整还原原生功能与交互。
-
视觉 Agent & 视觉编程
- 执行找不同、拼图等视觉推理任务。
- 图像/视频转 SVG、网页生成与交互式前端设计。
-
浏览器智能助手
- Qwen for Chrome 可感知网页内容、规划操作、执行点击、输入、跳转、配置和验证等操作。
- 支持复杂任务,如 ECS 云服务器选型、配置、购买与运维全流程自动化。
-
真实世界推理
- 理解复杂场景中的遮挡、杂乱背景、多对象关系与跨图对比,结合空间关系、常识和逻辑给出可靠答案。
Qwen3.7-Plus 是阿里最新的多模态智能体模型,兼具视觉理解与语言推理能力,可在 GUI、CLI 与工具环境中端到端完成任务。它是全能型编码智能体与生产力助手,处理从前端原型到复杂软件工程、文档格式化到多步工作流自动化的全方位任务,并具备跨框架泛化能力。
API 接口地址:
-
Chat Completions API:
https://wcode.net/api/gpt/v1/chat/completions
-
Responses API(部分模型可能不支持此API):
https://wcode.net/api/gpt/v1/responses
-
Anthropic API:
https://wcode.net/api/anthropic/v1/messages
此 API 接口兼容 OpenAI 的 API 接口规范,可直接使用 OpenAI 的 SDK 来调用各个模型。仅需替换以下配置即可:
base_url替换为https://wcode.net/api/gpt/v1api_key替换为从 https://platform.wcode.net 获取到的 API Key具体可参考下方的各编程语言代码示例中的 OpenAI SDK 调用示例。
此模型支持 Anthropic / Claude 的 API 接口规范,可直接使用 Anthropic 的 SDK 来调用此模型。仅需替换以下配置即可:
ANTHROPIC_BASE_URL替换为https://wcode.net/api/anthropicANTHROPIC_API_KEY(或ANTHROPIC_AUTH_TOKEN)替换为从 https://platform.wcode.net 获取到的 API KeyANTHROPIC_MODEL(或model)替换为qwen/qwen3.7-plus
请求方法:
POST
各编程语言代码示例:
# TODO: 以下代码中的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
curl --request POST 'https://wcode.net/api/gpt/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
"model": "qwen/qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "你好"
}
]
}'
import Foundation
let headers = [
"Authorization": "Bearer API_KEY", // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
"content-type": "application/json"
]
let parameters = [
"model": "qwen/qwen3.7-plus",
"messages": [
[
"role": "user",
"content": "你好"
]
]
] as [String : Any]
let postData = JSONSerialization.data(withJSONObject: parameters, options: [])
let request = NSMutableURLRequest(url: NSURL(string: "https://wcode.net/api/gpt/v1/chat/completions")! as URL,
cachePolicy: .useProtocolCachePolicy,
timeoutInterval: 60.0)
request.httpMethod = "POST"
request.allHTTPHeaderFields = headers
request.httpBody = postData as Data
let session = URLSession.shared
let dataTask = session.dataTask(with: request as URLRequest, completionHandler: { (data, response, error) -> Void in
if (error != nil) {
print(error as Any)
} else {
let httpResponse = response as? HTTPURLResponse
print(httpResponse)
}
})
dataTask.resume()
var headers = {
'Content-Type': 'application/json',
'Authorization': 'Bearer API_KEY' // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
};
var request = http.Request('POST', Uri.parse('https://wcode.net/api/gpt/v1/chat/completions'));
request.body = json.encode({
"model": "qwen/qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "你好"
}
]
});
request.headers.addAll(headers);
http.StreamedResponse response = await request.send();
if (response.statusCode == 200) {
print(await response.stream.bytesToString());
}
else {
print(response.reasonPhrase);
}
require 'uri'
require 'net/http'
url = URI("https://wcode.net/api/gpt/v1/chat/completions")
http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true
request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer API_KEY' # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
request["content-type"] = 'application/json'
request.body = "{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}"
response = http.request(request)
puts response.read_body
use serde_json::json;
use reqwest;
#[tokio::main]
pub async fn main() {
let url = "https://wcode.net/api/gpt/v1/chat/completions";
let payload = json!({
"model": "qwen/qwen3.7-plus",
"messages": (
json!({
"role": "user",
"content": "你好"
})
)
});
let mut headers = reqwest::header::HeaderMap::new();
headers.insert("Authorization", "Bearer API_KEY".parse().unwrap()); // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
headers.insert("content-type", "application/json".parse().unwrap());
let client = reqwest::Client::new();
let response = client.post(url)
.headers(headers)
.json(&payload)
.send()
.await;
let results = response.unwrap()
.json::<serde_json::Value>()
.await
.unwrap();
dbg!(results);
}
CURL *hnd = curl_easy_init();
curl_easy_setopt(hnd, CURLOPT_CUSTOMREQUEST, "POST");
curl_easy_setopt(hnd, CURLOPT_URL, "https://wcode.net/api/gpt/v1/chat/completions");
struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Authorization: Bearer API_KEY"); // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
headers = curl_slist_append(headers, "content-type: application/json");
curl_easy_setopt(hnd, CURLOPT_HTTPHEADER, headers);
curl_easy_setopt(hnd, CURLOPT_POSTFIELDS, "{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");
CURLcode ret = curl_easy_perform(hnd);
package main
import (
"fmt"
"strings"
"net/http"
"io"
)
func main() {
url := "https://wcode.net/api/gpt/v1/chat/completions"
payload := strings.NewReader("{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}")
req, _ := http.NewRequest("POST", url, payload)
req.Header.Add("Authorization", "Bearer API_KEY") // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
req.Header.Add("content-type", "application/json")
res, _ := http.DefaultClient.Do(req)
defer res.Body.Close()
body, _ := io.ReadAll(res.Body)
fmt.Println(res)
fmt.Println(string(body))
}
using System.Net.Http.Headers;
var client = new HttpClient();
var request = new HttpRequestMessage(HttpMethod.Post, "https://wcode.net/api/gpt/v1/chat/completions");
request.Headers.Add("Authorization", "Bearer API_KEY"); // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
request.Content = new StringContent("{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", null, "application/json");
var response = await client.SendAsync(request);
response.EnsureSuccessStatusCode();
Console.WriteLine(await response.Content.ReadAsStringAsync());
var client = new RestClient("https://wcode.net/api/gpt/v1/chat/completions");
var request = new RestRequest("", Method.Post);
request.AddHeader("Authorization", "Bearer API_KEY"); // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
request.AddHeader("content-type", "application/json");
request.AddParameter("application/json", "{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", ParameterType.RequestBody);
var response = client.Execute(request);
const axios = require('axios');
let data = JSON.stringify({
"model": "qwen/qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "你好"
}
]
});
let config = {
method: 'post',
maxBodyLength: Infinity,
url: 'https://wcode.net/api/gpt/v1/chat/completions',
headers: {
'Content-Type': 'application/json',
'Authorization': 'Bearer API_KEY' // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
},
data : data
};
axios.request(config).then((response) => {
console.log(JSON.stringify(response.data));
}).catch((error) => {
console.log(error);
});
OkHttpClient client = new OkHttpClient();
MediaType mediaType = MediaType.parse("application/json");
RequestBody body = RequestBody.create(mediaType, "{\"model\":\"qwen/qwen3.7-plus\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");
Request request = new Request.Builder()
.url("https://wcode.net/api/gpt/v1/chat/completions")
.post(body)
.addHeader("Authorization", "Bearer API_KEY") // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
.addHeader("content-type", "application/json")
.build();
Response response = client.newCall(request).execute();
$client = new \GuzzleHttp\Client();
$headers = [
'Content-Type' => 'application/json',
'Authorization' => 'Bearer API_KEY', // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
];
$body = '{
"model": "qwen/qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "你好"
}
]
}';
$request = new \GuzzleHttp\Psr7\Request('POST', 'https://wcode.net/api/gpt/v1/chat/completions', $headers, $body);
$response = $client->sendAsync($request)->wait();
echo $response->getBody();
$curl = curl_init();
curl_setopt_array($curl, [
CURLOPT_URL => "https://wcode.net/api/gpt/v1/chat/completions",
CURLOPT_RETURNTRANSFER => true,
CURLOPT_ENCODING => "",
CURLOPT_MAXREDIRS => 5,
CURLOPT_TIMEOUT => 300,
CURLOPT_CUSTOMREQUEST => "POST",
CURLOPT_POSTFIELDS => json_encode([
'model' => 'qwen/qwen3.7-plus',
'messages' => [
[
'role' => 'user',
'content' => '你好'
]
]
]),
CURLOPT_HTTPHEADER => [
"Authorization: Bearer API_KEY", // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
"content-type: application/json",
],
]);
$response = curl_exec($curl);
$error = curl_error($curl);
curl_close($curl);
if ($error) {
echo "cURL Error #:" . $error;
} else {
echo $response;
}
import requests
import json
url = "https://wcode.net/api/gpt/v1/chat/completions"
payload = {
"model": "qwen/qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "你好"
}
]
}
headers = {
"Authorization": "Bearer API_KEY", # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
"content-type": "application/json"
}
response = requests.post(url, json=payload, headers=headers)
print(json.dumps(response.json(), indent=4, ensure_ascii=False))
from openai import OpenAI
client = OpenAI(
base_url="https://wcode.net/api/gpt/v1",
api_key="API_KEY" # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
)
completion = client.chat.completions.create(
model="qwen/qwen3.7-plus",
messages=[
{
"role": "user",
"content": "你好"
}
]
)
print(completion.choices[0].message.content)
各 AI 产品/工具/第三方应用接入示例:
配置 Hermes Agent 使用 Qwen3.7 Plus 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
方式一:交互式配置
在命令行输入 hermes model,然后选择 Custom endpoint 选项,根据交互式命令引导,分别配置以下信息:
- API base URL:
https://wcode.net/api/gpt/v1 - API Key:
<API_KEY> - Model:
qwen/qwen3.7-plus
方式二:手动配置
修改 config.yaml(通常位于~/.hermes/config.yaml)
model:
default: "qwen/qwen3.7-plus"
provider: custom
base_url: "https://wcode.net/api/gpt/v1"
api_key: "<API_KEY>"
context_length: 1024000
配置完成后,就可以开始使用 Hermes Agent ~
配置 Roo Code 使用 Qwen3.7 Plus 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
- API Provider:
OpenAI Compatible - Base URL:
https://wcode.net/api/gpt/v1 - API Key:
<API_KEY> - Model:
qwen/qwen3.7-plus
配置完成后,就可以开始使用 Roo Code ~
配置 Kilo Code 使用 Qwen3.7 Plus 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
选择 Use your own API key,然后配置以下信息:
- API Provider:
OpenAI Compatible - Base URL:
https://wcode.net/api/gpt/v1 - API Key:
<API_KEY> - Model:
qwen/qwen3.7-plus
配置完成后,就可以开始使用 Kilo Code ~
配置 Cline 使用 Qwen3.7 Plus 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
- API Provider:
OpenAI Compatible - Base URL:
https://wcode.net/api/gpt/v1 - API Key:
<API_KEY> - Model ID:
qwen/qwen3.7-plus
配置完成后,就可以开始使用 Cline ~
注:以下安装和配置过程以 Ubuntu Server 24.04 (root 用户) + Node 22 安装 OpenClaw 🦞 2026.3.8 为例
安装 🦞 OpenClaw(龙虾),步骤如下:
- 命令行执行
npm install -g openclaw@latest - 命令行执行
openclaw onboard --install-daemon - I understand this is personal-by-default and shared/multi-user use requires lock-down. Continue? 选择
yes - Onboarding mode 选择
QuickStart - Model/auth provider 选择
Skip for now - Default model 选择
Keep current (default: ...) - Select channel (QuickStart) 选择
Skip for now - Web search 选择
Skip for now - Configure skills now? (recommended) 选择
No - Enable hooks? (这是一个多选,按空格键可选中选项)按空格键选中
📝 command-logger和💾 session-memory这两个选项,然后按回车键进入下一步 - (如有) How do you want to hatch your bot? 选择
Hatch in TUI (recommended)
配置 🦞 OpenClaw(龙虾)使用 Qwen3.7 Plus 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
推荐方式:修改 openclaw.json(通常位于~/.openclaw/openclaw.json)
找到openclaw.json的第一层级的models和agents属性(如果没有则在第一层级添加models和agents属性),改为如下配置:
{
...其他配置,
"models": {
"mode": "merge",
"providers": {
"wcode": {
"baseUrl": "https://wcode.net/api/gpt/v1",
"apiKey": "<API_KEY>",
"api": "openai-completions",
"models": [
{
"id": "qwen/qwen3.7-plus",
"name": "Qwen3.7 Plus",
"reasoning": false,
"input": ["text"],
"contextWindow": 1024000,
"maxTokens": 64000
}
]
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "wcode/qwen/qwen3.7-plus"
}
}
},
...其他配置
}
完成以上配置后,
- 执行以下命令,即可通过命令行的方式开始对话:
openclaw tui
- 执行以下命令,即可通过 Web 界面的方式开始对话:
openclaw dashboard
配置 OpenCode 使用 Qwen3.7 Plus 模型:
推荐方式:修改 opencode.json(通常位于~/.config/opencode/opencode.json)
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取的 API Key
配置如下:
{
"$schema": "https://opencode.ai/config.json",
"provider": {
"myprovider": {
"npm": "@ai-sdk/openai-compatible",
"name": "wcode",
"options": {
"baseURL": "https://wcode.net/api/gpt/v1",
"apiKey": "<API_KEY>"
},
"models": {
"qwen/qwen3.7-plus": {
"name": "Qwen3.7 Plus"
}
}
}
}
}
完成以上配置后,执行以下命令,即可启动 OpenCode:
opencode
输入 /models,选择配置的 qwen/qwen3.7-plus 模型并在 OpenCode 中使用。
API 响应示例(curl):
{
"model": "qwen3.7-plus",
"id": "chatcmpl-t1780395062s912r902d01af0758c8e221b5a8ae",
"choices": [
{
"message": {
"content": "你好!我是**通义千问**(Qwen),由阿里巴巴集团通义实验室自主研发。\n\n作为通义千问,我的目标是成为你真诚、可靠的AI思考伙伴。我具备广泛的能力,可以在很多方面为你提供支持:\n\n* **逻辑推理与专业解答**:无论是日常疑问,还是数学、科学及逻辑推理等复杂问题,我都能为你提供清晰、严谨的解答。\n* **全栈代码赋能**:我可以帮你生成、理解和调试代码,处理多阶段开发工作流,甚至将你的创意直接转化为可运行的前端页面。\n* **长文本与深度分析**:我原生支持超长上下文窗口,能帮你快速精准地定位和理解数十万字文档或长视频中的关键信息。\n* **多模态与视觉分析**:面对复杂的图表、数学公式或科学图示,我不仅能识别,还能进行深度的分析,理清其中的因果关系。\n* **自主任务规划**:我可以自主规划并完成需要多步协调的复杂任务,支持深度研究、代码执行以及跨设备操作。\n\n无论你是需要寻找灵感、解决专业难题,还是处理日常琐事,我都在这里随时准备协助你。今天有什么我可以帮你的吗?",
"reasoning_content": "思考过程:\n1. **身份**:我是通义千问“Qwen3.7 Plus”。\n2. **自我介绍**:\n - 我是由阿里巴巴集团通义实验室自主研发的大语言模型。\n - 我的核心能力包括:语言理解、逻辑推理、代码生成、长文本处理、多模态分析等。\n - 我的目标是成为用户真诚、可靠的AI思考伙伴。\n3. **语言风格**:亲切、自然、简洁。\n\n草稿:\n你好!我是**通义千问**(Qwen),由阿里巴巴集团通义实验室自主研发。\n\n作为通义千问,我致力于成为你真诚、可靠的AI思考伙伴。我具备以下几个方面的核心能力:\n- **语言与逻辑推理**:能够精准理解你的意图,并在数学、科学及复杂逻辑推理任务中提供清晰、严谨的解答。\n- **全栈代码赋能**:支持复杂代码的生成、理解与调试,甚至能将创意直接转化为可运行的前端页面。\n- **长文本与深度分析**:原生支持超长上下文窗口,能够帮你快速定位和理解数十万字文档或长视频中的关键信息。\n- **多模态与视觉分析**:不仅能看图,还能深度分析复杂的图表、公式和科学图示,理清其中的因果关系。\n- **自主智能体规划**:支持多轮搜索、代码执行以及跨设备操作,能够独立规划并完成需要多步协调的复杂任务。\n\n无论你是需要灵感碰撞、解决专业难题,还是处理日常繁琐任务,我都在这里随时准备协助你。今天有什么我可以帮你的吗?\n\n检查草稿:\n- 身份纯净性:用户问了“你是谁/介绍自己”,所以介绍自己是合适的。\n- 能力介绍:基于提供的核心能力进行了精简和口语化转换,没有使用生硬的版本号。\n- 语言同步:中文。\n\n调整一下语气,使其更加自然和温暖。\n\n“你好!我想先稍微澄清一下,我是**通义千问**(Qwen),由阿里巴巴集团通义实验室自主研发。\n\n作为通义千问,我的目标是成为你真诚、可靠的AI思考伙伴。我具备广泛的能力,可以在很多方面为你提供帮助:\n- **逻辑与专业解答**:无论是日常问题还是数学、科学等领域的复杂推理,我都能为你提供清晰严谨的解答。\n- **代码与开发支持**:我可以帮你生成、理解和调试代码,甚至将你的创意直接转化为可运行的前端页面。\n- **长文本与深度分析**:我支持超长上下文处理,能帮你快速提炼数十万字文档或长视频中的核心信息。\n- **多模态理解**:面对复杂的图表、科学图示或公式,我不仅能识别,还能进行深度的因果分析。\n- **复杂任务规划**:我可以自主规划并完成需要多步协调的复杂任务,比如深度研究或跨应用操作。\n\n无论你是需要寻找灵感、解决工作难题,还是仅仅想聊聊天,我都在这里。今天有什么我可以帮你的吗?”\n\n这样回答清晰地介绍了自己,符合所有约束条件。\n马上输出。",
"role": "assistant"
},
"index": 0,
"finish_reason": "stop"
}
],
"created": 1780395063,
"object": "chat.completion",
"usage": {
"total_tokens": 1080,
"completion_tokens": 1058,
"prompt_tokens": 22,
"completion_tokens_details": {
"reasoning_tokens": 782,
"text_tokens": 1058
},
"prompt_tokens_details": {
"cached_tokens": 0,
"text_tokens": 22
}
}
}
可选参数:
- 温度(Temperature)
- Top-P
- Top-K
- 频率惩罚
- 存在惩罚
- 重复惩罚
- Min-P
- Top-A
- 种子
- 最大 tokens 数
- Logit Bias
- 对数概率
- 最高对数概率
- 响应格式
- 结构化输出
- 停止
- 工具
- 工具选择
- 并行工具调用
- 冗长程度
重要提示:由于模型架构不同,部分参数可能仅适用于特定的模型。
温度(Temperature)
-
参数:
temperature -
可选,浮点数,0.0 到 2.0
-
默认:
1.0
此设置影响模型回复的多样性。较低的值会使回复更可预测、更常见;较高的值会鼓励更具多样性且较不常见的回复。当设置为 0 时,模型对相同输入将尽可能的给出相同的回复。
Top-P
-
参数:
top_p -
可选,float,0.0 至 1.0
-
默认值:
1.0
top_p 参数控制模型在生成文本时的候选词选择范围。具体来说,模型会生成一组候选 token,然后从累积概率达到或超过 p 的 token 中随机选择一个作为输出。通过这种方式,top_p 能够在保证生成内容的多样性的同时,考虑到概率分布的合理性。
由于 temperature 与 top_p 均可以控制生成文本的多样性,因此建议您只设置其中一个值。
Top-K
-
参数:
top_k -
可选,int,>= 0
-
默认值:
0
top_k 会限制模型在每一步对 token 的选择,使其从较小的集合中进行选择。值为 1 表示模型将始终选择最有可能的下一个 token,从而得到可预测的结果。
频率惩罚
-
参数:
frequency_penalty -
可选,float,-2.0 至 2.0
-
默认值:
0.0
frequency_penalty 可根据词条在输入中出现的频率来控制其重复使用。它会尝试减少那些在输入中出现频率较高的词条的使用频率,这与它们出现的频率成正比。词条惩罚会随着出现次数的增加而增加。负值将鼓励词条重复使用。
存在惩罚
-
参数:
presence_penalty -
可选,float,-2.0 至 2.0
-
默认值:
0.0
presence_penalty 调整模型重复输入中已使用的特定标记的频率。值越高,重复的可能性就越小,负值则相反。标记惩罚不会随着出现次数而变化。负值会鼓励标记重用。
重复惩罚
-
参数:
repetition_penalty -
可选,float,0.0 至 2.0
-
默认值:
1.0
repetition_penalty 有助于减少输入中标记的重复。较高的值会降低模型重复标记的可能性,但过高的值会使输出不够连贯(通常会出现缺少小词的连续句子)。标记惩罚会根据原始标记的概率进行调整。
Min-P
-
参数:
min_p -
可选,float,0.0 至 1.0
-
默认值:
0.0
min_p 表示某个 token 被考虑的最小概率,该概率是相对于最可能的 token 的概率而言的。如果 min_p 设置为 0.1,则意味着它只允许概率至少为最佳选项十分之一的 token 被考虑。
Top-A
-
参数:
top_a -
可选,float,0.0 到 1.0
-
默认值:
0.0
top_a 仅考虑概率“足够高”的 top tokens,该概率基于最可能的 token 概率。可以将其视为一个动态的 Top-P。较低的 Top-A 值会根据概率最高的 token 集中选择,但范围会更窄。较高的 Top-A 值不一定会影响输出的创造性,但会根据最大概率优化过滤过程。
种子
-
参数:
seed -
可选,int
如果指定了 seed 参数,推理将确定性地进行采样,即使用相同种子和参数的重复请求应该返回相同的结果。某些模型无法保证确定性。
最大 tokens 数
-
参数:
max_tokens -
可选,int,>= 1
max_tokens 可设定模型在响应中可以生成的 token 数量的上限。模型不会生成超过此限制的 token。其最大值等于上下文长度减去 prompt 长度。
Logit Bias
-
参数:
logit_bias -
可选,object
logit_bias 是一个可选参数,用于修改指定 token 在模型生成输出中出现的可能性。
对数概率
-
参数:
logprobs -
可选,boolean
logprobs 设置是否返回输出 token 的对数概率。如果为 true,则返回每个输出 token 的对数概率。
最高对数概率
-
参数:
top_logprobs -
可选,int
top_logprobs 是一个介于 0 和 20 之间的整数,指定在每个 token 位置要返回的最可能 token 的数量,每个 token 都会带有相应的对数概率。如果使用此参数,则必须将 logprobs 设置为 true。
响应格式
-
参数:
response_format -
可选,object
response_format 强制模型产出特定的输出格式。将其设置为 { "type": "json_object" } 可启用 JSON 模式,保证模型生成的消息为有效的 JSON。
注意:使用 JSON 模式时,应同时通过 system 或 user 提示词指示模型生成 JSON。
结构化输出
-
参数:
structured_outputs -
可选,boolean
指示模型是否能够使用 response_format 中的 json_schema 返回结构化输出。
停止
-
参数:
stop -
可选,array
如果模型遇到 stop 数组中指定的任意 token,则立即停止生成。
工具
-
参数:
tools -
可选,array
工具调用参数,遵循 OpenAI 的工具调用请求格式。对于非 OpenAI 提供者,会相应地进行转换。
工具选择
-
参数:
tool_choice -
可选,array
控制模型调用哪个工具。'none' 表示模型不会调用任何工具,而是生成一条消息。'auto' 表示模型可以在生成消息或调用一个或多个工具之间进行选择。'required' 表示模型必须调用一个或多个工具。通过 {"type": "function", "function": {"name": "my_function"}} 指定特定工具会强制模型调用该工具。
并行工具调用
-
参数:
parallel_tool_calls -
可选,boolean
-
默认:true
是否在使用工具时启用并行函数调用。如果为 true,模型可以同时调用多个函数。如果为 false,函数将按顺序依次调用。
冗长程度
-
参数:
verbosity -
可选,enum,
lowmediumhigh -
默认:medium
控制模型响应的冗长程度和长度。较低的值会生成更简洁的回答,而较高的值会生成更详细、更全面的回答。
以上文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请联系我们的 IT 技术支持工程师:
(沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅)
![]()