LongCat 2.0 API 接口、参数 & 代码示例
meituan/longcat-2.0
LongCat 2.0 是美团 LongCat AI 推出的新一代万亿参数的混合专家(MoE)大语言模型,此模型专为 **Agentic Coding(智能体编程)** 场景设计,在上下文长度、专家融合架构以及国产算力适配上带来了多项行业突破。
- 模型 ID
- meituan/longcat-2.0
- 模型系列
- LongCat
- 更新日期
- 模型能力
- 文本生成、深度思考
- 上下文长度
- 1024 K
- 模型价格(每 1000 tokens 输入)
- ¥ 0.0025
- 模型价格(每 1000 tokens 输出)
- ¥ 0.0085
LongCat 2.0 模型介绍:
LongCat 2.0 是美团 LongCat AI 推出的新一代万亿参数的混合专家(MoE)大语言模型,此模型专为 Agentic Coding(智能体编程) 场景设计,在上下文长度、专家融合架构以及国产算力适配上带来了多项行业突破。
核心亮点与详细介绍:
一、 核心规格与技术参数
- 万亿级参数规模:总参数量高达 1.6 万亿(1.6T)。采用 MoE 架构,每个 Token 动态激活其中的 33B 至 56B(平均约 480 亿)参数,在保证强大表现的同时兼顾了推理效率。
- 百万级原生上下文(1M Context):原生支持 100 万 token 的超长上下文窗口,能让 AI 智能体一次性“吃下”并理解整个项目代码库。
- 生态适配:深度适配了 Claude Code、OpenClaw、Hermes 等主流开发工具套件(Harness),专攻代码理解、仓库级大范围修改和自动化工作流执行。
二、 四大核心架构改进
LongCat-2.0 的架构设计继承自此前的 LongCat-Flash,并引入了多项关键创新:
- LongCat 稀疏注意力(LSA):传统模型在处理超过 10 万字时往往会产生“健忘”且计算量激增。LSA 技术(由 DeepSeek 的 DSA 机制演进而来)通过引入更轻量化的索引器(Indexer),将长上下文的计算复杂度从二次方降为线性,实现了长文本处理的无损加速。
- MOPD 多专家融合(Multi-Teacher On-Policy Distill):通过独创的 MOPD 流程,将三大方向的专属专家能力完美熔炼进一个统一模型中:
- Agent 专家:专攻工具调用、API 解析与代码自我修正。
- Reasoning 专家:负责多跳推理、STEM 科学推理与自适应计算。
- Interaction 专家:主打指令遵循、人类意图对齐和幻觉抑制。 在推理时,门控网络会根据任务复杂度动态路由,将任务交给最擅长的专家处理。
- 零计算量专家(Zero-Computation Experts)与 ScMoE:针对代码任务中“命名变量”与“推导算法”复杂度截然不同的痛点,实现 Token 级的动态计算分配。简单 Token 甚至可以消耗零计算量,从而将宝贵的算力留给高难度的核心逻辑推理。
- 135B 级别的 N-gram Embedding 模块:通过 N-gram token 组合将 Embedding(向量嵌入)空间扩展了 100 倍以上,极大地增强了对局部上下文信息的建模以及 Token 级别的语义表示能力。
三、 纯国产算力集群的预训练突破
在训练层面上,LongCat-2.0 是行业内首个在超 5 万卡规模的国产算力集群上,完成全流程完整预训练与大规模部署的万亿参数模型。
- 数据吞吐:在数万级国产加速芯片上历时月余,高标准吞吐并消费了超过 35 万亿(35T+) 的中、英、多语言及代码 Token。
- 超强稳定性:通过自研的 HCCL 异常处理、弹性扩缩容和自动故障恢复技术,在整个超大规模预训练流程中实现了全程无回滚、无不可恢复的 loss 突刺,使月均每日故障率降低了 70% 以上,证明了在非 NVIDIA 硬件平台上进行前沿规模(Frontier-scale)大模型训练的可行性。
四、 基准测试表现(Benchmark)
在多项权威的代码与 Agent 智能体测评中,LongCat-2.0 展现出了顶尖的性能表现:
- SWE-bench Pro(深度软件工程任务):斩获 59.5 的高分,领先于 Gemini 3.1 Pro (54.2) 和 GPT-5.5 (58.6)。
- SWE-bench Multilingual(多语言编程):得分 77.3,与业界顶尖的 Claude Opus 4.6 (77.8) 基本持平。
- 在涉及复杂终端交互的 Terminal-Bench 2.1 (70.8) 以及复杂搜索浏览的 BrowseComp (79.9) 等通用智能体场景中,同样稳居行业第一梯队。
无论是从单句想法直接生成可运行的多文件全栈应用,还是保持百万字长文本小说的主设一致性,LongCat-2.0 都交出了非常惊艳的答卷。
API 接口地址:
-
Chat Completions API:
https://wcode.net/api/gpt/v1/chat/completions
-
Anthropic API:
https://wcode.net/api/anthropic/v1/messages
此 API 接口兼容 OpenAI 的 API 接口规范,可直接使用 OpenAI 的 SDK 来调用各个模型。仅需替换以下配置即可:
base_url替换为https://wcode.net/api/gpt/v1api_key替换为从 https://platform.wcode.net 获取到的 API Key具体可参考下方的各编程语言代码示例中的 OpenAI SDK 调用示例。
此模型支持 Anthropic / Claude 的 API 接口规范,可直接使用 Anthropic 的 SDK 来调用此模型。仅需替换以下配置即可:
ANTHROPIC_BASE_URL替换为https://wcode.net/api/anthropicANTHROPIC_API_KEY(或ANTHROPIC_AUTH_TOKEN)替换为从 https://platform.wcode.net 获取到的 API KeyANTHROPIC_MODEL(或model)替换为meituan/longcat-2.0
请求方法:
POST
各编程语言代码示例:
# TODO: 以下代码中的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
curl --request POST 'https://wcode.net/api/gpt/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
"model": "meituan/longcat-2.0",
"messages": [
{
"role": "user",
"content": "你好"
}
]
}'
import Foundation
let headers = [
"Authorization": "Bearer API_KEY", // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
"content-type": "application/json"
]
let parameters = [
"model": "meituan/longcat-2.0",
"messages": [
[
"role": "user",
"content": "你好"
]
]
] as [String : Any]
let postData = JSONSerialization.data(withJSONObject: parameters, options: [])
let request = NSMutableURLRequest(url: NSURL(string: "https://wcode.net/api/gpt/v1/chat/completions")! as URL,
cachePolicy: .useProtocolCachePolicy,
timeoutInterval: 60.0)
request.httpMethod = "POST"
request.allHTTPHeaderFields = headers
request.httpBody = postData as Data
let session = URLSession.shared
let dataTask = session.dataTask(with: request as URLRequest, completionHandler: { (data, response, error) -> Void in
if (error != nil) {
print(error as Any)
} else {
let httpResponse = response as? HTTPURLResponse
print(httpResponse)
}
})
dataTask.resume()
var headers = {
'Content-Type': 'application/json',
'Authorization': 'Bearer API_KEY' // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
};
var request = http.Request('POST', Uri.parse('https://wcode.net/api/gpt/v1/chat/completions'));
request.body = json.encode({
"model": "meituan/longcat-2.0",
"messages": [
{
"role": "user",
"content": "你好"
}
]
});
request.headers.addAll(headers);
http.StreamedResponse response = await request.send();
if (response.statusCode == 200) {
print(await response.stream.bytesToString());
}
else {
print(response.reasonPhrase);
}
require 'uri'
require 'net/http'
url = URI("https://wcode.net/api/gpt/v1/chat/completions")
http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true
request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer API_KEY' # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
request["content-type"] = 'application/json'
request.body = "{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}"
response = http.request(request)
puts response.read_body
use serde_json::json;
use reqwest;
#[tokio::main]
pub async fn main() {
let url = "https://wcode.net/api/gpt/v1/chat/completions";
let payload = json!({
"model": "meituan/longcat-2.0",
"messages": (
json!({
"role": "user",
"content": "你好"
})
)
});
let mut headers = reqwest::header::HeaderMap::new();
headers.insert("Authorization", "Bearer API_KEY".parse().unwrap()); // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
headers.insert("content-type", "application/json".parse().unwrap());
let client = reqwest::Client::new();
let response = client.post(url)
.headers(headers)
.json(&payload)
.send()
.await;
let results = response.unwrap()
.json::<serde_json::Value>()
.await
.unwrap();
dbg!(results);
}
CURL *hnd = curl_easy_init();
curl_easy_setopt(hnd, CURLOPT_CUSTOMREQUEST, "POST");
curl_easy_setopt(hnd, CURLOPT_URL, "https://wcode.net/api/gpt/v1/chat/completions");
struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Authorization: Bearer API_KEY"); // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
headers = curl_slist_append(headers, "content-type: application/json");
curl_easy_setopt(hnd, CURLOPT_HTTPHEADER, headers);
curl_easy_setopt(hnd, CURLOPT_POSTFIELDS, "{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");
CURLcode ret = curl_easy_perform(hnd);
package main
import (
"fmt"
"strings"
"net/http"
"io"
)
func main() {
url := "https://wcode.net/api/gpt/v1/chat/completions"
payload := strings.NewReader("{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}")
req, _ := http.NewRequest("POST", url, payload)
req.Header.Add("Authorization", "Bearer API_KEY") // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
req.Header.Add("content-type", "application/json")
res, _ := http.DefaultClient.Do(req)
defer res.Body.Close()
body, _ := io.ReadAll(res.Body)
fmt.Println(res)
fmt.Println(string(body))
}
using System.Net.Http.Headers;
var client = new HttpClient();
var request = new HttpRequestMessage(HttpMethod.Post, "https://wcode.net/api/gpt/v1/chat/completions");
request.Headers.Add("Authorization", "Bearer API_KEY"); // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
request.Content = new StringContent("{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", null, "application/json");
var response = await client.SendAsync(request);
response.EnsureSuccessStatusCode();
Console.WriteLine(await response.Content.ReadAsStringAsync());
var client = new RestClient("https://wcode.net/api/gpt/v1/chat/completions");
var request = new RestRequest("", Method.Post);
request.AddHeader("Authorization", "Bearer API_KEY"); // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
request.AddHeader("content-type", "application/json");
request.AddParameter("application/json", "{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", ParameterType.RequestBody);
var response = client.Execute(request);
const axios = require('axios');
let data = JSON.stringify({
"model": "meituan/longcat-2.0",
"messages": [
{
"role": "user",
"content": "你好"
}
]
});
let config = {
method: 'post',
maxBodyLength: Infinity,
url: 'https://wcode.net/api/gpt/v1/chat/completions',
headers: {
'Content-Type': 'application/json',
'Authorization': 'Bearer API_KEY' // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
},
data : data
};
axios.request(config).then((response) => {
console.log(JSON.stringify(response.data));
}).catch((error) => {
console.log(error);
});
OkHttpClient client = new OkHttpClient();
MediaType mediaType = MediaType.parse("application/json");
RequestBody body = RequestBody.create(mediaType, "{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");
Request request = new Request.Builder()
.url("https://wcode.net/api/gpt/v1/chat/completions")
.post(body)
.addHeader("Authorization", "Bearer API_KEY") // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
.addHeader("content-type", "application/json")
.build();
Response response = client.newCall(request).execute();
$client = new \GuzzleHttp\Client();
$headers = [
'Content-Type' => 'application/json',
'Authorization' => 'Bearer API_KEY', // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
];
$body = '{
"model": "meituan/longcat-2.0",
"messages": [
{
"role": "user",
"content": "你好"
}
]
}';
$request = new \GuzzleHttp\Psr7\Request('POST', 'https://wcode.net/api/gpt/v1/chat/completions', $headers, $body);
$response = $client->sendAsync($request)->wait();
echo $response->getBody();
$curl = curl_init();
curl_setopt_array($curl, [
CURLOPT_URL => "https://wcode.net/api/gpt/v1/chat/completions",
CURLOPT_RETURNTRANSFER => true,
CURLOPT_ENCODING => "",
CURLOPT_MAXREDIRS => 5,
CURLOPT_TIMEOUT => 300,
CURLOPT_CUSTOMREQUEST => "POST",
CURLOPT_POSTFIELDS => json_encode([
'model' => 'meituan/longcat-2.0',
'messages' => [
[
'role' => 'user',
'content' => '你好'
]
]
]),
CURLOPT_HTTPHEADER => [
"Authorization: Bearer API_KEY", // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
"content-type: application/json",
],
]);
$response = curl_exec($curl);
$error = curl_error($curl);
curl_close($curl);
if ($error) {
echo "cURL Error #:" . $error;
} else {
echo $response;
}
import requests
import json
url = "https://wcode.net/api/gpt/v1/chat/completions"
payload = {
"model": "meituan/longcat-2.0",
"messages": [
{
"role": "user",
"content": "你好"
}
]
}
headers = {
"Authorization": "Bearer API_KEY", # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
"content-type": "application/json"
}
response = requests.post(url, json=payload, headers=headers)
print(json.dumps(response.json(), indent=4, ensure_ascii=False))
from openai import OpenAI
client = OpenAI(
base_url="https://wcode.net/api/gpt/v1",
api_key="API_KEY" # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
)
completion = client.chat.completions.create(
model="meituan/longcat-2.0",
messages=[
{
"role": "user",
"content": "你好"
}
]
)
print(completion.choices[0].message.content)
各 AI 产品/工具/第三方应用接入示例:
配置 Hermes Agent 使用 LongCat 2.0 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
方式一:交互式配置
在命令行输入 hermes model,然后选择 Custom endpoint 选项,根据交互式命令引导,分别配置以下信息:
- API base URL:
https://wcode.net/api/gpt/v1 - API Key:
<API_KEY> - Model:
meituan/longcat-2.0
方式二:手动配置
修改 config.yaml(通常位于~/.hermes/config.yaml)
model:
default: "meituan/longcat-2.0"
provider: custom
base_url: "https://wcode.net/api/gpt/v1"
api_key: "<API_KEY>"
context_length: 1024000
配置完成后,就可以开始使用 Hermes Agent ~
配置 Roo Code 使用 LongCat 2.0 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
- API Provider:
OpenAI Compatible - Base URL:
https://wcode.net/api/gpt/v1 - API Key:
<API_KEY> - Model:
meituan/longcat-2.0
配置完成后,就可以开始使用 Roo Code ~
配置 Kilo Code 使用 LongCat 2.0 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
选择 Use your own API key,然后配置以下信息:
- API Provider:
OpenAI Compatible - Base URL:
https://wcode.net/api/gpt/v1 - API Key:
<API_KEY> - Model:
meituan/longcat-2.0
配置完成后,就可以开始使用 Kilo Code ~
配置 Cline 使用 LongCat 2.0 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
- API Provider:
OpenAI Compatible - Base URL:
https://wcode.net/api/gpt/v1 - API Key:
<API_KEY> - Model ID:
meituan/longcat-2.0
配置完成后,就可以开始使用 Cline ~
注:以下安装和配置过程以 Ubuntu Server 24.04 (root 用户) + Node 22 安装 OpenClaw 🦞 2026.3.8 为例
安装 🦞 OpenClaw(龙虾),步骤如下:
- 命令行执行
npm install -g openclaw@latest - 命令行执行
openclaw onboard --install-daemon - I understand this is personal-by-default and shared/multi-user use requires lock-down. Continue? 选择
yes - Onboarding mode 选择
QuickStart - Model/auth provider 选择
Skip for now - Default model 选择
Keep current (default: ...) - Select channel (QuickStart) 选择
Skip for now - Web search 选择
Skip for now - Configure skills now? (recommended) 选择
No - Enable hooks? (这是一个多选,按空格键可选中选项)按空格键选中
📝 command-logger和💾 session-memory这两个选项,然后按回车键进入下一步 - (如有) How do you want to hatch your bot? 选择
Hatch in TUI (recommended)
配置 🦞 OpenClaw(龙虾)使用 LongCat 2.0 模型:
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取(创建)的 API Key
推荐方式:修改 openclaw.json(通常位于~/.openclaw/openclaw.json)
找到openclaw.json的第一层级的models和agents属性(如果没有则在第一层级添加models和agents属性),改为如下配置:
{
...其他配置,
"models": {
"mode": "merge",
"providers": {
"wcode": {
"baseUrl": "https://wcode.net/api/gpt/v1",
"apiKey": "<API_KEY>",
"api": "openai-completions",
"models": [
{
"id": "meituan/longcat-2.0",
"name": "LongCat 2.0",
"reasoning": false,
"input": ["text"],
"contextWindow": 1024000,
"maxTokens": 8192
}
]
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "wcode/meituan/longcat-2.0"
}
}
},
...其他配置
}
完成以上配置后,
- 执行以下命令,即可通过命令行的方式开始对话:
openclaw tui
- 执行以下命令,即可通过 Web 界面的方式开始对话:
openclaw dashboard
配置 OpenCode 使用 LongCat 2.0 模型:
推荐方式:修改 opencode.json(通常位于~/.config/opencode/opencode.json)
注意事项:以下配置中的
<API_KEY>需要替换为从 https://platform.wcode.net 获取的 API Key
配置如下:
{
"$schema": "https://opencode.ai/config.json",
"provider": {
"myprovider": {
"npm": "@ai-sdk/openai-compatible",
"name": "wcode",
"options": {
"baseURL": "https://wcode.net/api/gpt/v1",
"apiKey": "<API_KEY>"
},
"models": {
"meituan/longcat-2.0": {
"name": "LongCat 2.0"
}
}
}
}
}
完成以上配置后,执行以下命令,即可启动 OpenCode:
opencode
输入 /models,选择配置的 meituan/longcat-2.0 模型并在 OpenCode 中使用。
API 响应示例(curl):
{
"id": "chatcmpl-t1782857113s221r7ed1e011a01a94d58e9f4304",
"object": "chat.completion",
"created": 1782857121,
"model": "LongCat-2.0",
"choices": [
{
"delta": null,
"index": 0,
"finish_reason": "stop",
"matched_stop": 2,
"message": {
"role": "assistant",
"content": "你好,我是 LongCat-2.0,由美团公司研发,我采用了创新的混合专家架构。我的长尾知识理解能力比之前的版本提升了64% 以上,非常适合特别耗费脑力的任务,比如语言理解、推理和规划等。在智能体任务中,我的表现可以和主流模型相媲美,而在一般的语言任务中,我更是可以和一些基于 Scalinglaw 的大型语言模型一较高下。",
"reasoning_content": "\n用户在问模型相关的问题,这是想了解我到底是谁、有什么特点。我需要以清晰友好的方式介绍自己的基本信息,包括我的名称、核心能力提升等方面的内容,让用户对我有一个全面的认识。"
},
"logprobs": null
}
],
"content": "",
"usage": {
"effectiveCachedTokens": 0,
"completion_tokens": 174,
"prompt_tokens": 19,
"total_tokens": 193,
"completion_tokens_details": {
"reasoning_tokens": 44
},
"prompt_tokens_details": {
"cached_tokens": 0,
"audio_tokens": 0,
"image_tokens": 0,
"video_tokens": 0,
"text_tokens": 0
},
"cache_write_tokens": 0,
"cache_read_tokens": 0,
"input_tokens": 0,
"output_tokens": 0,
"output_tokens_details": null,
"cached_tokens": 0
},
"lastOne": false
}
请求参数:
- messages(对话消息)
- model(模型 ID)
- max_tokens(最大 tokens 数)
- tools(工具)
- stream(流式输出)
- top_p(Top-P)
- tool_choice(工具选择)
- thinking(思考模式)
- temperature(温度)
重要提示:由于模型架构不同,部分参数可能仅适用于特定的模型。
messages(对话消息)
-
参数:
messages -
必选,object
对话消息列表,包含当前对话的完整上下文信息。每条消息都有特定的角色和内容,模型会根据这些消息生成回复。消息按时间顺序排列,支持三种角色:system(系统消息,用于设定 AI 的行为和角色)、user(用户消息,来自用户的输入)、assistant(助手消息,来自 AI 的回复)。普通对话模型主要支持纯文本内容。
messages 格式请参考代码示例。注意:不能只包含系统消息或助手消息。
model(模型 ID)
-
参数:
model -
必选,string
调用时使用的模型 ID。请使用模型详情页展示的模型 ID。
max_tokens(最大 tokens 数)
-
参数:
max_tokens -
可选,int,>= 1
max_tokens 可设定模型在响应中可以生成的 token 数量的上限。模型不会生成超过此限制的 token。其最大值等于上下文长度减去 prompt 长度。
tools(工具)
-
参数:
tools -
可选,array
工具调用参数,遵循 OpenAI 的工具调用请求格式。对于非 OpenAI 提供者,会相应地进行转换。
stream(流式输出)
-
参数:
stream -
可选,boolean
-
取值范围:
true|false -
默认:
false
是否开启流式输出。设为 true 时,模型以 SSE 形式逐块返回生成内容;设为 false 时,等待完整响应后一次性返回。
top_p(Top-P)
-
参数:
top_p -
可选,float,0.0 至 1.0
-
默认:
1.0
top_p 参数控制模型在生成文本时的候选词选择范围。具体来说,模型会生成一组候选 token,然后从累积概率达到或超过 p 的 token 中随机选择一个作为输出。通过这种方式,top_p 能够在保证生成内容的多样性的同时,考虑到概率分布的合理性。
由于 temperature 与 top_p 均可以控制生成文本的多样性,因此建议您只设置其中一个值。
tool_choice(工具选择)
-
参数:
tool_choice -
可选,array
控制模型调用哪个工具。'none' 表示模型不会调用任何工具,而是生成一条消息。'auto' 表示模型可以在生成消息或调用一个或多个工具之间进行选择。'required' 表示模型必须调用一个或多个工具。通过 {"type": "function", "function": {"name": "my_function"}} 指定特定工具会强制模型调用该工具。
thinking(思考模式)
-
参数:
thinking -
可选,object
-
默认:
{"type": "enabled"}
用于控制模型的思考模式。以 object 形式传入,通过 type 字段指定模型在回答前是否进行内部推理,以及具体推理策略。
示例
"thinking": {
"type": "enabled"
}
thinking.type(思考类型)
-
参数:
thinking.type -
必选,string
-
取值范围:
enabled|disabled -
默认:
enabled
指定 thinking 对象的 type 字段,控制思考策略。
enabled:开启思考模式,模型强制先思考再回答。disabled:关闭思考模式,模型直接回答问题,不进行思考。
temperature(温度)
-
参数:
temperature -
可选,float,0.0 到 2.0
-
默认:
1.0
此设置影响模型回复的多样性。较低的值会使回复更可预测、更常见;较高的值会鼓励更具多样性且较不常见的回复。当设置为 0 时,模型对相同输入将尽可能的给出相同的回复。
以上文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请联系我们的 IT 技术支持工程师:
(沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅)
![]()