LongCat 2.0 API 接口、参数 & 代码示例

meituan/longcat-2.0

LongCat 2.0 是美团 LongCat AI 推出的新一代万亿参数的混合专家(MoE)大语言模型,此模型专为 **Agentic Coding(智能体编程)** 场景设计,在上下文长度、专家融合架构以及国产算力适配上带来了多项行业突破。

模型 ID
meituan/longcat-2.0
模型系列
LongCat
更新日期
模型能力
文本生成、深度思考
上下文长度
1024 K
模型价格(每 1000 tokens 输入)
¥ 0.0025
模型价格(每 1000 tokens 输出)
¥ 0.0085

LongCat 2.0 模型介绍:

LongCat 2.0 是美团 LongCat AI 推出的新一代万亿参数的混合专家(MoE)大语言模型,此模型专为 Agentic Coding(智能体编程) 场景设计,在上下文长度、专家融合架构以及国产算力适配上带来了多项行业突破。

核心亮点与详细介绍:

一、 核心规格与技术参数

  • 万亿级参数规模:总参数量高达 1.6 万亿(1.6T)。采用 MoE 架构,每个 Token 动态激活其中的 33B 至 56B(平均约 480 亿)参数,在保证强大表现的同时兼顾了推理效率。
  • 百万级原生上下文(1M Context):原生支持 100 万 token 的超长上下文窗口,能让 AI 智能体一次性“吃下”并理解整个项目代码库。
  • 生态适配:深度适配了 Claude Code、OpenClaw、Hermes 等主流开发工具套件(Harness),专攻代码理解、仓库级大范围修改和自动化工作流执行。

二、 四大核心架构改进

LongCat-2.0 的架构设计继承自此前的 LongCat-Flash,并引入了多项关键创新:

  1. LongCat 稀疏注意力(LSA):传统模型在处理超过 10 万字时往往会产生“健忘”且计算量激增。LSA 技术(由 DeepSeek 的 DSA 机制演进而来)通过引入更轻量化的索引器(Indexer),将长上下文的计算复杂度从二次方降为线性,实现了长文本处理的无损加速
  2. MOPD 多专家融合(Multi-Teacher On-Policy Distill):通过独创的 MOPD 流程,将三大方向的专属专家能力完美熔炼进一个统一模型中:
    • Agent 专家:专攻工具调用、API 解析与代码自我修正。
    • Reasoning 专家:负责多跳推理、STEM 科学推理与自适应计算。
    • Interaction 专家:主打指令遵循、人类意图对齐和幻觉抑制。 在推理时,门控网络会根据任务复杂度动态路由,将任务交给最擅长的专家处理。
  3. 零计算量专家(Zero-Computation Experts)与 ScMoE:针对代码任务中“命名变量”与“推导算法”复杂度截然不同的痛点,实现 Token 级的动态计算分配。简单 Token 甚至可以消耗零计算量,从而将宝贵的算力留给高难度的核心逻辑推理。
  4. 135B 级别的 N-gram Embedding 模块:通过 N-gram token 组合将 Embedding(向量嵌入)空间扩展了 100 倍以上,极大地增强了对局部上下文信息的建模以及 Token 级别的语义表示能力。

三、 纯国产算力集群的预训练突破

在训练层面上,LongCat-2.0 是行业内首个在超 5 万卡规模的国产算力集群上,完成全流程完整预训练与大规模部署的万亿参数模型。

  • 数据吞吐:在数万级国产加速芯片上历时月余,高标准吞吐并消费了超过 35 万亿(35T+) 的中、英、多语言及代码 Token。
  • 超强稳定性:通过自研的 HCCL 异常处理、弹性扩缩容和自动故障恢复技术,在整个超大规模预训练流程中实现了全程无回滚、无不可恢复的 loss 突刺,使月均每日故障率降低了 70% 以上,证明了在非 NVIDIA 硬件平台上进行前沿规模(Frontier-scale)大模型训练的可行性。

四、 基准测试表现(Benchmark)

在多项权威的代码与 Agent 智能体测评中,LongCat-2.0 展现出了顶尖的性能表现:

  • SWE-bench Pro(深度软件工程任务):斩获 59.5 的高分,领先于 Gemini 3.1 Pro (54.2) 和 GPT-5.5 (58.6)。
  • SWE-bench Multilingual(多语言编程):得分 77.3,与业界顶尖的 Claude Opus 4.6 (77.8) 基本持平。
  • 在涉及复杂终端交互的 Terminal-Bench 2.1 (70.8) 以及复杂搜索浏览的 BrowseComp (79.9) 等通用智能体场景中,同样稳居行业第一梯队。

无论是从单句想法直接生成可运行的多文件全栈应用,还是保持百万字长文本小说的主设一致性,LongCat-2.0 都交出了非常惊艳的答卷。

API 接口地址:

  • Chat Completions API:

    https://wcode.net/api/gpt/v1/chat/completions

  • Anthropic API:

    https://wcode.net/api/anthropic/v1/messages

此 API 接口兼容 OpenAI 的 API 接口规范,可直接使用 OpenAI 的 SDK 来调用各个模型。仅需替换以下配置即可:

  1. base_url 替换为 https://wcode.net/api/gpt/v1
  2. api_key 替换为从 https://platform.wcode.net 获取到的 API Key

具体可参考下方的各编程语言代码示例中的 OpenAI SDK 调用示例。

此模型支持 Anthropic / Claude 的 API 接口规范,可直接使用 Anthropic 的 SDK 来调用此模型。仅需替换以下配置即可:

  1. ANTHROPIC_BASE_URL 替换为 https://wcode.net/api/anthropic
  2. ANTHROPIC_API_KEY(或 ANTHROPIC_AUTH_TOKEN)替换为从 https://platform.wcode.net 获取到的 API Key
  3. ANTHROPIC_MODEL(或model)替换为 meituan/longcat-2.0

请求方法:

POST

各编程语言代码示例:

# TODO: 以下代码中的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
curl --request POST 'https://wcode.net/api/gpt/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "model": "meituan/longcat-2.0",
    "messages": [
        {
            "role": "user",
            "content": "你好"
        }
    ]
}'
import Foundation

let headers = [
  "Authorization": "Bearer API_KEY",  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  "content-type": "application/json"
]
let parameters = [
  "model": "meituan/longcat-2.0",
  "messages": [
    [
      "role": "user",
      "content": "你好"
    ]
  ]
] as [String : Any]

let postData = JSONSerialization.data(withJSONObject: parameters, options: [])

let request = NSMutableURLRequest(url: NSURL(string: "https://wcode.net/api/gpt/v1/chat/completions")! as URL,
                                        cachePolicy: .useProtocolCachePolicy,
                                    timeoutInterval: 60.0)
request.httpMethod = "POST"
request.allHTTPHeaderFields = headers
request.httpBody = postData as Data

let session = URLSession.shared
let dataTask = session.dataTask(with: request as URLRequest, completionHandler: { (data, response, error) -> Void in
  if (error != nil) {
    print(error as Any)
  } else {
    let httpResponse = response as? HTTPURLResponse
    print(httpResponse)
  }
})

dataTask.resume()
var headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
};
var request = http.Request('POST', Uri.parse('https://wcode.net/api/gpt/v1/chat/completions'));
request.body = json.encode({
  "model": "meituan/longcat-2.0",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
});
request.headers.addAll(headers);

http.StreamedResponse response = await request.send();

if (response.statusCode == 200) {
  print(await response.stream.bytesToString());
}
else {
  print(response.reasonPhrase);
}
require 'uri'
require 'net/http'

url = URI("https://wcode.net/api/gpt/v1/chat/completions")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer API_KEY'  # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
request["content-type"] = 'application/json'
request.body = "{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}"

response = http.request(request)
puts response.read_body
use serde_json::json;
use reqwest;

#[tokio::main]
pub async fn main() {
  let url = "https://wcode.net/api/gpt/v1/chat/completions";

  let payload = json!({
    "model": "meituan/longcat-2.0",
    "messages": (
      json!({
        "role": "user",
        "content": "你好"
      })
    )
  });

  let mut headers = reqwest::header::HeaderMap::new();
  headers.insert("Authorization", "Bearer API_KEY".parse().unwrap());  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  headers.insert("content-type", "application/json".parse().unwrap());

  let client = reqwest::Client::new();
  let response = client.post(url)
    .headers(headers)
    .json(&payload)
    .send()
    .await;

  let results = response.unwrap()
    .json::<serde_json::Value>()
    .await
    .unwrap();

  dbg!(results);
}
CURL *hnd = curl_easy_init();

curl_easy_setopt(hnd, CURLOPT_CUSTOMREQUEST, "POST");
curl_easy_setopt(hnd, CURLOPT_URL, "https://wcode.net/api/gpt/v1/chat/completions");

struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Authorization: Bearer API_KEY");  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
headers = curl_slist_append(headers, "content-type: application/json");
curl_easy_setopt(hnd, CURLOPT_HTTPHEADER, headers);

curl_easy_setopt(hnd, CURLOPT_POSTFIELDS, "{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");

CURLcode ret = curl_easy_perform(hnd);
package main

import (
  "fmt"
  "strings"
  "net/http"
  "io"
)

func main() {
  url := "https://wcode.net/api/gpt/v1/chat/completions"

  payload := strings.NewReader("{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}")

  req, _ := http.NewRequest("POST", url, payload)

  req.Header.Add("Authorization", "Bearer API_KEY")  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  req.Header.Add("content-type", "application/json")

  res, _ := http.DefaultClient.Do(req)

  defer res.Body.Close()
  body, _ := io.ReadAll(res.Body)

  fmt.Println(res)
  fmt.Println(string(body))
}
using System.Net.Http.Headers;


var client = new HttpClient();

var request = new HttpRequestMessage(HttpMethod.Post, "https://wcode.net/api/gpt/v1/chat/completions");

request.Headers.Add("Authorization", "Bearer API_KEY");  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net

request.Content = new StringContent("{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", null, "application/json");

var response = await client.SendAsync(request);

response.EnsureSuccessStatusCode();

Console.WriteLine(await response.Content.ReadAsStringAsync());
var client = new RestClient("https://wcode.net/api/gpt/v1/chat/completions");

var request = new RestRequest("", Method.Post);

request.AddHeader("Authorization", "Bearer API_KEY");  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net

request.AddHeader("content-type", "application/json");

request.AddParameter("application/json", "{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", ParameterType.RequestBody);

var response = client.Execute(request);
const axios = require('axios');

let data = JSON.stringify({
  "model": "meituan/longcat-2.0",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
});

let config = {
  method: 'post',
  maxBodyLength: Infinity,
  url: 'https://wcode.net/api/gpt/v1/chat/completions',
  headers: {
    'Content-Type': 'application/json',
    'Authorization': 'Bearer API_KEY'  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  },
  data : data
};

axios.request(config).then((response) => {
  console.log(JSON.stringify(response.data));
}).catch((error) => {
  console.log(error);
});
OkHttpClient client = new OkHttpClient();

MediaType mediaType = MediaType.parse("application/json");

RequestBody body = RequestBody.create(mediaType, "{\"model\":\"meituan/longcat-2.0\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");

Request request = new Request.Builder()
  .url("https://wcode.net/api/gpt/v1/chat/completions")
  .post(body)
  .addHeader("Authorization", "Bearer API_KEY")  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  .addHeader("content-type", "application/json")
  .build();

Response response = client.newCall(request).execute();
$client = new \GuzzleHttp\Client();

$headers = [
  'Content-Type' => 'application/json',
  'Authorization' => 'Bearer API_KEY',  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
];

$body = '{
  "model": "meituan/longcat-2.0",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}';

$request = new \GuzzleHttp\Psr7\Request('POST', 'https://wcode.net/api/gpt/v1/chat/completions', $headers, $body);

$response = $client->sendAsync($request)->wait();

echo $response->getBody();
$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://wcode.net/api/gpt/v1/chat/completions",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 5,
  CURLOPT_TIMEOUT => 300,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'model' => 'meituan/longcat-2.0',
    'messages' => [
      [
        'role' => 'user',
        'content' => '你好'
      ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer API_KEY",  // TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
    "content-type: application/json",
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "cURL Error #:" . $error;
} else {
  echo $response;
}
import requests
import json

url = "https://wcode.net/api/gpt/v1/chat/completions"

payload = {
  "model": "meituan/longcat-2.0",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}

headers = {
  "Authorization": "Bearer API_KEY",  # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
  "content-type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(json.dumps(response.json(), indent=4, ensure_ascii=False))
from openai import OpenAI

client = OpenAI(
  base_url="https://wcode.net/api/gpt/v1",
  api_key="API_KEY"  # TODO: 这里的 API_KEY 需要替换,获取 API Key 入口:https://platform.wcode.net
)

completion = client.chat.completions.create(
  model="meituan/longcat-2.0",
  messages=[
    {
      "role": "user",
      "content": "你好"
    }
  ]
)

print(completion.choices[0].message.content)

各 AI 产品/工具/第三方应用接入示例:

配置 Hermes Agent 使用 LongCat 2.0 模型

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

方式一:交互式配置

在命令行输入 hermes model,然后选择 Custom endpoint 选项,根据交互式命令引导,分别配置以下信息:

  • API base URL:https://wcode.net/api/gpt/v1
  • API Key:<API_KEY>
  • Model:meituan/longcat-2.0

方式二:手动配置

修改 config.yaml(通常位于~/.hermes/config.yaml

model:
  default: "meituan/longcat-2.0"
  provider: custom
  base_url: "https://wcode.net/api/gpt/v1"
  api_key: "<API_KEY>"
  context_length: 1024000

配置完成后,就可以开始使用 Hermes Agent ~

配置 Roo Code 使用 LongCat 2.0 模型

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

  • API Provider:OpenAI Compatible
  • Base URL:https://wcode.net/api/gpt/v1
  • API Key:<API_KEY>
  • Model:meituan/longcat-2.0

配置完成后,就可以开始使用 Roo Code ~

配置 Kilo Code 使用 LongCat 2.0 模型

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

选择 Use your own API key,然后配置以下信息:

  • API Provider:OpenAI Compatible
  • Base URL:https://wcode.net/api/gpt/v1
  • API Key:<API_KEY>
  • Model:meituan/longcat-2.0

配置完成后,就可以开始使用 Kilo Code ~

配置 Cline 使用 LongCat 2.0 模型

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

  • API Provider:OpenAI Compatible
  • Base URL:https://wcode.net/api/gpt/v1
  • API Key:<API_KEY>
  • Model ID:meituan/longcat-2.0

配置完成后,就可以开始使用 Cline ~

注:以下安装和配置过程以 Ubuntu Server 24.04 (root 用户) + Node 22 安装 OpenClaw 🦞 2026.3.8 为例

安装 🦞 OpenClaw(龙虾),步骤如下:

  1. 命令行执行 npm install -g openclaw@latest
  2. 命令行执行 openclaw onboard --install-daemon
  3. I understand this is personal-by-default and shared/multi-user use requires lock-down. Continue? 选择 yes
  4. Onboarding mode 选择 QuickStart
  5. Model/auth provider 选择 Skip for now
  6. Default model 选择 Keep current (default: ...)
  7. Select channel (QuickStart) 选择 Skip for now
  8. Web search 选择 Skip for now
  9. Configure skills now? (recommended) 选择 No
  10. Enable hooks? (这是一个多选,按空格键可选中选项)按空格键选中 📝 command-logger💾 session-memory 这两个选项,然后按回车键进入下一步
  11. (如有) How do you want to hatch your bot? 选择 Hatch in TUI (recommended)

配置 🦞 OpenClaw(龙虾)使用 LongCat 2.0 模型:

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取(创建)的 API Key

推荐方式:修改 openclaw.json(通常位于~/.openclaw/openclaw.json

找到openclaw.json的第一层级的modelsagents属性(如果没有则在第一层级添加modelsagents属性),改为如下配置:

{
  ...其他配置,

  "models": {
      "mode": "merge",
      "providers": {
          "wcode": {
              "baseUrl": "https://wcode.net/api/gpt/v1",
              "apiKey": "<API_KEY>",
              "api": "openai-completions",
              "models": [
                  {
                      "id": "meituan/longcat-2.0",
                      "name": "LongCat 2.0",
                      "reasoning": false,
                      "input": ["text"],
                      "contextWindow": 1024000,
                      "maxTokens": 8192
                  }
              ]
          }
      }
  },
  "agents": {
      "defaults": {
         "model": {
             "primary": "wcode/meituan/longcat-2.0"
         }
      }
  },

  ...其他配置
}

完成以上配置后,

  1. 执行以下命令,即可通过命令行的方式开始对话:
openclaw tui
  1. 执行以下命令,即可通过 Web 界面的方式开始对话:
openclaw dashboard

配置 OpenCode 使用 LongCat 2.0 模型

推荐方式:修改 opencode.json(通常位于~/.config/opencode/opencode.json

注意事项:以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取的 API Key

配置如下:

{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "myprovider": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "wcode",
      "options": {
        "baseURL": "https://wcode.net/api/gpt/v1",
        "apiKey": "<API_KEY>"
      },
      "models": {
        "meituan/longcat-2.0": {
          "name": "LongCat 2.0"
        }
      }
    }
  }
}

完成以上配置后,执行以下命令,即可启动 OpenCode:

opencode

输入 /models,选择配置的 meituan/longcat-2.0 模型并在 OpenCode 中使用。

API 响应示例(curl):

{
    "id": "chatcmpl-t1782857113s221r7ed1e011a01a94d58e9f4304",
    "object": "chat.completion",
    "created": 1782857121,
    "model": "LongCat-2.0",
    "choices": [
        {
            "delta": null,
            "index": 0,
            "finish_reason": "stop",
            "matched_stop": 2,
            "message": {
                "role": "assistant",
                "content": "你好,我是 LongCat-2.0,由美团公司研发,我采用了创新的混合专家架构。我的长尾知识理解能力比之前的版本提升了64% 以上,非常适合特别耗费脑力的任务,比如语言理解、推理和规划等。在智能体任务中,我的表现可以和主流模型相媲美,而在一般的语言任务中,我更是可以和一些基于 Scalinglaw 的大型语言模型一较高下。",
                "reasoning_content": "\n用户在问模型相关的问题,这是想了解我到底是谁、有什么特点。我需要以清晰友好的方式介绍自己的基本信息,包括我的名称、核心能力提升等方面的内容,让用户对我有一个全面的认识。"
            },
            "logprobs": null
        }
    ],
    "content": "",
    "usage": {
        "effectiveCachedTokens": 0,
        "completion_tokens": 174,
        "prompt_tokens": 19,
        "total_tokens": 193,
        "completion_tokens_details": {
            "reasoning_tokens": 44
        },
        "prompt_tokens_details": {
            "cached_tokens": 0,
            "audio_tokens": 0,
            "image_tokens": 0,
            "video_tokens": 0,
            "text_tokens": 0
        },
        "cache_write_tokens": 0,
        "cache_read_tokens": 0,
        "input_tokens": 0,
        "output_tokens": 0,
        "output_tokens_details": null,
        "cached_tokens": 0
    },
    "lastOne": false
}

请求参数:

重要提示:由于模型架构不同,部分参数可能仅适用于特定的模型。

messages(对话消息)

  • 参数:messages

  • 必选object

对话消息列表,包含当前对话的完整上下文信息。每条消息都有特定的角色和内容,模型会根据这些消息生成回复。消息按时间顺序排列,支持三种角色:system(系统消息,用于设定 AI 的行为和角色)、user(用户消息,来自用户的输入)、assistant(助手消息,来自 AI 的回复)。普通对话模型主要支持纯文本内容。

messages 格式请参考代码示例。注意:不能只包含系统消息或助手消息。

model(模型 ID)

  • 参数:model

  • 必选string

调用时使用的模型 ID。请使用模型详情页展示的模型 ID。

max_tokens(最大 tokens 数)

  • 参数:max_tokens

  • 可选,int,>= 1

max_tokens 可设定模型在响应中可以生成的 token 数量的上限。模型不会生成超过此限制的 token。其最大值等于上下文长度减去 prompt 长度。

tools(工具)

  • 参数:tools

  • 可选,array

工具调用参数,遵循 OpenAI 的工具调用请求格式。对于非 OpenAI 提供者,会相应地进行转换。

stream(流式输出)

  • 参数:stream

  • 可选,boolean

  • 取值范围:true | false

  • 默认:false

是否开启流式输出。设为 true 时,模型以 SSE 形式逐块返回生成内容;设为 false 时,等待完整响应后一次性返回。

top_p(Top-P)

  • 参数:top_p

  • 可选,float,0.0 至 1.0

  • 默认:1.0

top_p 参数控制模型在生成文本时的候选词选择范围。具体来说,模型会生成一组候选 token,然后从累积概率达到或超过 p 的 token 中随机选择一个作为输出。通过这种方式,top_p 能够在保证生成内容的多样性的同时,考虑到概率分布的合理性。

由于 temperature 与 top_p 均可以控制生成文本的多样性,因此建议您只设置其中一个值。

tool_choice(工具选择)

  • 参数:tool_choice

  • 可选,array

控制模型调用哪个工具。'none' 表示模型不会调用任何工具,而是生成一条消息。'auto' 表示模型可以在生成消息或调用一个或多个工具之间进行选择。'required' 表示模型必须调用一个或多个工具。通过 {"type": "function", "function": {"name": "my_function"}} 指定特定工具会强制模型调用该工具。

thinking(思考模式)

  • 参数:thinking

  • 可选,object

  • 默认:{"type": "enabled"}

用于控制模型的思考模式。以 object 形式传入,通过 type 字段指定模型在回答前是否进行内部推理,以及具体推理策略。

示例

"thinking": {
    "type": "enabled"
}

thinking.type(思考类型)

  • 参数:thinking.type

  • 必选string

  • 取值范围:enabled | disabled

  • 默认:enabled

指定 thinking 对象的 type 字段,控制思考策略。

  • enabled:开启思考模式,模型强制先思考再回答。
  • disabled:关闭思考模式,模型直接回答问题,不进行思考。

temperature(温度)

  • 参数:temperature

  • 可选,float,0.0 到 2.0

  • 默认:1.0

此设置影响模型回复的多样性。较低的值会使回复更可预测、更常见;较高的值会鼓励更具多样性且较不常见的回复。当设置为 0 时,模型对相同输入将尽可能的给出相同的回复。


以上文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请联系我们的 IT 技术支持工程师:

(沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅)

最受关注模型

DeepSeek V4 Pro

文本生成、深度思考

DeepSeek V4 Flash

文本生成、深度思考

Qwen 3.6 Plus

文本生成、深度思考、视觉理解

XiaoMi MiMo V2.5 Pro

文本生成、深度思考

Kimi K2.6

文本生成、深度思考、工具调用

最新发布模型

LongCat 2.0

文本生成、深度思考

Qwen Image 2.0

图片生成

Qwen Image 2.0 Pro

图片生成

Doubao Seedream 5.0 Lite

图片生成

CosyVoice V3 Plus

语音合成

向量化模型

GLM Embedding 3

文本向量化

Qwen3 Embedding 8B

文本嵌入、文本向量化

Doubao Embedding Large Text 250515

文本向量化

Qwen Text Embedding V4

文本向量化

Qwen Text Embedding V1

文本向量化

语音识别模型

Fun ASR Flash

语音识别、方言识别

Qwen3 ASR Flash

语音识别

GLM ASR 2512

语音识别

语音合成模型

CosyVoice V3 Plus

语音合成

CosyVoice V3 Flash

语音合成

GLM TTS

语音合成