Kimi K2.6 API 接口、模型参数 & 代码示例

moonshotai/kimi-k2.6

Kimi K2.6 是月之暗面推出的新一代多模态模型，专为长程编码、编码驱动的 UI/UX 生成以及多智能体协同编排而设计。它能够处理跨越 Python、Rust 和 Go 语言的复杂端到端编码任务，并可将提示词与视觉输入转化为生产就绪的界面。其智能体集群架构可扩展至数百个并行子智能体，实现任务的自主拆解——单次运行即可交付文档、网站与电子表格，全程无需人工干预。

模型 ID: moonshotai/kimi-k2.6
模型系列: Kimi
更新日期: 2026-04-21
模型能力: 文本生成、深度思考、工具调用
上下文长度: 256 K
模型价格（每 1000 tokens 输入）: ¥ 0.007
模型价格（每 1000 tokens 输出）: ¥ 0.029

Kimi K2.6 模型介绍：

Kimi K2.6 是一款开源的原生多模态智能体模型，在长程编码、编码驱动设计、主动自主执行以及集群式任务编排等实用能力方面实现了进一步突破。

核心特性：

长程编码：K2.6 在复杂的端到端编码任务上取得了显著提升，能够稳健地泛化到多种编程语言（Rust、Go、Python）以及覆盖前端、DevOps 和性能优化等不同领域。
编码驱动设计：K2.6 能够将简单的提示词与视觉输入转化为生产就绪的界面与轻量级全栈工作流，生成结构清晰的布局、可交互元素以及富有审美精准度的丰富动画。
进阶智能体集群：水平扩展至 300 个子智能体并执行 4,000 个协同步骤，K2.6 可动态将任务分解为并行的领域专项子任务，单次自主运行即可交付从文档、网站到电子表格的端到端成果。
主动与开放式编排：在自主任务中，K2.6 在驱动持续运行（7×24 小时）的后台智能体方面表现强劲，能够主动管理日程、执行代码并编排跨平台操作，无需人工干预。

模型概要：


Architecture	Mixture-of-Experts (MoE)
Total Parameters	1T
Activated Parameters	32B
Number of Layers (Dense layer included)	61
Number of Dense Layers	1
Attention Hidden Dimension	7168
MoE Hidden Dimension (per Expert)	2048
Number of Attention Heads	64
Number of Experts	384
Selected Experts per Token	8
Number of Shared Experts	1
Vocabulary Size	160K
Context Length	256K
Attention Mechanism	MLA
Activation Function	SwiGLU
Vision Encoder	MoonViT
Parameters of Vision Encoder	400M

评测结果：

Benchmark	^{Kimi K2.6}	^{GPT-5.4 ^(xhigh)}	^{Claude Opus 4.6 ^{(max effort)}}	^{Gemini 3.1 Pro ^{(thinking high)}}	^{Kimi K2.5}
Agentic
HLE-Full (w/ tools)	54.0	52.1	53.0	51.4	50.2
BrowseComp	83.2	82.7	83.7	85.9	74.9
BrowseComp (Agent Swarm)	86.3	82.7	83.7	85.9	78.4
DeepSearchQA (f1-score)	92.5	78.6	91.3	81.9	89.0
DeepSearchQA (accuracy)	83.0	63.7	80.6	60.2	77.1
WideSearch (item-f1)	80.8	-	-	-	72.7
Toolathlon	50.0	54.6	47.2	48.8	27.8
MCPMark	55.9	62.5*	56.7*	55.9*	29.5
Claw Eval (pass^3)	62.3	60.3	70.4	57.8	52.3
Claw Eval (pass@3)	80.9	78.4	82.4	82.9	75.4
APEX-Agents	27.9	33.3	33.0	32.0	11.5
OSWorld-Verified	73.1	75.0	72.7	-	63.3
Coding
Terminal-Bench 2.0 (Terminus-2)	66.7	65.4*	65.4	68.5	50.8
SWE-Bench Pro	58.6	57.7	53.4	54.2	50.7
SWE-Bench Multilingual	76.7	-	77.8	76.9*	73.0
SWE-Bench Verified	80.2	-	80.8	80.6	76.8
SciCode	52.2	56.6	51.9	58.9	48.7
OJBench (python)	60.6	-	60.3	70.7	54.7
LiveCodeBench (v6)	89.6	-	88.8	91.7	85.0
Reasoning & Knowledge
HLE-Full	34.7	39.8	40.0	44.4	30.1
AIME 2026	96.4	99.2	96.7	98.3	95.8
HMMT 2026 (Feb)	92.7	97.7	96.2	94.7	87.1
IMO-AnswerBench	86.0	91.4	75.3	91.0*	81.8
GPQA-Diamond	90.5	92.8	91.3	94.3	87.6
Vision
MMMU-Pro	79.4	81.2	73.9	83.0*	78.5
MMMU-Pro (w/ python)	80.1	82.1	77.3	85.3*	77.7
CharXiv (RQ)	80.4	82.8*	69.1	80.2*	77.5
CharXiv (RQ) (w/ python)	86.7	90.0*	84.7	89.9*	78.7
MathVision	87.4	92.0*	71.2*	89.8*	84.2
MathVision (w/ python)	93.2	96.1*	84.6*	95.7*	85.0
BabyVision	39.8	49.7	14.8	51.6	36.5
BabyVision (w/ python)	68.5	80.2*	38.4*	68.3*	40.5
V* (w/ python)	96.9	98.4*	86.4*	96.9*	86.9

脚注：

通用测试细节
- 我们报告的是 Kimi K2.6 与 Kimi K2.5 开启思考模式、Claude Opus 4.6 使用最大努力模式、GPT-5.4 使用超高推理努力程度以及 Gemini 3.1 Pro 使用高思考水平时的结果。
- 除另有说明外，所有 Kimi K2.6 实验均采用温度系数 = 1.0、top-p = 1.0、上下文长度 262,144 token 的设置进行。
- 对于没有公开分数的基准测试，我们采用与 Kimi K2.6 相同的条件重新评估，并以星号（*）标注。除标注星号的条目外，其余结果均引自官方报告。
推理基准测试
- GPT-5.4 与 Claude 4.6 在 IMO-AnswerBench 上的分数取自 z.ai/blog/glm-5.1。
- Humanity's Last Exam (HLE) 及其他推理任务的最大生成长度设为 98,304 token。默认情况下，我们报告 HLE 完整集的成绩。在纯文本子集上，Kimi K2.6 无工具辅助时准确率为 36.4%，使用工具时达到 55.5%。
工具增强 / 智能体任务
- 在 HLE（工具辅助）、BrowseComp、DeepSearchQA 和 WideSearch 测试中，Kimi K2.6 配备了搜索、代码解释器及网页浏览工具。
- 对于 HLE-Full（工具辅助），最大生成长度为 262,144 token，单步限制为 49,152 token。我们采用简单的上下文管理策略：一旦上下文窗口超过阈值，仅保留最近一轮的工具相关消息。
- 对于 BrowseComp，我们报告的是采用与 Kimi K2.5 及 DeepSeek-V3.2 相同的全量丢弃策略进行上下文管理后的分数。
- 在 DeepSearchQA 测试中，Kimi K2.6 未应用任何上下文管理，超出支持上下文长度的任务直接计为失败。Claude Opus 4.6、GPT-5.4 与 Gemini 3.1 Pro 在 DeepSearchQA 上的分数引自 Claude Opus 4.7 系统卡。
- 对于 WideSearch，我们报告的是在“隐藏工具结果”上下文管理设置下的结果。一旦上下文窗口超过阈值，仅保留最近一轮的工具相关消息。
- 测试所用系统提示词与 Kimi K2.5 技术报告一致。
- Claw Eval 采用 1.1 版本进行，单步最大 token 数设为 16384。
- 针对 APEX-Agents，我们评估了公开发布的 480 项任务中的 452 项，遵循 Artificial Analysis 的做法（排除了存在外部运行时依赖的投资银行世界 244 与 246）。
编码任务
- Terminal-Bench 2.0 分数采用默认智能体框架（Terminus-2）及提供的 JSON 解析器，在保留思考模式下获得。
- 对于 SWE-Bench 系列评测（包括 Verified、Multilingual 与 Pro），我们使用基于 SWE-agent 改编的内部评测框架。该框架包含一组极简工具：bash 工具、createfile 工具、insert 工具、view 工具、strreplace 工具与 submit 工具。
- 所有编码任务报告的分数均为 10 次独立运行的平均值。
视觉基准测试
- 最大 token 数 = 98,304，取三次运行平均值（avg@3）。
- 启用 Python 工具的设置中，多步推理的单步最大 token 数为 65,536，最大步数为 50。
- MMMU-Pro 遵循官方协议，保留输入顺序并将图片前置。

API 接口地址：

Chat Completions API:

https://wcode.net/api/gpt/v1/chat/completions

此 API 接口兼容 OpenAI 的 API 接口规范，也就是可以直接使用 OpenAI 的 SDK 来调用各个模型。仅需替换以下两项配置即可：

base_url 替换为 https://wcode.net/api/gpt/v1

api_key 替换为从 https://platform.wcode.net 获取到的 API Key

具体可参考下方的各编程语言代码示例中的 OpenAI SDK 调用示例。

请求方法：

POST

各编程语言代码示例：

# TODO: 以下代码中的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net

curl --request POST 'https://wcode.net/api/gpt/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "model": "moonshotai/kimi-k2.6",
    "messages": [
        {
            "role": "user",
            "content": "你好"
        }
    ]
}'

import Foundation

let headers = [
  "Authorization": "Bearer API_KEY",     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
  "content-type": "application/json"
]
let parameters = [
  "model": "moonshotai/kimi-k2.6",
  "messages": [
    [
      "role": "user",
      "content": "你好"
    ]
  ]
] as [String : Any]

let postData = JSONSerialization.data(withJSONObject: parameters, options: [])

let request = NSMutableURLRequest(url: NSURL(string: "https://wcode.net/api/gpt/v1/chat/completions")! as URL,
                                        cachePolicy: .useProtocolCachePolicy,
                                    timeoutInterval: 60.0)
request.httpMethod = "POST"
request.allHTTPHeaderFields = headers
request.httpBody = postData as Data

let session = URLSession.shared
let dataTask = session.dataTask(with: request as URLRequest, completionHandler: { (data, response, error) -> Void in
  if (error != nil) {
    print(error as Any)
  } else {
    let httpResponse = response as? HTTPURLResponse
    print(httpResponse)
  }
})

dataTask.resume()

var headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
};
var request = http.Request('POST', Uri.parse('https://wcode.net/api/gpt/v1/chat/completions'));
request.body = json.encode({
  "model": "moonshotai/kimi-k2.6",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
});
request.headers.addAll(headers);

http.StreamedResponse response = await request.send();

if (response.statusCode == 200) {
  print(await response.stream.bytesToString());
}
else {
  print(response.reasonPhrase);
}

require 'uri'
require 'net/http'

url = URI("https://wcode.net/api/gpt/v1/chat/completions")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
request["content-type"] = 'application/json'
request.body = "{\"model\":\"moonshotai/kimi-k2.6\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}"

response = http.request(request)
puts response.read_body

use serde_json::json;
use reqwest;

#[tokio::main]
pub async fn main() {
  let url = "https://wcode.net/api/gpt/v1/chat/completions";

  let payload = json!({
    "model": "moonshotai/kimi-k2.6",
    "messages": (
      json!({
        "role": "user",
        "content": "你好"
      })
    )
  });

  let mut headers = reqwest::header::HeaderMap::new();
  headers.insert("Authorization", "Bearer API_KEY".parse().unwrap());     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
  headers.insert("content-type", "application/json".parse().unwrap());

  let client = reqwest::Client::new();
  let response = client.post(url)
    .headers(headers)
    .json(&payload)
    .send()
    .await;

  let results = response.unwrap()
    .json::<serde_json::Value>()
    .await
    .unwrap();

  dbg!(results);
}

CURL *hnd = curl_easy_init();

curl_easy_setopt(hnd, CURLOPT_CUSTOMREQUEST, "POST");
curl_easy_setopt(hnd, CURLOPT_URL, "https://wcode.net/api/gpt/v1/chat/completions");

struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Authorization: Bearer API_KEY");    // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
headers = curl_slist_append(headers, "content-type: application/json");
curl_easy_setopt(hnd, CURLOPT_HTTPHEADER, headers);

curl_easy_setopt(hnd, CURLOPT_POSTFIELDS, "{\"model\":\"moonshotai/kimi-k2.6\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");

CURLcode ret = curl_easy_perform(hnd);

package main

import (
  "fmt"
  "strings"
  "net/http"
  "io"
)

func main() {
  url := "https://wcode.net/api/gpt/v1/chat/completions"

  payload := strings.NewReader("{\"model\":\"moonshotai/kimi-k2.6\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}")

  req, _ := http.NewRequest("POST", url, payload)

  req.Header.Add("Authorization", "Bearer API_KEY")     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
  req.Header.Add("content-type", "application/json")

  res, _ := http.DefaultClient.Do(req)

  defer res.Body.Close()
  body, _ := io.ReadAll(res.Body)

  fmt.Println(res)
  fmt.Println(string(body))
}

using System.Net.Http.Headers;


var client = new HttpClient();

var request = new HttpRequestMessage(HttpMethod.Post, "https://wcode.net/api/gpt/v1/chat/completions");

request.Headers.Add("Authorization", "Bearer API_KEY");     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net

request.Content = new StringContent("{\"model\":\"moonshotai/kimi-k2.6\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", null, "application/json");

var response = await client.SendAsync(request);

response.EnsureSuccessStatusCode();

Console.WriteLine(await response.Content.ReadAsStringAsync());

var client = new RestClient("https://wcode.net/api/gpt/v1/chat/completions");

var request = new RestRequest("", Method.Post);

request.AddHeader("Authorization", "Bearer API_KEY");     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net

request.AddHeader("content-type", "application/json");

request.AddParameter("application/json", "{\"model\":\"moonshotai/kimi-k2.6\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}", ParameterType.RequestBody);

var response = client.Execute(request);

const axios = require('axios');

let data = JSON.stringify({
  "model": "moonshotai/kimi-k2.6",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
});

let config = {
  method: 'post',
  maxBodyLength: Infinity,
  url: 'https://wcode.net/api/gpt/v1/chat/completions',
  headers: {
    'Content-Type': 'application/json',
    'Authorization': 'Bearer API_KEY'     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
  },
  data : data
};

axios.request(config).then((response) => {
  console.log(JSON.stringify(response.data));
}).catch((error) => {
  console.log(error);
});

OkHttpClient client = new OkHttpClient();

MediaType mediaType = MediaType.parse("application/json");

RequestBody body = RequestBody.create(mediaType, "{\"model\":\"moonshotai/kimi-k2.6\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}");

Request request = new Request.Builder()
  .url("https://wcode.net/api/gpt/v1/chat/completions")
  .post(body)
  .addHeader("Authorization", "Bearer API_KEY")             // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
  .addHeader("content-type", "application/json")
  .build();

Response response = client.newCall(request).execute();

$client = new \GuzzleHttp\Client();

$headers = [
  'Content-Type' => 'application/json',
  'Authorization' => 'Bearer API_KEY',     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
];

$body = '{
  "model": "moonshotai/kimi-k2.6",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}';

$request = new \GuzzleHttp\Psr7\Request('POST', 'https://wcode.net/api/gpt/v1/chat/completions', $headers, $body);

$response = $client->sendAsync($request)->wait();

echo $response->getBody();

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://wcode.net/api/gpt/v1/chat/completions",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 5,
  CURLOPT_TIMEOUT => 300,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'model' => 'moonshotai/kimi-k2.6',
    'messages' => [
      [
        'role' => 'user',
        'content' => '你好'
      ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer API_KEY",     // TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
    "content-type: application/json",
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "cURL Error #:" . $error;
} else {
  echo $response;
}

import requests
import json

url = "https://wcode.net/api/gpt/v1/chat/completions"

payload = {
  "model": "moonshotai/kimi-k2.6",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}

headers = {
  "Authorization": "Bearer API_KEY",     # TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
  "content-type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(json.dumps(response.json(), indent=4, ensure_ascii=False))

from openai import OpenAI

client = OpenAI(
  base_url="https://wcode.net/api/gpt/v1",
  api_key="API_KEY"                             # TODO: 这里的 API_KEY 需要替换，获取 API Key 入口：https://platform.wcode.net
)

completion = client.chat.completions.create(
  model="moonshotai/kimi-k2.6",
  messages=[
    {
      "role": "user",
      "content": "你好"
    }
  ]
)

print(completion.choices[0].message.content)

各 AI 产品/工具/第三方应用接入示例：

配置 Hermes Agent 使用 Kimi K2.6 模型：

注意事项：以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取（创建）的 API Key

方式一：交互式配置

在命令行输入 hermes model，然后选择 Custom endpoint 选项，根据交互式命令引导，分别配置以下信息：

API base URL：https://wcode.net/api/gpt/v1
API Key：<API_KEY>
Model：moonshotai/kimi-k2.6

方式二：手动配置

修改 config.yaml（通常位于~/.hermes/config.yaml）

model:
  default: "moonshotai/kimi-k2.6"
  provider: custom
  base_url: "https://wcode.net/api/gpt/v1"
  api_key: "<API_KEY>"
  context_length: 256000

配置完成后，就可以开始使用 Hermes Agent ~

配置 Roo Code 使用 Kimi K2.6 模型：

注意事项：以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取（创建）的 API Key

API Provider：OpenAI Compatible
Base URL：https://wcode.net/api/gpt/v1
API Key：<API_KEY>
Model：moonshotai/kimi-k2.6

配置完成后，就可以开始使用 Roo Code ~

配置 Kilo Code 使用 Kimi K2.6 模型：

注意事项：以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取（创建）的 API Key

选择 Use your own API key，然后配置以下信息：

API Provider：OpenAI Compatible
Base URL：https://wcode.net/api/gpt/v1
API Key：<API_KEY>
Model：moonshotai/kimi-k2.6

配置完成后，就可以开始使用 Kilo Code ~

配置 Cline 使用 Kimi K2.6 模型：

注意事项：以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取（创建）的 API Key

API Provider：OpenAI Compatible
Base URL：https://wcode.net/api/gpt/v1
API Key：<API_KEY>
Model ID：moonshotai/kimi-k2.6

配置完成后，就可以开始使用 Cline ~

注：以下安装和配置过程以 Ubuntu Server 24.04 (root 用户) + Node 22 安装 OpenClaw 🦞 2026.3.8 为例

安装 🦞 OpenClaw（龙虾），步骤如下：

命令行执行 npm install -g openclaw@latest
命令行执行 openclaw onboard --install-daemon
I understand this is personal-by-default and shared/multi-user use requires lock-down. Continue? 选择 yes
Onboarding mode 选择 QuickStart
Model/auth provider 选择 Skip for now
Default model 选择 Keep current (default: ...)
Select channel (QuickStart) 选择 Skip for now
Web search 选择 Skip for now
Configure skills now? (recommended) 选择 No
Enable hooks? （这是一个多选，按空格键可选中选项）按空格键选中 📝 command-logger 和 💾 session-memory 这两个选项，然后按回车键进入下一步
(如有) How do you want to hatch your bot? 选择 Hatch in TUI (recommended)

配置 🦞 OpenClaw（龙虾）使用 Kimi K2.6 模型：

注意事项：以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取（创建）的 API Key

推荐方式：修改 openclaw.json（通常位于~/.openclaw/openclaw.json）

找到openclaw.json的第一层级的models和agents属性（如果没有则在第一层级添加models和agents属性），改为如下配置：

{
  ...其他配置,

  "models": {
      "mode": "merge",
      "providers": {
          "wcode": {
              "baseUrl": "https://wcode.net/api/gpt/v1",
              "apiKey": "<API_KEY>",
              "api": "openai-completions",
              "models": [
                  {
                      "id": "moonshotai/kimi-k2.6",
                      "name": "Kimi K2.6",
                      "reasoning": false,
                      "input": ["text"],
                      "contextWindow": 256000,
                      "maxTokens": 256000
                  }
              ]
          }
      }
  },
  "agents": {
      "defaults": {
         "model": {
             "primary": "wcode/moonshotai/kimi-k2.6"
         }
      }
  },

  ...其他配置
}

完成以上配置后，

执行以下命令，即可通过命令行的方式开始对话：

openclaw tui

执行以下命令，即可通过 Web 界面的方式开始对话：

openclaw dashboard

配置 OpenCode 使用 Kimi K2.6 模型：

推荐方式：修改 opencode.json（通常位于~/.config/opencode/opencode.json）

注意事项：以下配置中的 <API_KEY> 需要替换为从 https://platform.wcode.net 获取的 API Key

配置如下：

{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "myprovider": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "wcode",
      "options": {
        "baseURL": "https://wcode.net/api/gpt/v1",
        "apiKey": "<API_KEY>"
      },
      "models": {
        "moonshotai/kimi-k2.6": {
          "name": "Kimi K2.6"
        }
      }
    }
  }
}

完成以上配置后，执行以下命令，即可启动 OpenCode：

opencode

输入 /models，选择配置的 moonshotai/kimi-k2.6 模型并在 OpenCode 中使用。

API 响应示例（curl）：

{
    "id": "chatcmpl-t1776736898s192re134e8dc36d907efa3ac9ace",
    "object": "chat.completion",
    "created": 1776736954,
    "model": "kimi-k2.6",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "你好！我是 **Kimi**，由月之暗面科技有限公司（Moonshot AI）开发的人工智能助手。\n\n我能够帮你做很多事情，比如：\n\n*   **对话交流**：用中文、英文等多种语言与你自然沟通，解答问题、探讨话题。\n*   **长文本处理**：阅读和分析非常长的文档（如论文、报告、小说），帮你总结要点、提取信息或解答细节问题。\n*   **文件与图片阅读**：你可以上传 PDF、Word、Excel、PPT、图片等文件，我会帮你解读内容、分析数据或转换格式。\n*   **搜索与信息整合**：通过网络搜索获取最新信息，并结合已有知识为你提供全面、准确的回答。\n*   **编程与写作辅助**：帮你写代码、调试程序、起草邮件、撰写文章或润色文案。\n\n我会尽力做到**有用、无害且诚实**。如果你有任何问题，无论是学习、工作还是生活中的困惑，随时告诉我，我很乐意帮忙！你今天想聊些什么？",
                "reasoning_content": "用户用中文打招呼并请求自我介绍。这是一个标准的开场白，需要以友好、专业的方式回应。\n\n 作为Kimi，我应该：\n 1. 回应问候\n 2. 说明身份（Kimi，由月之暗面科技有限公司开发的人工智能助手）\n 3. 提及核心能力（多语言对话、长文本处理、文件阅读、搜索、编程辅助等）\n 4. 保持谦逊、乐于助人的态度\n 5. 询问用户有什么具体需要帮助的\n\n 需要用中文回复，语气自然、专业且友好。"
            },
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 15,
        "completion_tokens": 318,
        "total_tokens": 333
    }
}

可选参数：

温度（Temperature）
Top-P
Top-K
频率惩罚
存在惩罚
重复惩罚
Min-P
Top-A
种子
最大 tokens 数
Logit Bias
对数概率
最高对数概率
响应格式
结构化输出
停止
工具
工具选择
并行工具调用
冗长程度

重要提示：由于模型架构不同，部分参数可能仅适用于特定的模型。

温度（Temperature）

参数：temperature
可选，浮点数，0.0 到 2.0
默认：1.0

此设置影响模型回复的多样性。较低的值会使回复更可预测、更常见；较高的值会鼓励更具多样性且较不常见的回复。当设置为 0 时，模型对相同输入将尽可能的给出相同的回复。

Top-P

参数：top_p
可选，float，0.0 至 1.0
默认值：1.0

top_p 参数控制模型在生成文本时的候选词选择范围。具体来说，模型会生成一组候选 token，然后从累积概率达到或超过 p 的 token 中随机选择一个作为输出。通过这种方式，top_p 能够在保证生成内容的多样性的同时，考虑到概率分布的合理性。

由于 temperature 与 top_p 均可以控制生成文本的多样性，因此建议您只设置其中一个值。

Top-K

参数：top_k
可选，int，>= 0
默认值：0

top_k 会限制模型在每一步对 token 的选择，使其从较小的集合中进行选择。值为 1 表示模型将始终选择最有可能的下一个 token，从而得到可预测的结果。

频率惩罚

参数：frequency_penalty
可选，float，-2.0 至 2.0
默认值：0.0

frequency_penalty 可根据词条在输入中出现的频率来控制其重复使用。它会尝试减少那些在输入中出现频率较高的词条的使用频率，这与它们出现的频率成正比。词条惩罚会随着出现次数的增加而增加。负值将鼓励词条重复使用。

存在惩罚

参数：presence_penalty
可选，float，-2.0 至 2.0
默认值：0.0

presence_penalty 调整模型重复输入中已使用的特定标记的频率。值越高，重复的可能性就越小，负值则相反。标记惩罚不会随着出现次数而变化。负值会鼓励标记重用。

重复惩罚

参数：repetition_penalty
可选，float，0.0 至 2.0
默认值：1.0

repetition_penalty 有助于减少输入中标记的重复。较高的值会降低模型重复标记的可能性，但过高的值会使输出不够连贯（通常会出现缺少小词的连续句子）。标记惩罚会根据原始标记的概率进行调整。

Min-P

参数：min_p
可选，float，0.0 至 1.0
默认值：0.0

min_p 表示某个 token 被考虑的最小概率，该概率是相对于最可能的 token 的概率而言的。如果 min_p 设置为 0.1，则意味着它只允许概率至少为最佳选项十分之一的 token 被考虑。

Top-A

参数：top_a
可选，float，0.0 到 1.0
默认值：0.0

top_a 仅考虑概率“足够高”的 top tokens，该概率基于最可能的 token 概率。可以将其视为一个动态的 Top-P。较低的 Top-A 值会根据概率最高的 token 集中选择，但范围会更窄。较高的 Top-A 值不一定会影响输出的创造性，但会根据最大概率优化过滤过程。

种子

参数：seed
可选，int

如果指定了 seed 参数，推理将确定性地进行采样，即使用相同种子和参数的重复请求应该返回相同的结果。某些模型无法保证确定性。

最大 tokens 数

参数：max_tokens
可选，int，>= 1

max_tokens 可设定模型在响应中可以生成的 token 数量的上限。模型不会生成超过此限制的 token。其最大值等于上下文长度减去 prompt 长度。

Logit Bias

参数：logit_bias
可选，object

logit_bias 是一个可选参数，用于修改指定 token 在模型生成输出中出现的可能性。

对数概率

参数：logprobs
可选，boolean

logprobs 设置是否返回输出 token 的对数概率。如果为 true，则返回每个输出 token 的对数概率。

最高对数概率

参数：top_logprobs
可选，int

top_logprobs 是一个介于 0 和 20 之间的整数，指定在每个 token 位置要返回的最可能 token 的数量，每个 token 都会带有相应的对数概率。如果使用此参数，则必须将 logprobs 设置为 true。

响应格式

参数：response_format
可选，object

response_format 强制模型产出特定的输出格式。将其设置为 { "type": "json_object" } 可启用 JSON 模式，保证模型生成的消息为有效的 JSON。

注意：使用 JSON 模式时，应同时通过 system 或 user 提示词指示模型生成 JSON。

结构化输出

参数：structured_outputs
可选，boolean

指示模型是否能够使用 response_format 中的 json_schema 返回结构化输出。

停止

参数：stop
可选，array

如果模型遇到 stop 数组中指定的任意 token，则立即停止生成。

工具

参数：tools
可选，array

工具调用参数，遵循 OpenAI 的工具调用请求格式。对于非 OpenAI 提供者，会相应地进行转换。

工具选择

参数：tool_choice
可选，array

控制模型调用哪个工具。'none' 表示模型不会调用任何工具，而是生成一条消息。'auto' 表示模型可以在生成消息或调用一个或多个工具之间进行选择。'required' 表示模型必须调用一个或多个工具。通过 {"type": "function", "function": {"name": "my_function"}} 指定特定工具会强制模型调用该工具。

并行工具调用

参数：parallel_tool_calls
可选，boolean
默认：true

是否在使用工具时启用并行函数调用。如果为 true，模型可以同时调用多个函数。如果为 false，函数将按顺序依次调用。

冗长程度

参数：verbosity
可选，enum，low medium high
默认：medium

控制模型响应的冗长程度和长度。较低的值会生成更简洁的回答，而较高的值会生成更详细、更全面的回答。

以上文档为标准版 API 接口文档，可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求，需要定制开发 API 接口，请联系我们的 IT 技术支持工程师：

（沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅）

最受关注模型

2026-03-18

Embedding Models

2026-04-20

Kimi K2.6 API 接口、模型参数 & 代码示例

Kimi K2.6 模型介绍：

API 接口地址：

Chat Completions API:

请求方法：

各编程语言代码示例：

各 AI 产品/工具/第三方应用接入示例：

API 响应示例（curl）：

可选参数：

🔗温度（Temperature）

🔗Top-P

🔗Top-K

🔗频率惩罚

🔗存在惩罚

🔗重复惩罚

🔗Min-P

🔗Top-A

🔗种子

🔗最大 tokens 数

🔗Logit Bias

🔗对数概率

🔗最高对数概率

🔗响应格式

🔗结构化输出

🔗停止

🔗工具

🔗工具选择

🔗并行工具调用

🔗冗长程度

最受关注模型

MiniMax M2.7

Qwen 3.6 Plus

Doubao Seed 2.0 Code

GLM 5

Doubao Seed 2.0 Pro

Step 3.5 Flash

DeepSeek OCR 2

MiMo V2 Pro

Qwen3 Coder Next

Qwen3.5 27B

最新发布模型

Kimi K2.6

GLM Embedding 3

GLM 5.1

Qwen 3.6 Plus

DeepSeek OCR 2

KAT Coder Pro V2

MiMo V2 Omni

MiMo V2 Pro

MiniMax M2.7

GLM 5 Turbo

Embedding Models

GLM Embedding 3

Qwen3 Embedding 8B

Doubao Embedding Large Text 250515

Qwen Text Embedding V4

Qwen Text Embedding V1

Qwen Text Embedding V2

Doubao Embedding Large

Doubao Embedding

Qwen Text Embedding V3

Hunyuan Embedding

温度（Temperature）

Top-P

Top-K

频率惩罚

存在惩罚

重复惩罚

Min-P

Top-A

种子

最大 tokens 数

Logit Bias

对数概率

最高对数概率

响应格式

结构化输出

停止

工具

工具选择

并行工具调用

冗长程度