AI 语音合成(TTS)大模型 API 接口

通过我们的 AI 语音合成(TTS)大模型 API 接口,您可以轻松将文本转化为自然流畅的语音素材。接口基于最新的深度学习技术,支持多种语言和语音风格,音质清晰、语音自然,广泛应用于智能客服、导航系统、播报服务、语音助手等场景。

接口地址

POST https://wcode.net/api/audio/gpt/text-to-audio/v3/transcription

快速开始

(注:以下请求示例中的 API_KEY 需要替换后再发起请求。 获取 API_KEY 入口:https://wcode.net/get-apikey

请求示例(cosyvoice-v1模型)

curl --request POST 'https://wcode.net/api/audio/gpt/text-to-audio/v3/transcription' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "model": "cosyvoice-v1",
    "text": "你好,这里是万码云开发平台技术研发中心。"
}'

计费方式

按调用次数计费,费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao

模型ID 价格(元/千字符) 模型说明
cosyvoice-v1 0.3 CosyVoice-v1 深度融合文本理解和语音生成的新一代生成式TTS语音合成大模型。

请求方法

POST

请求头(Request Headers)

Header 备注 示例 相关链接
Authorization Bearer API_KEY 格式:Bearer + 空格 + API_KEY Bearer sk-..... 获取 API_KEY 入口:https://wcode.net/get-apikey
Content-Type application/json 固定为 application/json

请求参数

🚀 model | ✅️必填 | string | 模型ID

模型ID 价格(元/千字符) 模型说明
cosyvoice-v1 0.3 CosyVoice-v1 深度融合文本理解和语音生成的新一代生成式TTS语音合成大模型。

🚀 text | ✅️必填 | string | 需要进行语音合成的文本内容。示例:你好,请介绍一下 TTS 语音合成模型


🚀 timbre | 选填 | string | 语音合成的音色,音色支持列表如下:

音色ID 支持语言 默认采样率(Hz) 默认音频格式
longxiaochun 中文+英文 22050 mp3
longxiaocheng 中文+英文 22050 mp3
longjielidou 中文+英文 22050 mp3
loongstella 中文+英文 22050 mp3

返回参数

不同模型返回参数可能存在差异,请以实际返回为准。

返回参数 数据类型 说明
status string 请求成功返回success,失败返回failed
error_message string 接口返回的错误消息。当statussuccess时,error_message为空字符串
error_code int 或 null 接口返回的错误码。当statussuccess时,error_codenull
data object 或 null 接口返回的数据。当statusfailed时,datanull
data.result.audio_file_temp_url string 语音合成文件临时 URL,有效期 3 分钟,开发者需尽快下载保存至本地
data.result.audio_file_filesize int 或 null 语音合成文件大小
data.result.audio_file_playtime_seconds float 或 null 语音合成文件播放时长(单位:秒)
data.result.audio_file_playtime_string string 或 null 语音合成文件播放时长(时间格式)
data.result.audio_file_bitrate int 或 null 语音合成文件比特率
data.result.audio_file_sample_rate int 或 null 语音合成文件采样率
data.usage object 本次调用的费用信息
data.usage.total_cost float 本次调用产生的费用
data.api_version string 当前所使用的 API 的版本,免费版为free,付费版为paid
data.api_docs string 当前所使用的 API 的文档链接

响应头(Response Headers)

Header 说明 示例 相关链接
X-Account-Balance API_KEY 余额(元) 123.0165 API_KEY 费用充值入口:https://wcode.net/apikey-recharge

Python 代码示例(Requests)

import requests
import json

url = "https://wcode.net/api/audio/gpt/text-to-audio/v3/transcription"

payload = json.dumps({
    "model": "cosyvoice-v1",
    "text": "你好,这里是万码云开发平台技术研发中心。"
})
headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

...其他编程语言可参考下方 curl http 请求示例进行调用

请求示例 1(使用 cosyvoice-v1 模型)

curl --request POST 'https://wcode.net/api/audio/gpt/text-to-audio/v3/transcription' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "model": "cosyvoice-v1",
    "text": "你好,这里是万码云开发平台技术研发中心。"
}'

响应示例 1

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "result": {
            "audio_file_temp_url": "https://wcode.net/tmp/tts-1740635350-TIgoVyzMS4eZ33qt.mp3", // 有效期 3 分钟,开发者需尽快下载保存至本地
            "audio_file_filesize": 63574,
            "audio_file_playtime_seconds": 3.9705625,
            "audio_file_playtime_string": "0:04",
            "audio_file_bitrate": 128000,
            "audio_file_sample_rate": 22050
        },
        "api_usage": {
            "total_cost": 0.006,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        },
        "api_version": "paid"
    }
}