AI 语音识别(ASR)大模型 API 接口

通过我们的 AI 语音识别大模型 API 接口,您可以轻松将音频转化为高精度文本。接口采用先进的深度学习技术,支持多语言、多场景语音识别,准确率高,响应速度快,适用于会议记录、语音助手、客户服务、视频转写等各类应用。无论是实时语音转写还是批量处理,均能提供稳定、灵活的服务。立即接入我们的 ASR API,提升您的智能语音体验。


此文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请联系我们的 IT 技术支持工程师:

详细信息 定制开发服务流程:沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅

接口地址

POST https://wcode.net/api/audio/gpt/audio-to-text/v3/transcription

快速开始

(注:以下请求示例中的 API_KEY 需要替换后再发起请求。 获取 API_KEY 入口:https://wcode.net/get-apikey

请求示例 1(调用 paraformer-v2 模型识别音频文件 URL)

curl --request POST 'https://wcode.net/api/audio/gpt/audio-to-text/v3/transcription' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "file": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/hello.mp3",
    "model": "paraformer-v2"
}'

请求示例 2(调用 paraformer-v2 模型识别本地音频文件)

curl --request POST 'https://wcode.net/api/audio/gpt/audio-to-text/v3/transcription' \
  --header "Authorization: Bearer API_KEY" \
  --header 'Content-Type: multipart/form-data' \
  --form file=@/path/to/file/audio.mp3 \
  --form model=paraformer-v2

计费方式

按调用次数计费,费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao

模型 ID 价格(元/小时) 模型说明
paraformer-v2 0.63 Paraformer-v2 语音识别模型,由通义实验室研发,支持多个语种的语音识别。
doubao-seedasr-auc-v1 3.25 豆包 Doubao-seedasr-auc-v1 语音识别模型,高准确率,支持多个语种的语音识别。

请求方法

POST

请求头(Request Headers)

Header 备注 示例 相关链接
Authorization Bearer API_KEY 格式:Bearer + 空格 + API_KEY Bearer sk-..... 获取 API_KEY 入口:https://wcode.net/get-apikey
Content-Type application/jsonmultipart/form-data

请求参数

🚀 model | ✅️必填 | string | 语音识别模型 ID

模型 ID 价格(元/小时) 模型说明
paraformer-v2 0.63 Paraformer-v2 语音识别模型,由通义实验室研发,支持多个语种的语音识别。
doubao-seedasr-auc-v1 3.25 豆包 Doubao-seedasr-auc-v1 语音识别模型,高准确率,支持多个语种的语音识别。

🚀 file | ✅️必填 | string | 需要进行识别的语音文件,支持 URL 链接和本地文件,具体如下:

  • URL 链接,需支持公网访问。示例:https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/hello.mp3
  • 本地文件,请求的 Content-Type 必须是 multipart/form-data 类型,示例如下:
curl --request POST 'https://wcode.net/api/audio/gpt/audio-to-text/v3/transcription' \
  --header "Authorization: Bearer API_KEY" \
  --header 'Content-Type: multipart/form-data' \
  --form file=@/path/to/file/audio.mp3 \
  --form model=doubao-seedasr-auc-v1

🚀 file_format | 如调用豆包(doubao-*)系列模型,且语音文件为 URL 链接时,此参数必填,其他情况选填 | string | 需要进行识别的语音文件的格式,可选值:raw | wav | mp3 | ogg。示例:mp3

返回参数

不同模型返回参数可能存在差异,请以实际返回为准。

返回参数 数据类型 说明
status string 请求成功返回success,失败返回failed
error_message string 接口返回的错误消息。当statussuccess时,error_message为空字符串
error_code int 或 null 接口返回的错误码。当statussuccess时,error_codenull
data object 或 null 接口返回的数据。当statusfailed时,datanull
data.result.text string 语音识别结果
data.usage object 本次调用的费用信息
data.usage.total_cost float 本次调用产生的费用
data.api_version string 当前所使用的 API 的版本,免费版为free,付费版为paid
data.api_docs string 当前所使用的 API 的文档链接

响应头(Response Headers)

Header 说明 示例 相关链接
X-Account-Balance API_KEY 余额(元) 123.0123 API_KEY 费用充值入口:https://wcode.net/apikey-recharge

Python 代码示例(Requests,paraformer-v2)

import requests
import json

url = "https://wcode.net/api/audio/gpt/audio-to-text/v3/transcription"

payload = json.dumps({
    "file": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/hello.mp3",
    "model": "paraformer-v2"
})
headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

...其他编程语言可参考下方 curl http 请求示例进行调用

请求示例 1(使用 paraformer-v2 模型)

curl --request POST 'https://wcode.net/api/audio/gpt/audio-to-text/v3/transcription' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "file": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/hello.mp3",
    "model": "paraformer-v2"
}'

响应示例 1

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "result": {
            "text": "您好,这里是万码云开发平台技术研发中心。"
        },
        "api_usage": {
            "total_cost": 0.0007,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        },
        "api_version": "paid"
    }
}

请求示例 2(使用 doubao-seedasr-auc-v1 模型)

curl --request POST 'https://wcode.net/api/audio/gpt/audio-to-text/v3/transcription' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "model": "doubao-seedasr-auc-v1",
    "file": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/hello.mp3",
    "file_format": "mp3"                                                       // 调用豆包(doubao-*)系列模型,此参数必填
}'

响应示例 2

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "result": {
            "text": "你好,这里是万码云开发平台技术研发中心。"
        },
        "api_usage": {
            "total_cost": 0.0037,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        },
        "api_version": "paid"
    }
}



以上文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请扫码联系我们的 IT 技术支持工程师:

(沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅)

最受关注模型

GLM 4.7

文本生成、深度思考

MiniMax M2.1

文本生成、深度思考

Doubao Seed 2.0 Code

代码补全、深度思考

GLM 5

文本生成、深度思考、代码补全

Qwen3 Coder Next

文本生成、深度思考、代码补全

Step 3.5 Flash

文本生成、代码补全、深度思考

Qwen3.5 27B

深度思考、视觉理解、文本生成

Qwen3.5 35B A3B

深度思考、视觉理解、文本生成

Doubao Seed 1.8

多模态、深度思考

Qwen3.5 397B A17B

文本生成、深度思考、多模态

最新发布模型

Qwen3.5 9B

文本生成、多模态

Qwen3.5 35B A3B

深度思考、视觉理解、文本生成

Qwen3.5 27B

深度思考、视觉理解、文本生成

Qwen3.5 Flash

深度思考

Qwen3.5 122B A10B

深度思考、视觉理解、文本生成

Qwen3.5 397B A17B

文本生成、深度思考、多模态

Doubao Seed 2.0 Mini

文本生成、深度思考、多模态

Doubao Seed 2.0 Code

代码补全、深度思考

Qwen 3.5 Plus

文本生成、深度思考、多模态

Doubao Seed 2.0 Pro

文本生成、深度思考、多模态