AI 图片生成(文生图)大模型 API 接口
文生图模型是基于视觉大模型的新一代 AI 技术,模型可对用户输入的自然语言进行精准理解,生成更符合语义、审美特性和创造力的不限风格的优质图像,以较低的创作成本帮助企业或创作者降低内容生产成本、激发创意。用户只需输入自然语言指令,模型就能精准的生成图片,实现高度个性化的图像创作和优化。
接口地址
POST https://wcode.net/api/vision/gpt/text-to-image/v3/generate
快速开始
(注:以下请求示例中的 API_KEY
需要替换后再发起请求。 获取 API_KEY
入口:https://wcode.net/get-apikey)
请求示例 1(wanx2.1-t2i-plus模型)
curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
"prompt": "生成一张“哈士奇拉雪橇”的图片",
"model": "wanx2.1-t2i-plus",
"width": 1024,
"height": 1024
}'
wanx2.1-t2i-plus
模型效果预览:
prompt: 生成一张“哈士奇拉雪橇”的图片 |
---|
![]() |
请求示例 2(general_v2.1_L模型)
curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
"prompt": "生成一张“哈士奇拉雪橇”的图片",
"model": "general_v2.1_L",
"width": 512,
"height": 512
}'
general_v2.1_L
模型效果预览:
prompt: 生成一张“哈士奇拉雪橇”的图片 |
---|
![]() |
计费方式
按调用次数计费,费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao
请求方法
POST
请求头(Request Headers)
Header | 值 | 备注 | 示例 | 相关链接 |
---|---|---|---|---|
Authorization | Bearer API_KEY |
格式:Bearer + 空格 + API_KEY | Bearer sk-..... |
获取 API_KEY 入口:https://wcode.net/get-apikey |
Content-Type | application/json |
固定为 application/json |
请求参数
🚀 prompt
| ✅️必填 | string
| 用于生成图像的提示词,内容尽可能简洁明确,支持中英文输入。示例:生成一张“哈士奇拉雪橇”的图片
💡prompt 中用引号进行重点内容强调,生成的准确率会更高。
🚀 model
| 选填 | string
| 默认值 general_v2.1_L
| 模型ID
模型ID | 价格(元/次) | 模型说明 |
---|---|---|
wanx2.1-t2i-turbo | 0.175 | 通义文生图2.1-Turbo,更快的生成速度,在图像美观度、真实感、艺术性上全面升级,更强的语义理解能力、丰富的风格泛化性、支持最大200万像素生成,支持智能提示词改写等。 |
wanx2.1-t2i-plus | 0.25 | 通义文生图2.1-Plus,更丰富的画面细节,在图像美观度、真实感、艺术性上全面升级,更强的语义理解能力、丰富的风格泛化性、支持最大200万像素生成,支持智能提示词改写等。 |
general_v2.1_L | 0.25 | 通用 2.1 模型是一种支持中文和英文的双语模型,在图像文本对齐和美学方面具有显著改进。 |
🚀 width
| 选填 | int
| 生成图像的宽(比例值)
- general_v2.x 系列模型:宽度默认值
512
,宽度取值范围:[256, 768]
- wanx2.x 系列模型:宽度默认值
1024
,宽度取值范围:[768, 1440]
🚀 height
| 选填 | int
| 生成图像的高(比例值)
- general_v2.x 系列模型:高度默认值
512
,高度取值范围:[256, 768]
- wanx2.x 系列模型:高度默认值
1024
,高度取值范围:[768, 1440]
💡对于 general_v2.x 模型,为确保生成图片的效果,推荐宽高比例值如下:
- 1:1 对应宽高 512*512
- 4:3 对应宽高 512*384
- 3:4 对应宽高 384*512
- 3:2 对应宽高 512*341
- 2:3 对应宽高 341*512
- 16:9 对应宽高 512*288
- 9:16 对应宽高 288*512
返回参数
不同模型返回参数可能存在差异,请以实际返回为准。
返回参数 | 数据类型 | 说明 |
---|---|---|
status | string | 请求成功返回success ,失败返回failed |
error_message | string | 接口返回的错误消息。当status 为success 时,error_message 为空字符串 |
error_code | int 或 null | 接口返回的错误码。当status 为success 时,error_code 为 null |
data | object 或 null | 接口返回的数据。当status 为failed 时,data 为 null |
data.image_urls | array | 生成的图片链接列表(链接有效期为 15 分钟,开发者需尽快下载保存) |
data.gpt_result | string | 模型输出的描述 |
data.time_elapsed | string | 生成图片所用的时长 |
data.usage | object | 本次调用的费用信息 |
data.usage.total_cost | float | 本次调用产生的费用 |
data.api_version | string | 当前所使用的 API 的版本,免费版为free ,付费版为paid |
data.api_docs | string | 当前所使用的 API 的文档链接 |
响应头(Response Headers)
Header | 说明 | 示例 | 相关链接 |
---|---|---|---|
X-Account-Balance | API_KEY 余额(元) | 0.0001 |
API_KEY 费用充值入口:https://wcode.net/apikey-recharge |
Python 代码示例(Requests)
import requests
import json
url = "https://wcode.net/api/vision/gpt/text-to-image/v3/generate"
payload = json.dumps({
"prompt": "生成一张“哈士奇拉雪橇”的图片",
"model": "general_v2.1_L",
"width": 512,
"height": 512
})
headers = {
'Content-Type': 'application/json',
'Authorization': 'Bearer API_KEY' # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}
response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)
...其他编程语言可参考下方 curl http 请求示例进行调用
请求示例 1(使用 general_v2.1_L 模型)
curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
"prompt": "生成一张“哈士奇拉雪橇”的图片",
"model": "general_v2.1_L",
"width": 512,
"height": 512
}'
响应示例 1
{
"status": "success",
"error_message": "",
"error_code": null,
"data": {
"image_urls": [
"https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/husky_pulling_a_sled.jpg" // 有效期 15 分钟,开发者需尽快下载保存至本地
],
"gpt_result": "动物摄影风格,仰视视角,“哈士奇拉雪橇”为主题,两只哈士奇拉着雪橇在雪地上奔跑,周围是厚厚的积雪和树木;电影剧照风格,冷色调,蓝白色系,动态模糊。",
"time_elapsed": "7.451577025s",
"api_usage": {
"total_cost": 0.23,
"total_cost_currency": "CNY",
"total_cost_currency_symbol": "¥"
}
}
}
请求示例 2(使用 wanx2.1-t2i-plus 模型)
curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
"prompt": "生成一张“哈士奇拉雪橇”的图片",
"model": "wanx2.1-t2i-plus",
"width": 1024,
"height": 1024
}'
响应示例 2
{
"status": "success",
"error_message": "",
"error_code": null,
"data": {
"image_urls": [
"https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/husky_pulling_a_sled_2.png" // 有效期 15 分钟,开发者需尽快下载保存至本地
],
"gpt_result": "写实摄影风格,一只哈士奇拉着雪橇在雪地里奔跑。哈士奇毛色为黑白相间,眼神坚定,嘴角微张露出舌头。雪橇上覆盖着一层薄雪,背景是广袤的雪原和远处的雪山。高清写实摄影,远景俯视构图。",
"time_elapsed": "13s",
"api_usage": {
"total_cost": 0.25,
"total_cost_currency": "CNY",
"total_cost_currency_symbol": "¥"
}
}
}