AI 图片生成(文生图)大模型 API 接口

文生图模型是基于视觉大模型的新一代 AI 技术,模型可对用户输入的自然语言进行精准理解,生成更符合语义、审美特性和创造力的不限风格的优质图像,以较低的创作成本帮助企业或创作者降低内容生产成本、激发创意。用户只需输入自然语言指令,模型就能精准的生成图片,实现高度个性化的图像创作和优化。

接口地址

POST https://wcode.net/api/vision/gpt/text-to-image/v3/generate

快速开始

(注:以下请求示例中的 API_KEY 需要替换后再发起请求。 获取 API_KEY 入口:https://wcode.net/get-apikey

请求示例 1(wanx2.1-t2i-plus模型)

curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "wanx2.1-t2i-plus",
    "width": 1024,
    "height": 1024
}'

wanx2.1-t2i-plus模型效果预览:

prompt: 生成一张“哈士奇拉雪橇”的图片
AI 图片生成(文生图)大模型 API 接口

请求示例 2(general_v2.1_L模型)

curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "general_v2.1_L",
    "width": 512,
    "height": 512
}'

general_v2.1_L模型效果预览:

prompt: 生成一张“哈士奇拉雪橇”的图片
AI 图片生成(文生图)大模型 API 接口

计费方式

按调用次数计费,费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao

请求方法

POST

请求头(Request Headers)

Header 备注 示例 相关链接
Authorization Bearer API_KEY 格式:Bearer + 空格 + API_KEY Bearer sk-..... 获取 API_KEY 入口:https://wcode.net/get-apikey
Content-Type application/json 固定为 application/json

请求参数

🚀 prompt | ✅️必填 | string | 用于生成图像的提示词,内容尽可能简洁明确,支持中英文输入。示例:生成一张“哈士奇拉雪橇”的图片

💡prompt 中用引号进行重点内容强调,生成的准确率会更高。


🚀 model | 选填 | string | 默认值 general_v2.1_L | 模型ID

模型ID 价格(元/次) 模型说明
wanx2.1-t2i-turbo 0.175 通义文生图2.1-Turbo,更快的生成速度,在图像美观度、真实感、艺术性上全面升级,更强的语义理解能力、丰富的风格泛化性、支持最大200万像素生成,支持智能提示词改写等。
wanx2.1-t2i-plus 0.25 通义文生图2.1-Plus,更丰富的画面细节,在图像美观度、真实感、艺术性上全面升级,更强的语义理解能力、丰富的风格泛化性、支持最大200万像素生成,支持智能提示词改写等。
general_v2.1_L 0.25 通用 2.1 模型是一种支持中文和英文的双语模型,在图像文本对齐和美学方面具有显著改进。

🚀 width | 选填 | int | 生成图像的宽(比例值)

  • general_v2.x 系列模型:宽度默认值 512,宽度取值范围:[256, 768]
  • wanx2.x 系列模型:宽度默认值 1024,宽度取值范围:[768, 1440]

🚀 height | 选填 | int | 生成图像的高(比例值)

  • general_v2.x 系列模型:高度默认值 512,高度取值范围:[256, 768]
  • wanx2.x 系列模型:高度默认值 1024,高度取值范围:[768, 1440]

💡对于 general_v2.x 模型,为确保生成图片的效果,推荐宽高比例值如下:

  • 1:1 对应宽高 512*512
  • 4:3 对应宽高 512*384
  • 3:4 对应宽高 384*512
  • 3:2 对应宽高 512*341
  • 2:3 对应宽高 341*512
  • 16:9 对应宽高 512*288
  • 9:16 对应宽高 288*512

返回参数

不同模型返回参数可能存在差异,请以实际返回为准。

返回参数 数据类型 说明
status string 请求成功返回success,失败返回failed
error_message string 接口返回的错误消息。当statussuccess时,error_message为空字符串
error_code int 或 null 接口返回的错误码。当statussuccess时,error_codenull
data object 或 null 接口返回的数据。当statusfailed时,datanull
data.image_urls array 生成的图片链接列表(链接有效期为 15 分钟,开发者需尽快下载保存)
data.gpt_result string 模型输出的描述
data.time_elapsed string 生成图片所用的时长
data.usage object 本次调用的费用信息
data.usage.total_cost float 本次调用产生的费用
data.api_version string 当前所使用的 API 的版本,免费版为free,付费版为paid
data.api_docs string 当前所使用的 API 的文档链接

响应头(Response Headers)

Header 说明 示例 相关链接
X-Account-Balance API_KEY 余额(元) 0.0001 API_KEY 费用充值入口:https://wcode.net/apikey-recharge

Python 代码示例(Requests)

import requests
import json

url = "https://wcode.net/api/vision/gpt/text-to-image/v3/generate"

payload = json.dumps({
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "general_v2.1_L",
    "width": 512,
    "height": 512
})
headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

...其他编程语言可参考下方 curl http 请求示例进行调用

请求示例 1(使用 general_v2.1_L 模型)

curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "general_v2.1_L",
    "width": 512,
    "height": 512
}'

响应示例 1

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "image_urls": [
            "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/husky_pulling_a_sled.jpg"     // 有效期 15 分钟,开发者需尽快下载保存至本地
        ],
        "gpt_result": "动物摄影风格,仰视视角,“哈士奇拉雪橇”为主题,两只哈士奇拉着雪橇在雪地上奔跑,周围是厚厚的积雪和树木;电影剧照风格,冷色调,蓝白色系,动态模糊。",
        "time_elapsed": "7.451577025s",
        "api_usage": {
            "total_cost": 0.23,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        }
    }
}

请求示例 2(使用 wanx2.1-t2i-plus 模型)

curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "wanx2.1-t2i-plus",
    "width": 1024,
    "height": 1024
}'

响应示例 2

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "image_urls": [
            "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/husky_pulling_a_sled_2.png"     // 有效期 15 分钟,开发者需尽快下载保存至本地
        ],
        "gpt_result": "写实摄影风格,一只哈士奇拉着雪橇在雪地里奔跑。哈士奇毛色为黑白相间,眼神坚定,嘴角微张露出舌头。雪橇上覆盖着一层薄雪,背景是广袤的雪原和远处的雪山。高清写实摄影,远景俯视构图。",
        "time_elapsed": "13s",
        "api_usage": {
            "total_cost": 0.25,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        }
    }
}