AI 图片生成(文生图)大模型 API 接口

文生图模型是基于视觉大模型的新一代 AI 技术,模型可对用户输入的自然语言进行精准理解,生成更符合语义、审美特性和创造力的不限风格的优质图像,以较低的创作成本帮助企业或创作者降低内容生产成本、激发创意。用户只需输入自然语言指令,模型就能精准的生成图片,实现高度个性化的图像创作和优化。


此文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请联系我们的 IT 技术支持工程师:

详细信息 定制开发服务流程:沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅

接口地址

POST https://wcode.net/api/vision/gpt/text-to-image/v3/generate

快速开始

(注:以下请求示例中的 API_KEY 需要替换后再发起请求。 获取 API_KEY 入口:https://wcode.net/get-apikey

请求示例 1(wanx2.1-t2i-plus模型)

curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "wanx2.1-t2i-plus",
    "width": 1024,
    "height": 1024
}'

wanx2.1-t2i-plus模型效果预览:

prompt: 生成一张“哈士奇拉雪橇”的图片
AI 图片生成(文生图)大模型 API 接口

请求示例 2(general_v2.1_L模型)

curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "general_v2.1_L",
    "width": 512,
    "height": 512
}'

general_v2.1_L模型效果预览:

prompt: 生成一张“哈士奇拉雪橇”的图片
AI 图片生成(文生图)大模型 API 接口

计费方式

按调用次数计费,费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao

请求方法

POST

请求头(Request Headers)

Header 备注 示例 相关链接
Authorization Bearer API_KEY 格式:Bearer + 空格 + API_KEY Bearer sk-..... 获取 API_KEY 入口:https://wcode.net/get-apikey
Content-Type application/json 固定为 application/json

请求参数

🚀 prompt | ✅️必填 | string | 用于生成图像的提示词,内容尽可能简洁明确,支持中英文输入。示例:生成一张“哈士奇拉雪橇”的图片

💡prompt 中用引号进行重点内容强调,生成的准确率会更高。


🚀 model | 选填 | string | 默认值 general_v2.1_L | 模型ID

模型ID 价格(元/次) 模型说明
wanx2.1-t2i-turbo 0.175 通义文生图2.1-Turbo,更快的生成速度,在图像美观度、真实感、艺术性上全面升级,更强的语义理解能力、丰富的风格泛化性、支持最大200万像素生成,支持智能提示词改写等。
wanx2.1-t2i-plus 0.25 通义文生图2.1-Plus,更丰富的画面细节,在图像美观度、真实感、艺术性上全面升级,更强的语义理解能力、丰富的风格泛化性、支持最大200万像素生成,支持智能提示词改写等。
wan2.2-t2i-plus 0.25 万相2.2专业版,在创意性、稳定性、写实质感上全面升级。
wan2.2-t2i-flash 0.175 万相2.2极速版,在创意性、稳定性、写实质感上全面升级。
wan2.5-t2i-preview 0.25 (推荐)万相2.5 preview,取消单边限制,在总像素面积与宽高比约束内,自由选尺寸。
wan2.6-t2i 0.25 (推荐)万相2.6,同时支持在总像素面积与宽高比约束内,自由选尺寸。
general_v2.1_L 0.25 通用 2.1 模型是一种支持中文和英文的双语模型,在图像文本对齐和美学方面具有显著改进。

🚀 width | 选填 | int | 生成图像的宽(比例值)

  • general_v2.x 系列模型:宽度默认值 512,宽度取值范围:[256, 768]
  • wanx2.x/wan2.x 系列模型:宽度默认值 1024,宽度取值范围:[768, 1440]

🚀 height | 选填 | int | 生成图像的高(比例值)

  • general_v2.x 系列模型:高度默认值 512,高度取值范围:[256, 768]
  • wanx2.x/wan2.x 系列模型:高度默认值 1024,高度取值范围:[768, 1440]

💡对于 general_v2.x 模型,为确保生成图片的效果,推荐宽高比例值如下:

  • 1:1 对应宽高 512*512
  • 4:3 对应宽高 512*384
  • 3:4 对应宽高 384*512
  • 3:2 对应宽高 512*341
  • 2:3 对应宽高 341*512
  • 16:9 对应宽高 512*288
  • 9:16 对应宽高 288*512

返回参数

不同模型返回参数可能存在差异,请以实际返回为准。

返回参数 数据类型 说明
status string 请求成功返回success,失败返回failed
error_message string 接口返回的错误消息。当statussuccess时,error_message为空字符串
error_code int 或 null 接口返回的错误码。当statussuccess时,error_codenull
data object 或 null 接口返回的数据。当statusfailed时,datanull
data.image_urls array 生成的图片链接列表(链接有效期为 15 分钟,开发者需尽快下载保存)
data.gpt_result string 模型输出的描述
data.time_elapsed string 生成图片所用的时长
data.usage object 本次调用的费用信息
data.usage.total_cost float 本次调用产生的费用
data.api_version string 当前所使用的 API 的版本,免费版为free,付费版为paid
data.api_docs string 当前所使用的 API 的文档链接

响应头(Response Headers)

Header 说明 示例 相关链接
X-Account-Balance API_KEY 余额(元) 123.0123 API_KEY 费用充值入口:https://wcode.net/apikey-recharge

Python 代码示例(Requests)

import requests
import json

url = "https://wcode.net/api/vision/gpt/text-to-image/v3/generate"

payload = json.dumps({
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "general_v2.1_L",
    "width": 512,
    "height": 512
})
headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

...其他编程语言可参考下方 curl http 请求示例进行调用

请求示例 1(使用 general_v2.1_L 模型)

curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "general_v2.1_L",
    "width": 512,
    "height": 512
}'

响应示例 1

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "image_urls": [
            "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/husky_pulling_a_sled.jpg"     // 有效期 15 分钟,开发者需尽快下载保存至本地
        ],
        "gpt_result": "动物摄影风格,仰视视角,“哈士奇拉雪橇”为主题,两只哈士奇拉着雪橇在雪地上奔跑,周围是厚厚的积雪和树木;电影剧照风格,冷色调,蓝白色系,动态模糊。",
        "time_elapsed": "7.451577025s",
        "api_usage": {
            "total_cost": 0.23,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        }
    }
}

请求示例 2(使用 wanx2.1-t2i-plus 模型)

curl --request POST 'https://wcode.net/api/vision/gpt/text-to-image/v3/generate' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "prompt": "生成一张“哈士奇拉雪橇”的图片",
    "model": "wanx2.1-t2i-plus",
    "width": 1024,
    "height": 1024
}'

响应示例 2

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "image_urls": [
            "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/husky_pulling_a_sled_2.png"     // 有效期 15 分钟,开发者需尽快下载保存至本地
        ],
        "gpt_result": "写实摄影风格,一只哈士奇拉着雪橇在雪地里奔跑。哈士奇毛色为黑白相间,眼神坚定,嘴角微张露出舌头。雪橇上覆盖着一层薄雪,背景是广袤的雪原和远处的雪山。高清写实摄影,远景俯视构图。",
        "time_elapsed": "13s",
        "api_usage": {
            "total_cost": 0.25,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        }
    }
}



以上文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请扫码联系我们的 IT 技术支持工程师:

(沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅)

最受关注模型

Doubao Seed 2.0 Code

代码补全、深度思考

GLM 5

文本生成、深度思考、代码补全

Step 3.5 Flash

文本生成、代码补全、深度思考

MiniMax M2.7

文本生成、深度思考、专业能力

Qwen3 Coder Next

文本生成、深度思考、代码补全

Qwen3.5 27B

深度思考、视觉理解、文本生成

Qwen3.5 35B A3B

深度思考、视觉理解、文本生成

Doubao Seed 2.0 Pro

文本生成、深度思考、多模态

Qwen 3.5 Plus

文本生成、深度思考、多模态

Doubao Seed 1.8

多模态、深度思考

最新发布模型

MiMo V2 Omni

文本生成、深度思考、多模态

MiMo V2 Pro

文本生成、深度思考

MiniMax M2.7

文本生成、深度思考、专业能力

GLM 5 Turbo

文本生成、深度思考、OpenClaw优化

Qwen3.5 9B

文本生成、多模态

Qwen3.5 35B A3B

深度思考、视觉理解、文本生成

Qwen3.5 27B

深度思考、视觉理解、文本生成

Qwen3.5 Flash

深度思考

Qwen3.5 122B A10B

深度思考、视觉理解、文本生成

Qwen3.5 397B A17B

文本生成、深度思考、多模态