AI 图片编辑(基于 Diffusion 模型)API 接口

AI 图片编辑是一种基于视觉大模型的通过 prompt 提示词方式编辑图片的技术。模型通过渐进式技术对齐图像生成器与图像编辑器,实现了以最佳方式平衡图像重建和图像生成。用户只需输入自然语言指令,就能精准地编辑图片,实现高度个性化的图像创作和优化。


此文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请联系我们的 IT 技术支持工程师:

详细信息 定制开发服务流程:沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅

接口地址

POST https://wcode.net/api/vision/gpt/cvse/v2/transform

快速开始(请求示例)

(注:以下请求示例中的 API_KEY 需要替换后再发起请求。 获取 API_KEY 入口:https://wcode.net/get-apikey

curl --request POST 'https://wcode.net/api/vision/gpt/cvse/v2/transform' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
   "model": "doubao-vision",
   "image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
   "prompt":"把草坪换成沙滩"
}'

效果预览:

原图 AI 编辑后的图片
原图 AI 编辑后的图片

计费方式

按调用次数计费:0.23 元/次,费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao

请求方法

POST

请求头(Request Headers)

Header 备注 示例 相关链接
Authorization Bearer API_KEY 格式:Bearer + 空格 + API_KEY Bearer sk-..... 获取 API_KEY 入口:https://wcode.net/get-apikey
Content-Type application/json 固定为 application/json

请求参数

🚀 model | ✅️必填 | string | 当前可选模型为 doubao-vision


🚀 image_url | ✅️必填 | string | 要转换的图片 URL,需支持公网访问。图片格式:jpg、jpeg、png 等常见格式,推荐使用 jpg 格式。

注意事项:

  1. image_url 需支持公网访问;
  2. image_url 对应的图片大小不超过 4.5 MB,尺寸不超过 3072*3072
  3. 调用 API 时,接口服务端会向 image_url 发起请求,请求的 User-agent 为:
    Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; WCodeNET/2.1; +https://wcode.net/vision-llm-image-transform-api
    请确保此 User-agent 可正常访问 image_url
  4. 服务端下载 image_url 超时将会返回失败,请确保 image_url 网络通畅;

🚀 prompt | ✅️必填 | string | 转换提示词,尽可能简洁明确。示例:把照片中间的人的表情改为高兴/生气/疑惑

返回参数

不同模型返回参数可能存在差异,请以实际返回为准。

返回参数 数据类型 说明
status string 请求成功返回success,失败返回failed
error_message string 接口返回的错误消息。当statussuccess时,error_message为空字符串
error_code int 或 null 接口返回的错误码。当statussuccess时,error_codenull
data object 或 null 接口返回的数据。当statusfailed时,datanull
data.model string 本次调用的模型。
data.image_urls array 修改后的图片链接列表(链接有效期为2小时,开发者需尽快下载保存)。
data.gpt_result string 语言模型输出的描述。
data.vision_gpt_result string 视觉模型输出的描述。
data.usage object 本次调用的费用信息
data.usage.total_cost float 本次调用产生的费用
data.api_version string 当前所使用的 API 的版本,免费版为free,付费版为paid
data.api_docs string 当前所使用的 API 的文档链接

响应头(Response Headers)

Header 说明 示例 相关链接
X-Account-Balance API_KEY 余额(元) 123.0123 API_KEY 费用充值入口:https://wcode.net/apikey-recharge

Python 代码示例(Requests,doubao-vision)

import requests
import json

url = "https://wcode.net/api/vision/gpt/cvse/v2/transform"

payload = json.dumps({
   "model": "doubao-vision",
   "image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
   "prompt":"把草坪换成沙滩"
})
headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

...其他编程语言可参考下方 curl http 请求示例进行调用

请求示例 1(doubao-vision)

curl --request POST 'https://wcode.net/api/vision/gpt/cvse/v2/transform' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
   "model": "doubao-vision",
   "image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
   "prompt":"把草坪换成沙滩"
}'

响应示例 1(doubao-vision)

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "model": "doubao-vision",
        "image_urls": [
            "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks__transformed.jpg"     // 有效期 60 分钟,开发者需尽快下载保存至本地
        ],
        "gpt_result": "",
        "vision_gpt_result": "一只小狗在有树木的背景下的沙滩上咬着一根棍子。",
        "api_usage": {
            "total_cost": 0.23,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        },
        "api_version": "paid"
    }
}



以上文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请扫码联系我们的 IT 技术支持工程师:

(沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅)

最受关注模型

GLM 4.7

文本生成、深度思考

MiniMax M2.1

文本生成、深度思考

Doubao Seed 2.0 Code

代码补全、深度思考

GLM 5

文本生成、深度思考、代码补全

Qwen3 Coder Next

文本生成、深度思考、代码补全

Step 3.5 Flash

文本生成、代码补全、深度思考

Qwen3.5 27B

深度思考、视觉理解、文本生成

Qwen3.5 35B A3B

深度思考、视觉理解、文本生成

Doubao Seed 1.8

多模态、深度思考

Qwen3.5 397B A17B

文本生成、深度思考、多模态

最新发布模型

Qwen3.5 9B

文本生成、多模态

Qwen3.5 35B A3B

深度思考、视觉理解、文本生成

Qwen3.5 27B

深度思考、视觉理解、文本生成

Qwen3.5 Flash

深度思考

Qwen3.5 122B A10B

深度思考、视觉理解、文本生成

Qwen3.5 397B A17B

文本生成、深度思考、多模态

Doubao Seed 2.0 Mini

文本生成、深度思考、多模态

Doubao Seed 2.0 Code

代码补全、深度思考

Qwen 3.5 Plus

文本生成、深度思考、多模态

Doubao Seed 2.0 Pro

文本生成、深度思考、多模态