AI 图片编辑(基于 Diffusion 模型)API 接口
AI 图片编辑是一种基于视觉大模型的通过 prompt 提示词方式编辑图片的技术。模型通过渐进式技术对齐图像生成器与图像编辑器,实现了以最佳方式平衡图像重建和图像生成。用户只需输入自然语言指令,就能精准地编辑图片,实现高度个性化的图像创作和优化。
此文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请联系我们的 IT 技术支持工程师:
详细信息
定制开发服务流程:沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅
接口地址
POST https://wcode.net/api/vision/gpt/cvse/v2/transform
快速开始(请求示例)
(注:以下请求示例中的 API_KEY 需要替换后再发起请求。 获取 API_KEY 入口:https://wcode.net/get-apikey)
curl --request POST 'https://wcode.net/api/vision/gpt/cvse/v2/transform' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
"model": "doubao-vision",
"image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
"prompt":"把草坪换成沙滩"
}'
效果预览:
| 原图 | AI 编辑后的图片 |
|---|---|
![]() |
![]() |
计费方式
按调用次数计费:0.23 元/次,费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao
请求方法
POST
请求头(Request Headers)
| Header | 值 | 备注 | 示例 | 相关链接 |
|---|---|---|---|---|
| Authorization | Bearer API_KEY |
格式:Bearer + 空格 + API_KEY | Bearer sk-..... |
获取 API_KEY 入口:https://wcode.net/get-apikey |
| Content-Type | application/json |
固定为 application/json |
请求参数
🚀 model | ✅️必填 | string | 当前可选模型为 doubao-vision
🚀 image_url | ✅️必填 | string | 要转换的图片 URL,需支持公网访问。图片格式:jpg、jpeg、png 等常见格式,推荐使用 jpg 格式。
注意事项:
image_url需支持公网访问;image_url对应的图片大小不超过4.5 MB,尺寸不超过3072*3072;- 调用 API 时,接口服务端会向
image_url发起请求,请求的User-agent为:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; WCodeNET/2.1; +https://wcode.net/vision-llm-image-transform-api
请确保此User-agent可正常访问image_url; - 服务端下载
image_url超时将会返回失败,请确保image_url网络通畅;
🚀 prompt | ✅️必填 | string | 转换提示词,尽可能简洁明确。示例:把照片中间的人的表情改为高兴/生气/疑惑
返回参数
不同模型返回参数可能存在差异,请以实际返回为准。
| 返回参数 | 数据类型 | 说明 |
|---|---|---|
| status | string | 请求成功返回success,失败返回failed |
| error_message | string | 接口返回的错误消息。当status为success时,error_message为空字符串 |
| error_code | int 或 null | 接口返回的错误码。当status为success时,error_code为 null |
| data | object 或 null | 接口返回的数据。当status为failed时,data为 null |
| data.model | string | 本次调用的模型。 |
| data.image_urls | array | 修改后的图片链接列表(链接有效期为2小时,开发者需尽快下载保存)。 |
| data.gpt_result | string | 语言模型输出的描述。 |
| data.vision_gpt_result | string | 视觉模型输出的描述。 |
| data.usage | object | 本次调用的费用信息 |
| data.usage.total_cost | float | 本次调用产生的费用 |
| data.api_version | string | 当前所使用的 API 的版本,免费版为free,付费版为paid |
| data.api_docs | string | 当前所使用的 API 的文档链接 |
响应头(Response Headers)
| Header | 说明 | 示例 | 相关链接 |
|---|---|---|---|
| X-Account-Balance | API_KEY 余额(元) | 123.0123 |
API_KEY 费用充值入口:https://wcode.net/apikey-recharge |
Python 代码示例(Requests,doubao-vision)
import requests
import json
url = "https://wcode.net/api/vision/gpt/cvse/v2/transform"
payload = json.dumps({
"model": "doubao-vision",
"image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
"prompt":"把草坪换成沙滩"
})
headers = {
'Content-Type': 'application/json',
'Authorization': 'Bearer API_KEY' # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}
response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)
...其他编程语言可参考下方 curl http 请求示例进行调用
请求示例 1(doubao-vision)
curl --request POST 'https://wcode.net/api/vision/gpt/cvse/v2/transform' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
"model": "doubao-vision",
"image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
"prompt":"把草坪换成沙滩"
}'
响应示例 1(doubao-vision)
{
"status": "success",
"error_message": "",
"error_code": null,
"data": {
"model": "doubao-vision",
"image_urls": [
"https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks__transformed.jpg" // 有效期 60 分钟,开发者需尽快下载保存至本地
],
"gpt_result": "",
"vision_gpt_result": "一只小狗在有树木的背景下的沙滩上咬着一根棍子。",
"api_usage": {
"total_cost": 0.23,
"total_cost_currency": "CNY",
"total_cost_currency_symbol": "¥"
},
"api_version": "paid"
}
}
以上文档为标准版 API 接口文档,可直接用于项目开发和系统调用。如果标准版 API 接口无法满足您的需求,需要定制开发 API 接口,请扫码联系我们的 IT 技术支持工程师:
(沟通需求✅ → 确认技术方案✅ → 沟通费用与工期✅ → 开发&测试✅ → 验收交付✅ → 维护升级✅)
![]()
最受关注模型
GLM 4.7
文本生成、深度思考
MiniMax M2.1
文本生成、深度思考
Doubao Seed 2.0 Code
代码补全、深度思考
GLM 5
文本生成、深度思考、代码补全
Qwen3 Coder Next
文本生成、深度思考、代码补全
Step 3.5 Flash
文本生成、代码补全、深度思考
Qwen3.5 27B
深度思考、视觉理解、文本生成
Qwen3.5 35B A3B
深度思考、视觉理解、文本生成
Doubao Seed 1.8
多模态、深度思考
Qwen3.5 397B A17B
文本生成、深度思考、多模态
最新发布模型
Qwen3.5 9B
文本生成、多模态
Qwen3.5 35B A3B
深度思考、视觉理解、文本生成
Qwen3.5 27B
深度思考、视觉理解、文本生成
Qwen3.5 Flash
深度思考
Qwen3.5 122B A10B
深度思考、视觉理解、文本生成
Qwen3.5 397B A17B
文本生成、深度思考、多模态
Doubao Seed 2.0 Mini
文本生成、深度思考、多模态
Doubao Seed 2.0 Code
代码补全、深度思考
Qwen 3.5 Plus
文本生成、深度思考、多模态
Doubao Seed 2.0 Pro
文本生成、深度思考、多模态

