AI 图片编辑(基于 Diffusion 模型)API 接口

AI 图片编辑(基于 Diffusion 模型)API 接口

AI 图片编辑是一种基于视觉大模型的通过 prompt 提示词方式编辑图片的技术。模型通过渐进式技术对齐图像生成器与图像编辑器,实现了以最佳方式平衡图像重建和图像生成。用户只需输入自然语言指令,就能精准地编辑图片,实现高度个性化的图像创作和优化。

接口地址

POST https://wcode.net/api/vision/gpt/cvse/v2/transform

快速开始(请求示例)

(注:以下请求示例中的 API_KEY 需要替换后再发起请求。 获取 API_KEY 入口:https://wcode.net/get-apikey

curl --request POST 'https://wcode.net/api/vision/gpt/cvse/v2/transform' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
   "model": "doubao-vision",
   "image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
   "prompt":"把草坪换成沙滩"
}'

效果预览:

原图 AI 编辑后的图片
原图 AI 编辑后的图片

计费方式

按调用次数计费:0.23 元/次,费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao

请求方法

POST

请求头(Request Headers)

Header 备注 示例 相关链接
Authorization Bearer API_KEY 格式:Bearer + 空格 + API_KEY Bearer sk-..... 获取 API_KEY 入口:https://wcode.net/get-apikey
Content-Type application/json 固定为 application/json

请求参数

🚀 model | ✅️必填 | string | 当前可选模型为 doubao-vision


🚀 image_url | ✅️必填 | string | 要转换的图片 URL,需支持公网访问。图片格式:jpg、jpeg、png 等常见格式,推荐使用 jpg 格式。

注意事项:

  1. image_url 需支持公网访问;
  2. image_url 对应的图片大小不超过 1.2 MB,尺寸不超过 2048*2048
  3. 调用 API 时,接口服务端会向 image_url 发起请求,请求的 User-agent 为:
    Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; WCodeNET/2.1; +https://wcode.net/vision-llm-image-transform-api
    请确保此 User-agent 可正常访问 image_url
  4. 服务端下载 image_url 超时将会返回失败,请确保 image_url 网络通畅;

🚀 prompt | ✅️必填 | string | 转换提示词,尽可能简洁明确。示例:把照片中间的人的表情改为高兴/生气/疑惑

返回参数

不同模型返回参数可能存在差异,请以实际返回为准。

返回参数 数据类型 说明
status string 请求成功返回success,失败返回failed
error_message string 接口返回的错误消息。当statussuccess时,error_message为空字符串
error_code int 或 null 接口返回的错误码。当statussuccess时,error_codenull
data object 或 null 接口返回的数据。当statusfailed时,datanull
data.model string 本次调用的模型。
data.image_urls array 修改后的图片链接列表(链接有效期为2小时,开发者需尽快下载保存)。
data.gpt_result string 语言模型输出的描述。
data.vision_gpt_result string 视觉模型输出的描述。
data.usage object 本次调用的费用信息
data.usage.total_cost float 本次调用产生的费用
data.api_version string 当前所使用的 API 的版本,免费版为free,付费版为paid
data.api_docs string 当前所使用的 API 的文档链接

响应头(Response Headers)

Header 说明 示例 相关链接
X-Account-Balance API_KEY 余额(元) 123.0165 API_KEY 费用充值入口:https://wcode.net/apikey-recharge

Python 代码示例(Requests,doubao-vision)

import requests
import json

url = "https://wcode.net/api/vision/gpt/cvse/v2/transform"

payload = json.dumps({
   "model": "doubao-vision",
   "image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
   "prompt":"把草坪换成沙滩"
})
headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

...其他编程语言可参考下方 curl http 请求示例进行调用

请求示例 1(doubao-vision)

curl --request POST 'https://wcode.net/api/vision/gpt/cvse/v2/transform' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
   "model": "doubao-vision",
   "image_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks.jpg",
   "prompt":"把草坪换成沙滩"
}'

响应示例 1(doubao-vision)

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "model": "doubao-vision",
        "image_urls": [
            "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/dog_playing_with_sticks__transformed.jpg"     // 有效期 60 分钟,开发者需尽快下载保存至本地
        ],
        "gpt_result": "",
        "vision_gpt_result": "一只小狗在有树木的背景下的沙滩上咬着一根棍子。",
        "api_usage": {
            "total_cost": 0.23,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        },
        "api_version": "paid"
    }
}