PPT 文档(ppt/pptx)解析 API 接口

PPT 文档(ppt/pptx)解析 API 接口

由万码云开发平台提供的 PPT 文档解析 API 接口(PPT Parsing API),支持解析 ppt 和 pptx 格式文档中的文本、链接、表格等多种内容,提供灵活的参数配置以满足不同应用场景的需求。接口设计简单直观,易于集成和调用,适用于演示文稿管理、内容提取、数据分析以及 RAG(Retrieval-Augmented Generation)等多个应用场景,帮助开发者高效实现 PPT 文档解析相关功能,为智能问答和知识管理等应用提供可靠支持。

接口地址(免费版,文件大小不超过 2 MB)

POST https://wcode.net/api/parse/v3/pptx/free

注:免费版接口限制并发为 12 QPM(Query Per Minute,每分钟处理请求数)

接口地址(付费版,文件大小不超过 32 MB)

POST https://wcode.net/api/parse/v3/pptx

付费版价格:0.01 元 / 500 字符(即解析 50000 字符的费用为 1 元),费用充值:https://wcode.net/apikey-recharge,费用发票:https://wcode.net/get-fapiao

字符数的计算:包含单字节字符、多字节字符、标点符号等,具体以下方接口响应示例为准。

字符数的计费:总字符数如果不足 500 字符,以 500 字符计费(即 0.01 元)。

请求方法

POST

快速开始(请求示例)

(注:以下请求示例中的 API_KEY 需要替换后再发起请求。 获取 API_KEY 入口:https://wcode.net/get-apikey

curl --request POST 'https://wcode.net/api/parse/v3/pptx' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "file_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/parse-ppt-api-demo.pptx"
}'

请求头(Request Headers)

Header 备注 示例 相关链接
Authorization Bearer API_KEY 格式:Bearer + 空格 + API_KEY Bearer sk-..... 获取 API_KEY 入口:https://wcode.net/get-apikey
Content-Type application/json 固定为 application/json

请求参数

参数 必填 参数类型 默认值 说明
file_url string - 要解析的 PPT 文件 URL

注意事项:

  1. file_url 需支持公网访问;
  2. 调用 API 时,接口服务端会向 file_url 发起请求,请求的 User-agent 为:
    Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; WCodeNET/2.1; +https://wcode.net/parse-ppt-api
    请确保此 User-agent 可正常访问 file_url
  3. file_url 对应文件的大小不能超过 32 MB,且不能小于 1 KB;
  4. 服务端下载 file_url 超时时间为 20 秒,超时将会返回失败,请确保 file_url 网络通畅;

返回参数

返回参数 数据类型 说明
status string 请求成功返回success,失败返回failed
error_message string 接口返回的错误消息。当statussuccess时,error_message为空字符串
error_code int 或 null 接口返回的错误码。当statussuccess时,error_codenull
data object 或 null 接口返回的数据。当statusfailed时,datanull
data.markdown string Markdown 格式的解析结果
data.html string HTML 格式的解析结果
data.usage object 本次解析的统计与费用信息
data.usage.total_characters int 本次解析的字符数统计
data.usage.total_cost float 本次解析产生的费用
data.api_version string 当前所使用的 API 的版本,免费版为free,付费版为paid
data.api_docs string 当前所使用的 API 的文档链接

响应头(Response Headers)

Header 说明 示例 相关链接
X-Account-Balance API_KEY 余额(元) 123.0165 API_KEY 费用充值入口:https://wcode.net/apikey-recharge

请求示例

curl --request POST 'https://wcode.net/api/parse/v3/pptx' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer API_KEY' \
--data '{
    "file_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/parse-ppt-api-demo.pptx"
}'

响应示例

{
    "status": "success",
    "error_message": "",
    "error_code": null,
    "data": {
        "markdown": "<!-- Slide number: 1 -->\n\n![preencoded.png](Image0.jpg)\nPPT 文档解析 API 接口介绍\n\nAPI接口地址:https://wcode.net\n\n### Notes:\n\n<!-- Slide number: 2 -->\n\n![preencoded.png](Image0.jpg)\nContent\n目录\n\n01\n概述\n\n02\n应用场景与案例分析\n\n03\n技术细节与最佳实践\n\n### Notes:\n\n<!-- Slide number: 3 -->\n\n![preencoded.png](Image0.jpg)\n\n概述\n\n01 /\n\n### Notes:\n\n<!-- Slide number: 4 -->\n\nPPT 解析 API 的核心功能与优势\n\n![preencoded.png](Image0.jpg)\n\nPPT解析API能自动读取并转换PPT文档内容,包括文本、图片、表格等,支持多种输出格式,如Markdown、HTML等,满足不同场景需求。\n\n### Notes:\n\n<!-- Slide number: 5 -->\n\nAPI 接口设计与集成指南\n\n![preencoded.png](Image0.jpg)\n\nAPI(Application Programming Interface)是应用程序接口,允许不同软件之间通信,实现功能调用。在PPT文档解析场景下,API接口提供了一种高效、灵活的文档处理方式。\n\n### Notes:\n\n<!-- Slide number: 6 -->\n\n![preencoded.png](Image0.jpg)\n\n应用场景与案例分析\n\n02 /\n\n### Notes:\n\n<!-- Slide number: 7 -->\n\n内容提取与数据分析\n\n![preencoded.png](Image0.jpg)\n\n![preencoded.png](Image1.jpg)\nAPI功能\nPPT文档解析API能自动提取文本、链接等元素,便于二次处理与分析,提升数据处理效率。\n\n![preencoded.png](Image2.jpg)\n应用场景\n广泛应用于教育、金融、企业报告自动化等领域,如快速生成报告摘要,图表数据分析等。\n\n![preencoded.png](Image3.jpg)\n案例分析\n某金融机构使用该API自动解析市场分析PPT,通过数据挖掘预测市场趋势,辅助决策。\n\n### Notes:\n\n<!-- Slide number: 8 -->\n\n![preencoded.png](Image0.jpg)\nRAG 应用场景实践\n\n![preencoded.png](Image1.jpg)\n检索相关资料\nRAG模型首先从大量文档中检索相关信息,为后续处理提供基础。\n增强信息质量\n通过增强步骤,RAG模型能够提高检索到的信息的质量,确保其准确性和相关性。\n生成最终结果\n最后,RAG模型基于增强后的信息生成最终结果,如摘要或报告等。\n法律领域应用\n在法律领域,RAG技术帮助律师快速解析大量报告,提取关键信息,加速案件准备。\n教育行业应用\n在教育行业,RAG技术解析教学PPT,自动生成课程摘要,辅助学生复习。\n医疗领域应用\n在医疗领域,RAG技术解析病例PPT,支持医生快速理解病史,改善医疗服务。\n\n### Notes:\n\n<!-- Slide number: 9 -->\n\n![preencoded.png](Image0.jpg)\n\n技术细节与最佳实践\n\n03 /\n\n### Notes:\n\n<!-- Slide number: 10 -->\n\n![preencoded.png](Image0.jpg)\n\n![preencoded.png](Image1.jpg)\n错误处理与性能优化\n\n![preencoded.png](Image2.jpg)\n异常捕获\n在调用PPT文档解析API时,应使用try-catch结构来捕获并处理可能发生的异常,确保程序稳定运行。\n\n![preencoded.png](Image3.jpg)\n错误日志\n记录详细的错误日志,包括错误类型、发生时间及上下文信息,有助于快速定位问题,提高调试效率。\n\n![preencoded.png](Image4.jpg)\n性能监控\n定期检查API接口的响应时间和资源消耗,通过性能监控工具识别瓶颈,及时优化代码,提升解析速度。\n\n![preencoded.png](Image5.jpg)\n缓存策略\n对于频繁访问的PPT文档,采用缓存策略减少重复解析,既能减轻服务器压力,又能提升用户体验。\n\n### Notes:\n\n<!-- Slide number: 11 -->\n\n![preencoded.png](Image0.jpg)\n\n![preencoded.png](Image1.jpg)\n安全性与合规性考量\n\n![preencoded.png](Image2.jpg)\nAPI认证机制\n采用OAuth 2.0等标准协议,确保API接口的安全调用,防止未授权访问。\n\n![preencoded.png](Image3.jpg)\n数据加密传输\n使用HTTPS协议,对传输中的数据进行加密,保护敏感信息不被窃取或篡改。\n\n![preencoded.png](Image4.jpg)\n权限控制策略\n实施细粒度的权限管理,仅允许特定用户或角色访问指定的PPT文档,增强安全性。\n\n![preencoded.png](Image5.jpg)\n合规性审计\n记录API调用日志,定期审查,确保操作符合法律法规及内部政策,维护合规性。\n\n![preencoded.png](Image6.jpg)\n安全更新与维护\n定期更新API接口,修复已知漏洞,遵循最新的安全标准,持续优化安全防护措施。\n\n### Notes:\n\n<!-- Slide number: 12 -->\n\n![preencoded.png](Image0.jpg)\nTHANKS\n\n### Notes:\n",
        "html": "<!-- Slide number: 1 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" />\nPPT 文档解析 API 接口介绍</p>\n<p>API接口地址:https://wcode.net</p>\n<h3>Notes:</h3>\n<!-- Slide number: 2 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" />\nContent\n目录</p>\n<p>01\n概述</p>\n<p>02\n应用场景与案例分析</p>\n<p>03\n技术细节与最佳实践</p>\n<h3>Notes:</h3>\n<!-- Slide number: 3 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" /></p>\n<p>概述</p>\n<p>01 /</p>\n<h3>Notes:</h3>\n<!-- Slide number: 4 -->\n<p>PPT 解析 API 的核心功能与优势</p>\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" /></p>\n<p>PPT解析API能自动读取并转换PPT文档内容,包括文本、图片、表格等,支持多种输出格式,如Markdown、HTML等,满足不同场景需求。</p>\n<h3>Notes:</h3>\n<!-- Slide number: 5 -->\n<p>API 接口设计与集成指南</p>\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" /></p>\n<p>API(Application Programming Interface)是应用程序接口,允许不同软件之间通信,实现功能调用。在PPT文档解析场景下,API接口提供了一种高效、灵活的文档处理方式。</p>\n<h3>Notes:</h3>\n<!-- Slide number: 6 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" /></p>\n<p>应用场景与案例分析</p>\n<p>02 /</p>\n<h3>Notes:</h3>\n<!-- Slide number: 7 -->\n<p>内容提取与数据分析</p>\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" /></p>\n<p><img src=\"Image1.jpg\" alt=\"preencoded.png\" />\nAPI功能\nPPT文档解析API能自动提取文本、链接等元素,便于二次处理与分析,提升数据处理效率。</p>\n<p><img src=\"Image2.jpg\" alt=\"preencoded.png\" />\n应用场景\n广泛应用于教育、金融、企业报告自动化等领域,如快速生成报告摘要,图表数据分析等。</p>\n<p><img src=\"Image3.jpg\" alt=\"preencoded.png\" />\n案例分析\n某金融机构使用该API自动解析市场分析PPT,通过数据挖掘预测市场趋势,辅助决策。</p>\n<h3>Notes:</h3>\n<!-- Slide number: 8 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" />\nRAG 应用场景实践</p>\n<p><img src=\"Image1.jpg\" alt=\"preencoded.png\" />\n检索相关资料\nRAG模型首先从大量文档中检索相关信息,为后续处理提供基础。\n增强信息质量\n通过增强步骤,RAG模型能够提高检索到的信息的质量,确保其准确性和相关性。\n生成最终结果\n最后,RAG模型基于增强后的信息生成最终结果,如摘要或报告等。\n法律领域应用\n在法律领域,RAG技术帮助律师快速解析大量报告,提取关键信息,加速案件准备。\n教育行业应用\n在教育行业,RAG技术解析教学PPT,自动生成课程摘要,辅助学生复习。\n医疗领域应用\n在医疗领域,RAG技术解析病例PPT,支持医生快速理解病史,改善医疗服务。</p>\n<h3>Notes:</h3>\n<!-- Slide number: 9 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" /></p>\n<p>技术细节与最佳实践</p>\n<p>03 /</p>\n<h3>Notes:</h3>\n<!-- Slide number: 10 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" /></p>\n<p><img src=\"Image1.jpg\" alt=\"preencoded.png\" />\n错误处理与性能优化</p>\n<p><img src=\"Image2.jpg\" alt=\"preencoded.png\" />\n异常捕获\n在调用PPT文档解析API时,应使用try-catch结构来捕获并处理可能发生的异常,确保程序稳定运行。</p>\n<p><img src=\"Image3.jpg\" alt=\"preencoded.png\" />\n错误日志\n记录详细的错误日志,包括错误类型、发生时间及上下文信息,有助于快速定位问题,提高调试效率。</p>\n<p><img src=\"Image4.jpg\" alt=\"preencoded.png\" />\n性能监控\n定期检查API接口的响应时间和资源消耗,通过性能监控工具识别瓶颈,及时优化代码,提升解析速度。</p>\n<p><img src=\"Image5.jpg\" alt=\"preencoded.png\" />\n缓存策略\n对于频繁访问的PPT文档,采用缓存策略减少重复解析,既能减轻服务器压力,又能提升用户体验。</p>\n<h3>Notes:</h3>\n<!-- Slide number: 11 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" /></p>\n<p><img src=\"Image1.jpg\" alt=\"preencoded.png\" />\n安全性与合规性考量</p>\n<p><img src=\"Image2.jpg\" alt=\"preencoded.png\" />\nAPI认证机制\n采用OAuth 2.0等标准协议,确保API接口的安全调用,防止未授权访问。</p>\n<p><img src=\"Image3.jpg\" alt=\"preencoded.png\" />\n数据加密传输\n使用HTTPS协议,对传输中的数据进行加密,保护敏感信息不被窃取或篡改。</p>\n<p><img src=\"Image4.jpg\" alt=\"preencoded.png\" />\n权限控制策略\n实施细粒度的权限管理,仅允许特定用户或角色访问指定的PPT文档,增强安全性。</p>\n<p><img src=\"Image5.jpg\" alt=\"preencoded.png\" />\n合规性审计\n记录API调用日志,定期审查,确保操作符合法律法规及内部政策,维护合规性。</p>\n<p><img src=\"Image6.jpg\" alt=\"preencoded.png\" />\n安全更新与维护\n定期更新API接口,修复已知漏洞,遵循最新的安全标准,持续优化安全防护措施。</p>\n<h3>Notes:</h3>\n<!-- Slide number: 12 -->\n<p><img src=\"Image0.jpg\" alt=\"preencoded.png\" />\nTHANKS</p>\n<h3>Notes:</h3>\n",
        "usage": {
            "total_characters": 2277,
            "total_cost": 0.05,
            "total_cost_currency": "CNY",
            "total_cost_currency_symbol": "¥"
        },
        "api_version": "paid",
        "api_docs": "https://wcode.net/parse-ppt-api"
    }
}



Python 代码示例(Requests)

import requests
import json

url = "https://wcode.net/api/parse/v3/pptx"

payload = json.dumps({
  "file_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/parse-ppt-api-demo.pptx"
})
headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer API_KEY'     # TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

Java 代码示例(OkHttp)

OkHttpClient client = new OkHttpClient().newBuilder().build();

MediaType mediaType = MediaType.parse("application/json");

RequestBody body = RequestBody.create(mediaType, "{\"file_url\": \"https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/parse-ppt-api-demo.pptx\"}");

Request request = new Request.Builder()
  .url("https://wcode.net/api/parse/v3/pptx")
  .method("POST", body)
  .addHeader("Content-Type", "application/json")
  .addHeader("Authorization", "Bearer API_KEY")     // TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
  .build();

Response response = client.newCall(request).execute();

PHP 代码示例(Guzzle)

<?php

$client = new Client();

$headers = [
  'Content-Type' => 'application/json',
  'Authorization' => 'Bearer API_KEY'     // TODO: 这里的 API_KEY 需要替换,获取 API_KEY 入口:https://wcode.net/get-apikey
];

$body = '{
  "file_url": "https://zdkjdemo.oss-cn-shanghai.aliyuncs.com/parse-ppt-api-demo.pptx"
}';

$request = new Request('POST', 'https://wcode.net/api/parse/v3/pptx', $headers, $body);

$res = $client->sendAsync($request)->wait();

echo $res->getBody();

...其他编程语言可参考 curl http 请求示例进行调用


异常响应示例

{
    "status": "failed",
    "error_message": "The request body (or file) is too large, please reduce the request body (or file) size and try again, more information is available at: https://wcode.net/api-error-reference",
    "error_code": 413,
    "data": null
}