📄 通用泰语文档 OCR
1 IC每页
欢迎使用泰语文档 OCR API(2.0 版本),这是由艾艾普科技有限公司开发的一款人工智能产品。我们的 API 可以自动将打印的泰语文档转换为可编辑的文本格式,并具有高准确性。该 API 支持图像(PNG、JPEG、JPG)、PDF 文件以及 Microsoft Office 文档(Word、Excel、PowerPoint),并可将其处理为三种不同的输出格式。
试用演示!
入门指南
-
先决条件
- 艾艾普科技的 API 密钥
- 泰语文档(图像、PDF 或 Office 文件)
- 支持的格式:PNG、JPEG、JPG、PDF、DOC、DOCX、XLS、XLSX、PPT、PPTX
- 最大文件大小:30MB
-
快速入门
- 处理速度快
- 文本提取准确率高
- 多种输出格式可选
-
主要特点
- 三种输出格式:
- 可编辑文本 (.txt)
- 结构化 JSON (.json)
- Microsoft Word 文件 (.docx)
- 自动识别文档组件
- 支持泰语和英语文本
- 三种输出格式:
-
安全与合规
- 符合 GDPR 和 PDPA 标准
- URL 文件路径有效期仅为 10 分钟
API 端点
| 端点 | 方法 | 描述 | 费用 |
|---|---|---|---|
/v3/store/ocr/document/ocr旧版 : /document-ocr/ocr | POST | 通用泰语文档 OCR 为纯文本 | 每页 1 IC |
/v3/store/ocr/document/layout旧版 : /document-ocr/layout | POST | 通用泰语文档 OCR 为带布局信息分析的布局 JSON | 每页 1 IC |
/v3/store/ocr/document/docx旧版 : /document-ocr/docx | POST | 通用泰语文档 OCR 并转换为 Microsoft Word (DOCX) | 每页 1 IC |
功能与能力
核心功能
- 从文档中提取文本
- 文档结构分析
- 多种输出格式
- 支持泰语和英语文本
- 支持 PDF 文件
支持的字段
- 页面边界检测
- 标题识别
- 段落检测
- 图像检测
- 表格识别
- 泰语字符识别
- 英语字符识别
- 特殊字符支持

