🇹🇭 泰语语音转文本 (ASR) PRO

2 IC每60秒

✅ 活跃🎙️ 语音🤖 LLM

欢迎使用泰语 ASR PRO - 我们由大型语言模型 (LLM) 驱动的高级泰语自动语音识别服务。此版本在保持合理处理速度的同时，提供了卓越的准确性和上下文感知转录。

试用演示

试用 AI 演示

登录或创建免费账户来使用此 AI 服务演示并探索我们强大的 API。

注册即可获得 100 积分 (IC) 免费赠送！

优惠截止至 2025 年 12 月 31 日

免费创建账户登录

Example File (Click to try)

Selected: 2ppl.wav

API Key

Endpoint URL

cURL Command

选择您的分块大小

Upload Audio File

入门

先决条件
- 来自 iApp Technology 的 API 密钥
- 支持格式的音频文件
- 支持的格式：MP3, WAV, AAC, M4A
- 最长文件长度：不超过 30 分钟
- 最大文件大小：1GB
快速入门
- 高精度转录，具有上下文感知能力
- 先进的 LLM 驱动处理
- 支持泰语
主要特点
- 从音频文件中提取上下文感知的文本
- 提高复杂音频场景的准确性
- 声纹识别
- 灵活的 JSON 响应格式
安全与合规
- 符合 GDPR 和 PDPA
- 处理后不保留数据

如何获取 API 密钥？

请访问 API 密钥管理页面查看您现有的 API 密钥或申请新密钥。

API 端点

端点	方法	描述	费用
`/v3/store/speech/speech-to-text/pro` 旧版: `/asr/v3/pro`	POST	将泰语语音转换为文本（带 LLM 的 Pro 模型）	每 60 秒 2 IC

API 参考

端点

POST https://api.iapp.co.th/v3/store/speech/speech-to-text/pro

请求头

apikey (必填)：您的 API 密钥，用于身份验证
其他请求头由 FormData 生成

请求参数

参数	类型	描述
file*	文件 (.mp3, .wav, .aac, .m4a)	要转录的音频文件（不超过 30 分钟）
chunk_size	整数	音频分块大小（推荐：7）

代码示例

Curl

curl -X POST https://api.iapp.co.th/v3/store/speech/speech-to-text/pro \
    -H "apikey: YOUR_API_KEY" \
    -F "file=@/path/to/file.jpg"

Python

import requests

url = "https://api.iapp.co.th/v3/store/speech/speech-to-text/pro"

payload = {'use_asr_pro': '1', 'chunk_size': '7'} #设置为 '1' 以使用 iApp ASR PRO
files=[
('file',('{YOUR_UPLOADED_FILE}',open('{YOUR_UPLOADED_FILE_PATH}','rb'),'application/octet-stream'))
]
headers = {
'apikey': '{YOUR_API_KEY}'
}

response = requests.request("POST", url, headers=headers, data=payload, files=files)

print(response.text)

Javascript

const axios = require("axios")
const FormData = require("form-data")
const fs = require("fs")
let data = new FormData()
data.append("file", fs.createReadStream("YOUR_UPLOADED_FILE"))
data.append("use_asr_pro", "1") //设置为 '1' 以使用 iApp ASR PRO
data.append("chunk_size", "7")

let config = {
    method: "post",
    maxBodyLength: Infinity,
    url: "https://api.iapp.co.th/v3/store/speech/speech-to-text/pro",
    headers: {
        apikey: "{YOUR_API_KEY}",
        ...data.getHeaders(),
    },
    data: data,
}

axios
    .request(config)
    .then((response) => {
        console.log(JSON.stringify(response.data))
    })
    .catch((error) => {
        console.log(error)
    })

PHP

<?php

$curl = curl_init();

curl_setopt_array($curl, array(
  CURLOPT_URL => 'https://api.iapp.co.th/v3/store/speech/speech-to-text/pro',
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => '',
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 0,
  CURLOPT_FOLLOWLOCATION => true,
  CURLHTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => 'POST',
  CURLOPT_POSTFIELDS => array('file'=> new CURLFILE('{YOUR_UPLOADED_FILE}'),
  'use_asr_pro' => '1',
  'chunk_size' => '7'),
  CURLOPT_HTTPHEADER => array(
    'apikey: {YOUR_API_KEY}'
  ),
));

$response = curl_exec($curl);

curl_close($curl);
echo $response;

Swift

let parameters = [
  [
    "key": "file",
    "src": "{YOUR_UPLOADED_FILE}",
    "type": "file"
  ],
  [
    "key": "use_asr_pro",
    "value": "1",
    "type": "text"
  ],
  [
    "key": "chunk_size",
    "value": "7",
    "type": "text"
  ]] as [[String: Any]]

let boundary = "Boundary-\(UUID().uuidString)"
var body = Data()
var error: Error? = nil
for param in parameters {
  if param["disabled"] != nil { continue }
  let paramName = param["key"]!
  body += Data("--\(boundary)\r\n".utf8)
  body += Data("Content-Disposition:form-data; name=\"\(paramName)\"".utf8)
  if param["contentType"] != nil {
    body += Data("\r\nContent-Type: \(param["contentType"] as! String)".utf8)
  }
  let paramType = param["type"] as! String
  if paramType == "text" {
    let paramValue = param["value"] as! String
    body += Data("\r\n\r\n\(paramValue)\r\n".utf8)
  } else {
    let paramSrc = param["src"] as! String
    let fileURL = URL(fileURLWithPath: paramSrc)
    if let fileContent = try? Data(contentsOf: fileURL) {
      body += Data("; filename=\"\(paramSrc)\"\r\n".utf8)
      body += Data("Content-Type: \"content-type header\"\r\n".utf8)
      body += Data("\r\n".utf8)
      body += fileContent
      body += Data("\r\n".utf8)
    }
  }
}
body += Data("--\(boundary)--\r\n".utf8);
let postData = body


var request = URLRequest(url: URL(string: "https://api.iapp.co.th/v3/store/speech/speech-to-text/pro")!,timeoutInterval: Double.infinity)
request.addValue("{YOUR_API_KEY}", forHTTPHeaderField: "apikey")
request.addValue("multipart/form-data; boundary=\(boundary)", forHTTPHeaderField: "Content-Type")

request.httpMethod = "POST"
request.httpBody = postData

let task = URLSession.shared.dataTask(with: request) { data, response, error in
  guard let data = data else {
    print(String(describing: error))
    return
  }
  print(String(data: data, encoding: .utf8)!)
}

task.resume()

Kotlin

val client = OkHttpClient()
val mediaType = "text/plain".toMediaType()
val body = MultipartBody.Builder().setType(MultipartBody.FORM)
  .addFormDataPart("file","{YOUR_UPLOADED_FILE}",
    File("{YOUR_UPLOADED_FILE_PATH}").asRequestBody("application/octet-stream".toMediaType()))
  .addFormDataPart("use_asr_pro","1")
  .addFormDataPart("chunk_size","7")
  .build()
val request = Request.Builder()
  .url("https://api.iapp.co.th/v3/store/speech/speech-to-text/pro")
  .post(body)
  .addHeader("apikey", "{YOUR_API_KEY}")
  .build()
val response = client.newCall(request).execute()

Java

OkHttpClient client = new OkHttpClient().newBuilder()
  .build();
MediaType mediaType = MediaType.parse("text/plain");
RequestBody body = new MultipartBody.Builder().setType(MultipartBody.FORM)
  .addFormDataPart("file","{YOUR_UPLOADED_FILE}",
    RequestBody.create(MediaType.parse("application/octet-stream"),
    new File("{YOUR_UPLOADED_FILE_PATH}")))
  .addFormDataPart("use_asr_pro","1")
  .addFormDataPart("chunk_size","7")
  .build();
Request request = new Request.Builder()
  .url("https://api.iapp.co.th/v3/store/speech/speech-to-text/pro")
  .method("POST", body)
  .addHeader("apikey", "{YOUR_API_KEY}")
  .build();
Response response = client.newCall(request).execute();

Dart

var headers = {
  'apikey': '{YOUR_API_KEY}'
};
var request = http.MultipartRequest('POST', Uri.parse('https://api.iapp.co.th/v3/store/speech/speech-to-text/pro'));
request.fields.addAll({
  'use_asr_pro': '1',
  'chunk_size': '7'
});
request.files.add(await http.MultipartFile.fromPath('file', '{YOUR_UPLOADED_FILE'));
request.headers.addAll(headers);

http.StreamedResponse response = await request.send();

if (response.statusCode == 200) {
  print(await response.stream.bytesToString());
}
else {
  print(response.reasonPhrase);
}

准确性和性能

总体准确性

在 Mozilla Common Voice 数据集的泰语测试集上的基准测试结果。我们评估了 iApp ASR PRO 在两个不同版本的测试集上的性能。

测试条件

未见数据集
仅限泰语
发音人多样性：男性、女性、儿童

Mozilla Common Voice 17.0 泰语测试集

在 Hugging Face 上访问数据集

结果：

测试集大小：11,042 个样本
平均词错误率 (WER)：0.0801 或 8.01%
平均字错误率 (CER)：0.0219 或 2.19%
基于 WER 的平均准确率：91.99%
基于 CER 的平均准确率：97.81%

处理速度

为准确性而非速度进行了优化

定价

AI API 服务名称	端点	每秒 IC 价格	本地部署
泰语语音转文本 (ASR)	iapp-asr-v3-en [Pro 模型]	2 IC/60 秒	联系我们
泰语语音转文本 (ASR)	iapp-asr-v3-th-en [Pro 模型]	2 IC/60 秒	联系我们

🇹🇭 泰语语音转文本 (ASR) PRO

试用演示

试用 AI 演示

Example File (Click to try)

入门

API 端点

API 参考

端点

请求头

请求参数

代码示例

Curl

Python

Javascript

PHP

Swift

Kotlin

Java

Dart

准确性和性能

总体准确性

处理速度

定价

ChindaX

SpeechFlow

ChindaGO

试用演示​

试用 AI 演示

Example File (Click to try)

入门​

API 端点​

API 参考​

端点​

请求头​

请求参数​

代码示例​

Curl​

Python​

Javascript​

PHP​

Swift​

Kotlin​

Java​

Dart​

准确性和性能​

总体准确性​

处理速度​

定价​

试用演示

入门

API 端点

API 参考

端点

请求头

请求参数

代码示例

Curl

Python

Javascript

PHP

Swift

Kotlin

Java

Dart

准确性和性能

总体准确性

处理速度

定价