Skip to main content

🗣️ (Alpha) iApp แปลงข้อความเป็นเสียง (TTS) 🆕

🗣️ API แปลงข้อความเป็นเสียงที่ขับเคลื่อนด้วย AI

Version Status New

ยินดีต้อนรับสู่ iApp TTSv3 API บริการแปลงข้อความเป็นเสียงระดับแนวหน้าที่สามารถเปลี่ยนข้อความให้เป็นเสียงพูดที่ฟังดูเป็นธรรมชาติ API ของเรานำโมเดล AI ขั้นสูงมาใช้ในการสร้างเสียงจากข้อความด้วยความแม่นยำและความเร็วที่ยอดเยี่ยม

ทดลองใช้งาน

Demo key is limited to 10 requests per day per IP
Click here to get your API key

เริ่มต้นใช้งาน

สิ่งที่ต้องมี

  • ป้อนข้อความเป็นภาษาไทย
  • จำกัดจำนวน token สูงสุด: 1400
  • รูปแบบไฟล์ผลลัพธ์: WAV

เริ่มต้นอย่างรวดเร็ว

  • ประมวลผลรวดเร็วด้วย GPU
  • สร้างเสียงที่เป็นธรรมชาติ
  • ผลลัพธ์เสียงคุณภาพสูง

คุณสมบัติเด่น

  • สังเคราะห์เสียงธรรมชาติด้วย AI ล้ำสมัย
  • ปรับแต่งคุณภาพเสียงด้วยพารามิเตอร์ขั้นสูง
  • ตอบสนองรวดเร็ว
  • ใช้งานง่ายผ่าน REST API

วิธีการใช้งาน API

Endpoint

  • POST /tts - แปลงข้อความเป็นเสียงและดาวน์โหลดเป็นไฟล์

ตัวอย่างการเรียกใช้งาน API

ใช้ cURL:

# ตรวจสอบสถานะเซิร์ฟเวอร์
curl https://api.iapp.co.th/v3/audio/health

# สร้างเสียงและบันทึกเป็นไฟล์
curl -X POST https://api.iapp.co.th/v3/audio/tts \
-H "Content-Type: application/json" \
-d '{"text":"Hello, this is a test.","temperature":0.2,"top_p":0.95}' \
--output test.wav

ใช้ Python:

import requests

# ส่งคำร้องขอแปลงข้อความเป็นเสียง
response = requests.post(
"https://api.iapp.co.th/v3/audio/tts",
json={
"text": "สวัสดีครับ",
"temperature": 0.2,
"top_p": 0.95,
"max_new_tokens": 1400
}
)

# บันทึกเสียงที่ได้รับเป็นไฟล์
with open("output.wav", "wb") as f:
f.write(response.content)

พารามิเตอร์ที่ใช้ส่ง

พารามิเตอร์ประเภทคำอธิบายค่าเริ่มต้น
textstringข้อความที่ต้องการแปลงเป็นเสียงจำเป็นต้องมี
temperaturefloatอุณหภูมิการสร้างเสียง (ยิ่งสูงยิ่งสุ่ม)0.2
top_pfloatพารามิเตอร์ top-p sampling0.95
max_new_tokensintegerจำนวน token สูงสุดที่สามารถสร้างได้1400

แนวทางการใช้งานที่แนะนำ

  • ใช้เครื่องหมายวรรคตอนให้ถูกต้องเพื่อให้เสียงสมจริง
  • เขียนประโยคให้อ่านเป็นธรรมชาติ
  • หากเป็นข้อความยาว ควรแบ่งเป็นช่วงๆ
  • ปรับ temperature และ top_p เพื่อควบคุมลักษณะเสียง:
    • อุณหภูมิต่ำ (0.1–0.5): น้ำเสียงมั่นคง
    • อุณหภูมิสูง (0.6–1.0): น้ำเสียงแสดงอารมณ์แต่คาดเดาได้ยาก