🇹🇭 OpenThai Chinda 4B
最新模型,用泰语思考,用泰语回答,由泰国初创公司打造
OpenThai Chinda 4B 是艾艾普科技 (iApp Technology) 的尖端泰语语言模型,为泰国人工智能生态系统带来了先进的思考能力。Chinda 基于最新的 Qwen3-4B 架构构建,体现了我们为泰国开发主权人工智能解决方案的承诺。
🚀 快速链接
- 🌐 演示: https://chindax.iapp.co.th (选择 OpenThai Chinda 4B)
- 📦 模型下载: https://huggingface.co/iapp/chinda-qwen3-4b
- 🐋 Ollama: https://ollama.com/iapp/chinda-qwen3-4b
- 📄 许可: Apache 2.0
📚 教程
- 使用 LM Studio 的 OpenThai Chinda 4B - 完整用户指南
- 使用 OpenWebUI 的 OpenThai Chinda 4B - 完整用户指南
- 使用 Ollama 的 OpenThai Chinda 4B - 完整用户指南
- 使用 n8n 的 OpenThai Chinda 4B - 完整工作流自动化指南
✨ 主要功能
🆓 0. 免费开源,人人可用
OpenThai Chinda 4B 完全免费且开源,使开发人员、研究人员和企业能够无限制地构建泰语人工智能应用程序。
🧠 1. 先进的思考模型
- 4B 类别中泰语 LLM 的最高得分
- 在思考模式和非思考模式之间无缝切换
- 卓越的推理能力,可解决复杂问题
- 可关闭以实现高效通用对话
🇹🇭 2. 出色的泰语准确性
- 泰语输出准确率达到 98.4%
- 防止不必要的中文和外语输出
- 专门针对泰语语言模式进行了微调
🆕 3. 最新架构
- 基于最先进的 Qwen3-4B 模型
- 整合了语言模型的最新进展
- 针对性能和效率进行了优化
📜 4. Apache 2.0 许可证
- 允许商业使用
- 允许修改和分发
- 私人使用无限制
📊 基准测试结果
OpenThai Chinda 4B 在其所属类别中展现出优于其他泰语语言模型的性能:
| 基准测试 | 语言 | OpenThai Chinda 4B | 其他选项* |
|---|---|---|---|
| AIME24 | 英语 | 0.533 | 0.100 |
| 泰语 | 0.100 | 0.000 | |
| LiveCodeBench | 英语 | 0.665 | 0.209 |
| 泰语 | 0.198 | 0.144 | |
| MATH500 | 英语 | 0.908 | 0.702 |
| 泰语 | 0.612 | 0.566 | |
| IFEVAL | 英语 | 0.849 | 0.848 |
| 泰语 | 0.683 | 0.740 | |
| 语言准确性 | 泰语 | 0.984 | 0.992 |
| OpenThaiEval | 泰语 | 0.651 | 0.544 |
| 平均 | 0.569 | 0.414 |
- 其他选项: scb10x_typhoon2.1-gemma3-4b
信息
由艾艾普科技 (iApp Technology) 团队使用 Skythought 和 Evalscope Benchmark Libraries 进行测试。结果显示 OpenThai Chinda 4B 的总体性能比最近的替代品高出 37%。
✅ 适用场景
🔍 1. RAG 应用 (主权 AI)
非常适合构建检索增强生成 (RAG) 系统,将数据处理保留在泰国主权范围内。
📱 2. 移动和笔记本 电脑应用
可靠的小型语言模型,针对边缘计算和个人设备进行了优化。
🧮 3. 数学计算
在数学推理和解决问题方面表现出色。
💻 4. 代码助手
在代码生成和编程辅助方面具有强大的能力。
⚡ 5. 资源效率
推理速度非常快,GPU 内存消耗极少,非常适合生产部署。
❌ 不适用场景
📚 无上下文的事实性问题
作为一个 4B 参数模型,在被要求提供无上下文的具体事实时,可能会产生幻觉。请始终与 RAG 一 起使用,或为事实查询提供相关上下文。
🛠️ 快速入门
安装
pip install transformers torch
基本用法
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "iapp/chinda-qwen3-4b"
# 加载分词器和模型
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype="auto",
device_map="auto"
)
# 准备模型输入
prompt = "อธิบายเกี่ยวกับปัญญาประดิษฐ์ให้ฟังหน่อย"
messages = [
{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
enable_thinking=True # 启用思考模式以获得更好的推理能力
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
# 生成响应
generated_ids = model.generate(
**model_inputs,
max_new_tokens=1024,
temperature=0.6,
top_p=0.95,
top_k=20,
do_sample=True
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()
# 解析思考内容(如果已启用)
try:
# 查找 </think> 标记 (151668)
index = len(output_ids) - output_ids[::-1].index(151668)
except ValueError:
index = 0
thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n")
content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n")
print("🧠 思考:", thinking_content)
print("💬 回复:", content)
在思考模式和非思考模式之间切换
启用思考模式(默认)
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
enable_thinking=True # 启用详细推理
)
禁用思考模式(为了效率)
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
enable_thinking=False # 快速响应模式
)
API 部署
使用 vLLM
pip install vllm>=0.8.5
vllm serve iapp/chinda-qwen3-4b --enable-reasoning --reasoning-parser deepseek_r1
使用 SGLang
pip install sglang>=0.4.6.post1
python -m sglang.launch_server --model-path iapp/chinda-qwen3-4b --reasoning-parser qwen3
使用 Ollama(简单的本地设置)
安装:
# 如果尚未安装 Ollama,请安装
curl -fsSL https://ollama.com/install.sh | sh
# 拉取 OpenThai Chinda 4B 模型
ollama pull iapp/chinda-qwen3-4b
基本用法:
# 开始与 OpenThai Chinda 聊天
ollama run iapp/chinda-qwen3-4b
# 示例对话
ollama run iapp/chinda-qwen3-4b "อธิบายเกี่ยวกับปัญญาประดิษฐ์ให้ฟังหน่อย"
API 服务器:
# 启动 Ollama API 服务器
ollama serve
# 使用 curl 进行调用
curl http://localhost:11434/api/generate -d '{
"model": "iapp/chinda-qwen3-4b",
"prompt": "สวัสดีครับ",
"stream": false
}'
模型规格:
- 大小: 2.5GB(量化后)
- 上下文窗口: 40K 令牌
- 架构: 针对本地部署进行了优化
- 性能: 在消费级硬件上实现快速推理
🔧 高级配置
处理长文本
OpenThai Chinda 4B 原生支持高达 32,768 个令牌。对于更长的上下文,请启用 YaRN 缩放:
{
"rope_scaling": {
"rope_type": "yarn",
"factor": 4.0,
"original_max_position_embeddings": 32768
}
}
推荐参数
用于思考模式:
- Temperature: 0.6
- Top-P: 0.95
- Top-K: 20
- Min-P: 0
用于非思考模式:
- Temperature: 0.7
- Top-P: 0.8
- Top-K: 20
- Min-P: 0
📝 上下文长度和模板格式
上下文长度支持
- 原生上下文长度: 32,768 令牌
- 扩展上下文长度: 高达 131,072 令牌(使用 YaRN 缩放)
- 输入 + 输出: 支持的总对话长度
- 推荐用法: 为获得最佳性能,请将对话保持在 32K 令牌以下