ตัวชี้วัดประสิทธิภาพหลัก (KPIs) ในประเมินงาน Retrieval-Augmented Generation (RAG) บนโมเดลภาษาใหญ่ (LLM)
· One min read
1. ความแม่นยำ
1.1 ความแม่นยำในการดึงข้อมูล
คำจำกัดความ: วัดความเกี่ยวข้องของเอกสารที่ดึงมาโดยระบบ
ตัวชี้วัด: Precision@k, Recall@k, F1 Score
เป้าหมาย: เพื่อให้แน่ใจว่ าเอกสารที่ดึงมามีความเกี่ยวข้องสูงกับคำค้นหา
1.2 ความแม่นยำในการสร้าง
คำจำกัดความ: ประเมินความถูกต้องและความเกี่ยวข้องของคำตอบที่สร้างขึ้น
ตัวชี้วัด: BLEU Score, ROUGE Score, การประเมินจากมนุษย์
เป้าหมาย: เพื่อให้มั่นใจว่าข้อความที่สร้างขึ้นมีความถูกต้องและเหมาะสมตามบริบท
2. ความล่าช้า
2.1 ความล่าช้าในการดึงข้อมูล
คำจำกัดความ: เวลาที่ใช้ในการดึงเอกสารที่เกี่ยวข้อง
ตัวชี้วัด: เวลาดึงข้อมูลเฉลี่ยในหน่วยมิลลิวินาที
เป้าหมาย: ลดเวลาการดึงข้อมูลเพื่อเพิ่มประสบการณ์การใช้งาน
2.2 ความล่าช้าในการสร้าง
คำจำกัดความ: เวลาที่ใช้ในการสร้างคำตอบหลังจากดึงเอกสาร
ตัวชี้วัด: เวลาสร้างคำตอบเฉลี่ยในหน่วยมิลลิวินาที
เป้าหมาย: ให้แน่ใจว่าการสร้างคำตอบรวดเร็วเพื่อรักษาการมีส่วนร่วมของผู้ใช้