Den här webbläsaren stöds inte längre.
Uppgradera till Microsoft Edge och dra nytta av de senaste funktionerna och säkerhetsuppdateringarna, samt teknisk support.
Vilken utvärderingsteknik kan du använda för att tillämpa din egen bedömning om kvaliteten på svar på en uppsättning specifika frågor?
Prestandamått för modeller
Manuella utvärderingar
Automatiserade utvärderingar
Vilken utvärderare jämför genererade svar med grundsanning baserat på standardmått?
Koherens
F1-poäng
Skyddat material
Vilket utvärderarmått använder en AI-modell för att bedöma strukturen och det logiska flödet av idéer i ett svar?
skyddat material
Du måste svara på alla frågor innan du kontrollerar ditt arbete.
Var den här sidan till hjälp?
Need help with this topic?
Want to try using Ask Learn to clarify or guide you through this topic?