Förstå observerbarhet
Det finns många sätt att mäta generativ AI:s svarskvalitet. I allmänhet kan du tänka dig tre dimensioner för att utvärdera och övervaka generativ AI. Dessa inkluderar:
- Prestanda- och kvalitetsutvärderingar: utvärdera noggrannhet, grund och relevans för genererat innehåll.
- Risk- och säkerhetsutvärderingar: utvärdera potentiella risker som är kopplade till AI-genererat innehåll för att skydda mot innehållsrisker. Detta omfattar utvärdering av ai-systemets predisposition för att generera skadligt eller olämpligt innehåll.
- Anpassade utvärderare: branschspecifika mått för att uppfylla specifika behov och mål.
Azure AI Foundry stöder observerbarhetsfunktioner som förbättrar prestanda och pålitlighet för generativa AI-svar. Utvärderare är specialiserade verktyg i Azure AI Foundry som mäter kvaliteten, säkerheten och tillförlitligheten hos AI-svar.
Några utvärderare är:
- Konsistens: mäter hur konsekvent svaret är med avseende på den återvunna kontexten.
- Relevans: mäter hur relevant svaret är för frågan.
- Fluency: mäter kvalitet på naturligt språk och läsbarhet.
- Enhetlighet: mäter logisk konsekvens och flöde av svar.
- Innehållssäkerhet: omfattande bedömning av olika säkerhetsproblem.
Nu ska vi prova generativa AI-funktioner i Azure AI Foundry-portalen.