Dela via


Standardriktlinjer & kontrollpolicyer

Azure OpenAI i Azure AI Foundry Models innehåller standardsäkerhetsprinciper som tillämpas på alla modeller (exklusive Azure OpenAI Whisper). De här konfigurationerna ger dig en ansvarsfull upplevelse som standard, inklusive modeller för innehållsfiltrering, blocklistor, snabbtransformering, autentiseringsuppgifter för innehåll och andra funktioner.

Standardsäkerhet syftar till att minska riskerna i olika kategorier, till exempel hat och rättvisa, sexuellt, våld, självskadebeteende, skyddat materialinnehåll och användarinmatningsattacker. Mer information om innehållsfiltrering finns i vår dokumentation som beskriver kategorier och allvarlighetsnivåer.

Alla säkerhetsprinciper kan konfigureras. Mer information om konfigurerbarhet finns i dokumentationen om hur du konfigurerar innehållsfiltrering.

Textmodeller

Textmodeller i Azure OpenAI kan ta in och generera både text och kod. Dessa modeller använder Azures textinnehållsfilter för att identifiera och förhindra skadligt innehåll. Det här systemet fungerar på både prompter och slutföranden.

Riskkategori Fråga/slutföra Tröskelvärde för allvarlighetsgrad
Hat och rättvisa Frågor och slutföranden Medel
Våld Frågor och slutföranden Medel
Sexuell Frågor och slutföranden Medel
Självskadebeteende Frågor och slutföranden Medel
Användarinmatningsattack (Jailbreak) Uppmaningar Inte tillgänglig
Skyddat material – text Kompletteringar Inte tillgänglig
Skyddat material – kod Kompletteringar Inte tillgänglig

Visionsmodeller

Visionsaktiverade chattmodeller

Riskkategori Fråga/slutföra Tröskelvärde för allvarlighetsgrad
Hat och rättvisa Frågor och slutföranden Medel
Våld Frågor och slutföranden Medel
Sexuell Frågor och slutföranden Medel
Självskadebeteende Frågor och slutföranden Medel
Identifiering av individer och slutsatsdragning av känsliga attribut Uppmaningar Inte tillgänglig
Användarinmatningsattack (Jailbreak) Uppmaningar Inte tillgänglig

Modeller för bildgenerering

Riskkategori Fråga/slutföra Tröskelvärde för allvarlighetsgrad
Hat och rättvisa Frågor och slutföranden Medel
Våld Frågor och slutföranden Medel
Sexuell Frågor och slutföranden Medel
Självskadebeteende Frågor och slutföranden Medel
Autentiseringsuppgifter för innehåll Kompletteringar Inte tillgänglig
Bedräglig generation av politiska kandidater Uppmaningar Inte tillgänglig
Skildringar av offentliga figurer Uppmaningar Inte tillgänglig
Användarinmatningsattack (Jailbreak) Uppmaningar Inte tillgänglig
Skyddat material – Konst och Studio-tecken Uppmaningar Inte tillgänglig
Olämpligt språk Uppmaningar Inte tillgänglig

Ljudmodeller

Riskkategori Fråga/slutföra Tröskelvärde för allvarlighetsgrad
Hat och rättvisa Frågor och slutföranden Medel
Våld Frågor och slutföranden Medel
Sexuell Frågor och slutföranden Medel
Självskadebeteende Frågor och slutföranden Medel
Användarinmatningsattack (Jailbreak) Uppmaningar Inte tillgänglig
Skyddat material – text Kompletteringar Inte tillgänglig
Skyddat material – kod Kompletteringar Inte tillgänglig