Standardriktlinjer & kontrollpolicyer

2025-10-30

Azure OpenAI i Azure AI Foundry Models innehåller standardsäkerhetsprinciper som tillämpas på alla modeller (exklusive Azure OpenAI Whisper). De här konfigurationerna ger dig en ansvarsfull upplevelse som standard, inklusive modeller för innehållsfiltrering, blocklistor, snabbtransformering, autentiseringsuppgifter för innehåll och andra funktioner.

Standardsäkerhet syftar till att minska riskerna i olika kategorier, till exempel hat och rättvisa, sexuellt, våld, självskadebeteende, skyddat materialinnehåll och användarinmatningsattacker. Mer information om innehållsfiltrering finns i vår dokumentation som beskriver kategorier och allvarlighetsnivåer.

Alla säkerhetsprinciper kan konfigureras. Mer information om konfigurerbarhet finns i dokumentationen om hur du konfigurerar innehållsfiltrering.

Textmodeller

Textmodeller i Azure OpenAI kan ta in och generera både text och kod. Dessa modeller använder Azures textinnehållsfilter för att identifiera och förhindra skadligt innehåll. Det här systemet fungerar på både prompter och slutföranden.

Riskkategori	Fråga/slutföra	Tröskelvärde för allvarlighetsgrad
Hat och rättvisa	Frågor och slutföranden	Medel
Våld	Frågor och slutföranden	Medel
Sexuell	Frågor och slutföranden	Medel
Självskadebeteende	Frågor och slutföranden	Medel
Användarinmatningsattack (Jailbreak)	Uppmaningar	Inte tillgänglig
Skyddat material – text	Kompletteringar	Inte tillgänglig
Skyddat material – kod	Kompletteringar	Inte tillgänglig

Visionsmodeller

Visionsaktiverade chattmodeller

Riskkategori	Fråga/slutföra	Tröskelvärde för allvarlighetsgrad
Hat och rättvisa	Frågor och slutföranden	Medel
Våld	Frågor och slutföranden	Medel
Sexuell	Frågor och slutföranden	Medel
Självskadebeteende	Frågor och slutföranden	Medel
Identifiering av individer och slutsatsdragning av känsliga attribut	Uppmaningar	Inte tillgänglig
Användarinmatningsattack (Jailbreak)	Uppmaningar	Inte tillgänglig

Riskkategori	Fråga/slutföra	Tröskelvärde för allvarlighetsgrad
Hat och rättvisa	Frågor och slutföranden	Medel
Våld	Frågor och slutföranden	Medel
Sexuell	Frågor och slutföranden	Medel
Självskadebeteende	Frågor och slutföranden	Medel
Autentiseringsuppgifter för innehåll	Kompletteringar	Inte tillgänglig
Bedräglig generation av politiska kandidater	Uppmaningar	Inte tillgänglig
Skildringar av offentliga figurer	Uppmaningar	Inte tillgänglig
Användarinmatningsattack (Jailbreak)	Uppmaningar	Inte tillgänglig
Skyddat material – Konst och Studio-tecken	Uppmaningar	Inte tillgänglig
Olämpligt språk	Uppmaningar	Inte tillgänglig

Riskkategori	Fråga/slutföra	Tröskelvärde för allvarlighetsgrad
Hat och rättvisa	Frågor och slutföranden	Låg
Våld	Frågor och slutföranden	Låg
Sexuell	Frågor och slutföranden	Låg
Självskadebeteende	Frågor och slutföranden	Låg
Autentiseringsuppgifter för innehåll	Kompletteringar	Inte tillgänglig
Bedräglig generation av politiska kandidater	Uppmaningar	Inte tillgänglig
Skildringar av offentliga figurer	Uppmaningar	Inte tillgänglig
Användarinmatningsattack (Jailbreak)	Uppmaningar	Inte tillgänglig
Skyddat material – Konst och Studio-tecken	Uppmaningar	Inte tillgänglig
Olämpligt språk	Uppmaningar	Inte tillgänglig

Förutom ovanstående säkerhetskonfigurationer levereras DALL-E 3 också med snabbomvandling som standard. Denna omvandling sker på alla uppmaningar för att förbättra säkerheten för din ursprungliga uppmaning, särskilt i riskkategorierna för mångfald, bedräglig generation av politiska kandidater, skildringar av offentliga personer, skyddat material och andra.

Ljudmodeller

Riskkategori	Fråga/slutföra	Tröskelvärde för allvarlighetsgrad
Hat och rättvisa	Frågor och slutföranden	Medel
Våld	Frågor och slutföranden	Medel
Sexuell	Frågor och slutföranden	Medel
Självskadebeteende	Frågor och slutföranden	Medel
Användarinmatningsattack (Jailbreak)	Uppmaningar	Inte tillgänglig
Skyddat material – text	Kompletteringar	Inte tillgänglig
Skyddat material – kod	Kompletteringar	Inte tillgänglig

Feedback

Var den här sidan till hjälp?