Data och sekretess för anpassad namngiven entitetsigenkänning

2025-06-24

Viktigt!

Översättningar som inte är engelska tillhandahålls endast för enkelhetens skull. Se versionen EN-US av det här dokumentet för den slutgiltiga versionen.

Den här artikeln innehåller information på hög nivå om hur data bearbetas av anpassad namngiven entitetsigenkänning (NER). Du ansvarar för hur du använder och implementerar den här tekniken, inklusive att följa alla lagar och förordningar som gäller för dig. Det är till exempel ditt ansvar att:

Förstå var dina data bearbetas och lagras av den anpassade NER-tjänsten för att uppfylla reglerade skyldigheter för ditt program.
Se till att du har alla nödvändiga licenser, upphovsrättsskyddade rättigheter eller andra behörigheter som krävs för innehållet i din datauppsättning som används som grund för att skapa dina anpassade NER-modeller och för ditt innehåll som utvärderas vid distribution eller användning av anpassad NER i produktion.

Vilka data bearbetar anpassad NER?

Anpassad NER bearbetar följande data:

Användarens datauppsättning och taggar fil: Som en förutsättning för att skapa ett anpassat NER-projekt måste användarna ladda upp sin datauppsättning till sin Azure Blob Storage-container. En taggfil är en JSON-formaterad fil som innehåller en referens till användarens taggade entiteter. En användares datauppsättning innehåller tränings- och testuppsättningar, som utvecklare kan fördefinierade i taggar-filen, eller som kan väljas slumpmässigt under träningen. Träningsuppsättningen och taggfilen bearbetas under träningen för att skapa den anpassade NER-modellen. Testuppsättningen bearbetas av den tränade modellen senare för att utvärdera dess prestanda.
Anpassade NER-modeller: Baserat på användarens begäran om att träna modellen bearbetar anpassad NER de angivna taggade data för att mata ut en tränad modell. Användaren kan välja att träna en ny modell eller skriva över en befintlig. Den tränade modellen lagras sedan på tjänstens sida och används för att bearbeta modellutvärderingen. När utvecklaren är nöjd med modellens prestanda begär de att modellen ska distribueras för användning. Den distribuerade modellen lagras också på tjänstens sida, som används för att bearbeta användarens begäranden om förutsägelse via Analys-API:et.
Data som skickas för extrahering: Det här är användarens text, som skickas från ett klientprogram via Analysera API, som ska bearbetas för entitetsextrahering av den anpassade NER-modellen. Utdata från bearbetade data innehåller de extraherade entiteterna och deras konfidenspoäng. Detta returneras till klientens program för att utföra en åtgärd för att uppfylla användarens begäran.

Användarens data som laddas upp för träning, testning eller extrahering är kunddata. Custom NER använder inte kunddata för att förbättra sina allmänna maskininlärda modeller i produktförbättringssyfte. Vi använder aggregerad telemetri, till exempel vilka API:er som används och antalet anrop från varje prenumeration och resurs, i tjänstövervakningssyfte.

Hur bearbetar anpassad NER data?

Följande diagram illustrerar hur dina data bearbetas.

Diagram som visar hur data bearbetas.

Hur bevaras data och vilka kundkontroller är tillgängliga?

Custom NER är en dataprocessor för GDPR-ändamål. I enlighet med GDPR-principer har anpassade NER-användare fullständig kontroll för att visa, exportera eller ta bort kunddata. Användare kan utföra dessa åtgärder antingen via Language Studio eller programmatiskt med hjälp av Språk-API:er.

Dina data lagras bara i ditt Azure Storage-konto. Anpassad NER har bara åtkomst till läsning från den under träning och utvärdering. Custom NER loggar eller lagrar inte data som skickas av kunden för extraheringsuppgifter via förutsägelse-API:et.

Kundkontroller inkluderar:

Taggade data, som tillhandahålls av användaren som en förutsättning för att träna modellen, sparas i kundens Azure-lagringskonto som är anslutet till projektet när det skapas. Kunder kan redigera eller ta bort taggar när de vill via Language Studio.
Anpassade NER-projektmetadata lagras på tjänstens sida tills kunden tar bort projektet. När du skapar projektet fyller du i metadatafälten, till exempel projektnamn, beskrivning, språk, namnet på den anslutna blobcontainern och platsen för taggarnas fil.
Tränade anpassade NER-modeller lagras i tjänstens Azure-lagringskonton tills kunden tar bort dem. Modeller åsidosättas varje gång användaren tränar om dem.
Distribuerade anpassade NER-modeller finns kvar på tjänstens Azure-lagringskonton tills kunden tar bort distributionen eller tar bort själva modellen. Modellen åsidosättas varje gång användaren distribuerar till samma distributionsnamn.

Säkerhet för kundernas data

Azure-tjänster implementeras samtidigt som lämpliga tekniska och organisatoriska åtgärder bibehålls för att skydda kunddata i molnet.

Mer information om Microsofts säkerhetsåtaganden finns i Microsoft Trust Center.

Nästa steg

Introduktion till anpassad NER
Notering om anpassad NER-transparens
Vägledning för integrering och ansvarsfull användning
Microsoft AI-principer

Feedback

Var den här sidan till hjälp?