Dela via


Data och sekretess för anpassad textklassificering

Viktigt!

Översättningar som inte är engelska tillhandahålls endast för enkelhetens skull. Se versionen EN-US av det här dokumentet för den slutgiltiga versionen.

Den här artikeln innehåller information på hög nivå om hur data bearbetas av anpassad textklassificering. Kom ihåg att du ansvarar för din användning och implementeringen av den här tekniken, vilket innefattar att följa alla lagar och förordningar som gäller för dig. Det är till exempel ditt ansvar att:

  • Förstå var dina data bearbetas och lagras av den anpassade textklassificeringstjänsten för att uppfylla reglerade skyldigheter för ditt program.
  • Se till att du har alla nödvändiga licenser, upphovsrättsskyddade rättigheter eller andra behörigheter som krävs för innehållet i din datauppsättning som används som grund för att skapa dina anpassade textklassificeringsmodeller.

Det är ditt ansvar att följa alla tillämpliga lagar och förordningar i din jurisdiktion.

Vilka data bearbetar anpassad textklassificering?

Anpassad textklassificering bearbetar följande data:

  • Användarens datauppsättning och taggar: Som en förutsättning för att skapa ett anpassat textklassificeringsprojekt måste användarna ladda upp sin datauppsättning till sin Azure Blob Storage-container. En taggar-fil är en JSON-formaterad fil som innehåller referenser till en användares taggade data och klasser. Användaren kan antingen ta med egna taggar eller tagga sina data via användargränssnittet i Language Studio. Hur som helst är en taggar-fil som innehåller taggade data och klasser avgörande för träningen.

    En användares datauppsättning delas upp i tränings- och testuppsättningar, där delningen antingen kan fördefinierades av utvecklare i en taggar-fil eller väljas slumpmässigt under träningen. Träningsuppsättningen och taggfilen bearbetas under träningen för att skapa den anpassade textklassificeringsmodellen. Testuppsättningen bearbetas senare av den tränade modellen för att utvärdera dess prestanda.

  • Anpassade textklassificeringsmodeller: Baserat på användarens begäran om att träna modellen bearbetar anpassad textklassificering de angivna taggade data för att mata ut en tränad modell. Användaren kan välja att träna en ny modell eller skriva över en befintlig. Den tränade modellen lagras sedan på tjänstens sida och används för att bearbeta modellutvärderingen. När utvecklaren är nöjd med modellens prestanda begär de att modellen ska distribueras för användning. Den distribuerade modellen lagras också på tjänstens sida, som används för att bearbeta användarens begäranden om förutsägelse via Analys-API:et.

  • Data som skickas för klassificering: Dessa data är användarens text som skickas från en kunds klientprogram via Analysera API som ska bearbetas för textklassificering av den anpassade maskininlärningsmodellen. Utdata från bearbetade data innehåller de förutsagda klasserna tillsammans med deras konfidenspoäng. Dessa utdata returneras till klientens program för att utföra en åtgärd för att uppfylla användarens begäran.

Anpassad textklassificering samlar inte in eller lagrar kunddata för att förbättra sina maskininlärda modeller eller för produktförbättringsändamål. Vi använder aggregerad telemetri, till exempel vilka API:er som används och antalet anrop från varje prenumeration och resurs, i tjänstövervakningssyfte.

Hur den anpassade textklassificeringen bearbetar data?

Följande diagram illustrerar hur dina data bearbetas.

Diagram som visar hur data bearbetas.

Hur bevaras data och vilka kundkontroller är tillgängliga?

Anpassad textklassificering är en databehandlare för GDPR-ändamål (General Data Protection Regulation). I enlighet med GDPR-principer har användare med anpassad textklassificering fullständig kontroll för att visa, exportera eller ta bort användarinnehåll antingen via Language Studio eller programmatiskt med hjälp av språk-API:er.

Dina data lagras bara i ditt Azure Storage-konto. anpassad textklassificering har endast åtkomst till läsning från den under träningen.

Kundkontroller inkluderar:

  • Taggade data som tillhandahålls av användaren som en förutsättning för att träna modellen sparas i kundens Azure Storage-konto som är anslutet till projektet under skapandet. Kunder kan redigera eller ta bort taggar när de vill via Language Studio.
  • Metadata för anpassade textklassificeringsprojekt lagras på tjänstens sida tills kunden tar bort projektet. Projektets metadata är de fält som du fyller i när du skapar projektet, till exempel projektnamn, beskrivning, språk, namnet på den anslutna blobcontainern och taggarnas filplats.
  • Tränade anpassade textklassificeringsmodeller lagras i tjänstens Azure Storage-konton tills kunden tar bort dem. Modellen skrivs över varje gång användaren tränar om den.
  • Distribuerade anpassade textklassificeringsmodeller finns kvar på tjänstens Azure Storage-konton tills kunden tar bort distributionen eller tar bort själva modellen. Modellen skrivs över varje gång användaren distribuerar till samma distributionsnamn.

Valfritt: Säkerhet för kundernas data

Azure-tjänster implementeras samtidigt som lämpliga tekniska och organisatoriska åtgärder bibehålls för att skydda kunddata i molnet.

Mer information om Microsofts sekretess- och säkerhetsåtaganden finns i Microsoft Trust Center.

Nästa steg