Dela via


Så här använder du grundmodeller med öppen källkod som har kurerats av Azure Machine Learning

I den här artikeln får du lära dig hur du finjusterar, utvärderar och distribuerar grundmodeller i modellkatalogen.

Du kan snabbt testa valfri förtränad modell med hjälp av exempelinferensformuläret på modellkortet, vilket ger dina egna exempelindata för att testa resultatet. Dessutom innehåller modellkortet för varje modell en kort beskrivning av modellen och länkar till exempel för kodbaserad slutsatsdragning, finjustering och utvärdering av modellen.

Så här utvärderar du grundmodeller med hjälp av dina egna testdata

Du kan utvärdera en grundmodell mot din testdatauppsättning med hjälp av antingen formuläret Utvärdera användargränssnitt eller med hjälp av kodbaserade exempel som är länkade från modellkortet.

Utvärdera med hjälp av studio

Du kan anropa formuläret Utvärdera modell genom att välja knappen Utvärdera på modellkortet för valfri grundmodell.

Skärmbild som visar formuläret för utvärderingsinställningar när användaren har valt knappen Utvärdera på ett modellkort för en grundmodell.

Du kan utvärdera varje modell för den specifika slutsatsdragningsuppgift som du använder modellen för.

Testdata:

  1. Skicka in de testdata som du vill använda för att utvärdera din modell. Du kan välja att antingen ladda upp en lokal fil (i JSONL-format) eller välja en befintlig registrerad datauppsättning från din arbetsyta.
  2. När du har valt datauppsättningen måste du mappa kolumnerna från dina indata baserat på det schema som krävs för uppgiften. Mappa till exempel kolumnnamnen som motsvarar nycklarna "mening" och "etikett" för textklassificering

Skärmbild som visar utvärderingskartan i grundmodellernas utvärderingsformulär.

Compute:

  1. Ange det Azure Machine Learning Compute-kluster som du vill använda för att finjustera modellen. Utvärderingen måste köras på GPU-beräkning. Se till att du har tillräcklig beräkningskvot för de beräknings-SKU:er som du vill använda.

  2. Välj Slutför i formuläret Utvärdera för att skicka utvärderingsjobbet. När jobbet är klart kan du visa utvärderingsmått för modellen. Baserat på utvärderingsmåtten kan du bestämma om du vill finjustera modellen med dina egna träningsdata. Dessutom kan du bestämma om du vill registrera modellen och distribuera den till en slutpunkt.

Utvärdera med hjälp av kodbaserade exempel

För att du ska kunna komma igång med modellutvärderingen tillhandahåller vi exempel (både Python-notebook-filer och CLI-exempel) i git-lagringsplatsen Utvärderingsexempel i azureml-examples. Varje modellkort länkar också till utvärderingsexempel för motsvarande uppgifter

Finjustera grundmodeller med hjälp av dina egna träningsdata

Om du vill förbättra modellprestandan i din arbetsbelastning kanske du vill finjustera en grundmodell med dina egna träningsdata. Du kan enkelt finjustera dessa grundmodeller genom att antingen finjustera inställningarna i studion eller med hjälp av kodbaserade exempel som är länkade från modellkortet.

Finjustera med studio

Du kan anropa formuläret för finjustera inställningar genom att välja knappen Finjustera på modellkortet för valfri grundmodell.

Finjustera inställningar:

Skärmbild som visar inställningsalternativen för finjusterande inställningar i formuläret finjustera inställningar för grundmodeller.

Finjustering av aktivitetstyp

  • Varje förtränad modell från modellkatalogen kan finjusteras för en specifik uppsättning uppgifter (till exempel textklassificering, tokenklassificering, frågesvar). Välj den uppgift som du vill använda i listrutan.

Träningsdata

  1. Skicka in de träningsdata som du vill använda för att finjustera din modell. Du kan välja att antingen ladda upp en lokal fil (i JSONL-, CSV- eller TSV-format) eller välja en befintlig registrerad datauppsättning från din arbetsyta.

  2. När du har valt datauppsättningen måste du mappa kolumnerna från dina indata baserat på det schema som krävs för uppgiften. Till exempel: mappa kolumnnamnen som motsvarar nycklarna "mening" och "etikett" för textklassificering

Skärmbild som visar finjusteringskartan i guiden utvärdera grundmodeller.

  • Valideringsdata: Skicka in de data som du vill använda för att verifiera din modell. Om du väljer Automatisk delning reserveras en automatisk uppdelning av träningsdata för validering. Du kan också ange en annan valideringsdatauppsättning.
  • Testdata: Skicka in de testdata som du vill använda för att utvärdera din finjusterade modell. Om du väljer Automatisk delning reserveras en automatisk uppdelning av träningsdata för testning.
  • Beräkning: Ange det Azure Machine Learning Compute-kluster som du vill använda för att finjustera modellen. Finjustering måste köras på GPU-beräkning. Vi rekommenderar att du använder beräknings-SKU:er med A100/V100 GPU:er vid finjustering. Se till att du har tillräcklig beräkningskvot för de beräknings-SKU:er som du vill använda.
  1. Välj Slutför i finjusteringsformuläret för att skicka ditt finjusteringsjobb. När jobbet är klart kan du visa utvärderingsmått för den finjusterade modellen. Du kan sedan registrera de finjusterade modellutdata från finjusteringsjobbet och distribuera den här modellen till en slutpunkt för slutsatsdragning.

Finjustera med hjälp av kodbaserade exempel

För närvarande har Azure Machine Learning stöd för finjusteringsmodeller för följande språkuppgifter:

  • Textklassificering
  • Tokenklassificering
  • Frågor och svar
  • Summering
  • Översättning

För att göra det möjligt för användarna att snabbt komma igång med finjustering har vi publicerat exempel (både Python-notebook-filer och CLI-exempel) för varje uppgift i azureml-exemplens git-repo för finjustering. Varje modellkort länkar också till finjusteringsexempel för finjusterande uppgifter som stöds.

Distribuera grundmodeller till slutpunkter för slutsatsdragning

Du kan distribuera grundmodeller (både förtränade modeller från modellkatalogen och finjusterade modeller när de har registrerats på din arbetsyta) till en slutpunkt som sedan kan användas för slutsatsdragning. Distribution till både standarddistributioner och hanterad beräkning stöds. Du kan distribuera dessa modeller med hjälp av guiden Distribuera användargränssnitt eller med hjälp av kodbaserade exempel som är länkade från modellkortet.

Distribuera med studio

Du kan distribuera en modell genom att välja knappen Använd den här modellen på modellkortet för valfri grundmodell och välja antingen Serverlöst API eller Hanterad beräkning. Alla modeller stöder inte serverlös API-distribution. Om modellen inte stöder serverlöst API visas endast alternativet Hanterad beräkning .

Skärmbild som visar distributionsknappen på grundmodellkortet.

Distributionsinställningar

När du väljer Serverlöst API tas du till distributionsformuläret. Med distributionsformuläret kan du ange distributionsnamnet och om du vill aktivera innehållsfiltrering och den modellversion som ska användas för distributionen. Du kan också ange exempel på indata för att testa modellen.

När du väljer Hanterad beräkning tas du till formuläret för distributionsinställningar. Med formuläret för distributionsinställningar kan du ange vilken SKU för virtuell dator som ska användas, antal instanser och det slutpunktsnamn som ska användas för distributionen.

Skärmbild som visar distributionsalternativen på grundmodellkortet när användaren har valt knappen distribuera.

Delad kvot

Om du distribuerar en modell från modellkatalogen men inte har tillräckligt med kvot tillgänglig för distributionen kan du använda en kvot från en delad kvotpool under en begränsad tid i Azure Machine Learning. Mer information om delade kvot finns i Delade kvoter för Azure Machine Learning.

Skärmbild som visar alternativet att tillfälligt distribuera en Llama-modell med delad kvot.

Distribuera med kodbaserade exempel

För att du snabbt ska komma igång med distribution och slutsatsdragning tillhandahåller vi exempel i inferensexemplen i git-lagringsplatsen azureml-examples. De publicerade exemplen innehåller Python-notebook-filer och CLI-exempel. Varje modellkort länkar också till slutsatsdragningsexempel för realtids- och Batch-slutsatsdragning.

Importera grundmodeller

Om du söker i modellkatalogen och inte hittar den modell med öppen källkod som du behöver kan du importera den från Hugging Face till din Azure Machine Learning-arbetsyta. Knappen Importera visas bara i modellkatalogen när sökningen inte returnerar några resultat.

Hugging Face är ett bibliotek med öppen källkod för bearbetning av språkteknologi (NLP) som tillhandahåller förtränade modeller för populära NLP-uppgifter. För närvarande har modellimport stöd för import av modeller för följande uppgifter, så länge modellen uppfyller kraven som anges i modellimport-notbooken:

  • fyllningsmask
  • tokenklassificering
  • frågesvar
  • summering
  • textgenerering
  • textklassificering
  • översättning
  • bildklassificering
  • text till bild

Kommentar

Modeller från Hugging Face omfattas av licensvillkor från tredje part som är tillgängliga på sidan Hugging Face-modellinformation. Det är ditt ansvar att följa modellens licensvillkor.

När din sökning inte ger några resultat, välj Importera modellanteckningsbok för att använda Modellimport-anteckningsboken.

Skärmbild som visar knappen för modellimport eftersom den visas när sökningen inte returnerar några resultat i grundmodellkatalogen.

Notebook-filen för modellimport ingår också i git-lagringsplatsen azureml-examples här.

För att kunna importera modellen måste du skicka in den MODEL_ID modell som du vill importera från Hugging Face. Bläddra bland modeller på Hugging Face Hub och identifiera modellen som ska importeras. Kontrollera att modellens aktivitetstyp finns bland de aktivitetstyper som stöds. Kopiera modell-ID:t, som är tillgängligt i sidans URI eller kan kopieras med kopieringsikonen bredvid modellnamnet. Tilldela den till variabeln "MODEL_ID" i notebook-filen för modellimport. Till exempel:

Skärmbild som visar ett exempel på en Hugging Face-modell-ID (

Du måste ange beräkning för att modellimporten ska köras. Om du kör modellimporten importeras den angivna modellen från Hugging Face och registreras på din Azure Machine Learning-arbetsyta. Du kan sedan finjustera den här modellen eller distribuera den till en slutpunkt för slutsatsdragning.

Läs mer