Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
I den här artikeln beskrivs de textanalysmoduler som ingår i Machine Learning Studio (klassisk). Dessa moduler innehåller specialiserade beräkningsverktyg för att arbeta med både strukturerad och ostrukturerad text, inklusive:
- Flera alternativ för förbearbetning av text.
- Språkidentifiering.
- Skapa funktioner från text med anpassningsbara n-gram-ordlistor.
- Funktionshashing för att effektivt analysera text utan förbearbetning eller avancerad språklig analys.
- Vowpal Wabbit, för mycket snabb maskininlärning i text. Vowpal Wabbit stöder funktions-hashing, ämnesmodellering (LDA) och klassificering.
- Namngiven entitetsigenkänning för att extrahera namn på personer, platser och organisationer från ostrukturerad text.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Exempel
Exempel på textanalys med Machine Learning finns i Azure AI Gallery:
Nyhetskategorisering: Använder funktionshashing för att klassificera artiklar i en fördefinierad lista över kategorier.
Hitta liknande företag: Använder texten i Wikipedia-artiklar för att kategorisera företag.
Textklassificering: Visar processen från slutet till slut med att använda text från Twitter-meddelanden i attitydanalys (femdelsexempel).
Lista över moduler
Kategorin Textanalys i Machine Learning Studio (klassisk) innehåller följande moduler:
- Identifiera språk: Identifierar språket för varje rad i indatafilen.
- Extrahera nyckelfraser från text: Extraherar nyckelfraser från en viss text.
- Extrahera N-Gram-funktioner från text: Skapar N-Gram-ordlistefunktioner och gör funktionsval på dem.
- Funktionshashing: Konverterar textdata till heltalskodade funktioner med hjälp av Vowpal Wabbit-biblioteket.
- Latent Dirichlet-allokering: Utför ämnesmodellering med hjälp av Vowpal Wabbit-biblioteket för LDA.
- Igenkänning av namngiven entitet: Identifierar namngivna entiteter i en textkolumn.
- Förbearbeta text: Utför rensningsåtgärder på text.
- Score Vowpal Wabbit 7-4 Model: Poängindata från Azure med hjälp av version 7–4 av Vowpal Wabbit-maskininlärningssystemet.
- Score Vowpal Wabbit 7-10 Model: Poängindata från Azure med hjälp av version 7–10 av Vowpal Wabbit-maskininlärningssystemet.
- Score Vowpal Wabbit 8 Model: Poängdata från Azure med hjälp av version 8 av Vowpal Wabbit-maskininlärningssystemet.
- Träna Vowpal Wabbit 7-4-modell: Tränar en modell med hjälp av version 7–4 av Vowpal Wabbit-maskininlärningssystemet.
- Träna Vowpal Wabbit 7-10-modellen: Tränar en modell med hjälp av version 7–10 av Vowpal Wabbit-maskininlärningssystemet.
- Träna Vowpal Wabbit 8-modell: Tränar en modell med hjälp av version 8 av Vowpal Wabbit-maskininlärningssystemet.