Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Den här artikeln beskriver de moduler i Machine Learning Studio (klassisk) som du kan använda för grundläggande datamanipulering.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Machine Learning Studio (klassisk) stöder uppgifter som är specifika för maskininlärning, till exempel normalisering eller funktionsval. Modulerna i den här kategorin är avsedda för mer allmänna uppgifter.
Datamanipuleringsuppgifter
Modulerna i den här kategorin är avsedda att stödja grundläggande datahanteringsuppgifter som kan behöva utföras i Machine Learning Studio (klassisk). Följande uppgifter är exempel på viktiga datahanteringsuppgifter:
- Kombinera två datauppsättningar, antingen med hjälp av kopplingar eller genom att sammanfoga kolumner eller rader.
- Skapa nya kategorier som ska användas för att gruppera data.
- Ändra kolumnrubriker, ändra kolumndatatyper eller flagga kolumner som funktioner eller etiketter.
- Sök efter saknade värden och ersätt dem sedan med lämpliga värden.
Relaterade uppgifter
- Utför sampling eller dela upp en datauppsättning i tränings- och testuppsättningar: Använd modulerna Datatransformering – Exempel och Dela .
- Skala tal, normalisera data eller placera numeriska värden i lagerplatser: Använd modulerna Datatransformering – Skala och Minska .
- Utför beräkningar på numeriska datafält eller för att generera vanlig statistik: Använd verktygen i Statistiska funktioner.
Exempel
Exempel på hur du arbetar med komplexa data i maskininlärningsexperiment finns i följande exempel i Azure AI Gallery:
- Databearbetning och analys: Visar viktiga verktyg och processer.
- Canceridentifiering: Visar hur du partitionar datamängder och sedan tillämpar särskild bearbetning på varje partition.
Moduler i den här kategorin
Kategorin Datatransformering – Manipulering innehåller följande moduler:
- Lägg till kolumner: Lägger till en uppsättning kolumner från en datauppsättning till en annan.
- Lägg till rader: Lägger till en uppsättning rader från en indatauppsättning i slutet av en annan datauppsättning.
- Tillämpa SQL transformation: Kör en SQLite-fråga på indatauppsättningar för att transformera data.
- Rensa data som saknas: Anger hur du hanterar värden som saknas i en datauppsättning. Den här modulen ersätter Borstning av saknade värden, som har gjorts inaktuell.
- Konvertera till indikatorvärden: Konverterar kategoriska värden i kolumner till indikatorvärden.
- Redigera metadata: Redigerar metadata som är associerade med kolumner i en datauppsättning.
- Gruppera kategoriska värden: Grupperar data från flera kategorier till en ny kategori.
- Koppla data: Ansluter till två datauppsättningar.
- Ta bort dubblettrader: Tar bort dubblettrader från en datauppsättning.
- Välj Kolumner i datauppsättning: Väljer kolumner som ska inkluderas i en datauppsättning eller undantas från en datauppsättning i en åtgärd.
- Välj kolumner transformera: Skapar en transformering som väljer samma delmängd av kolumner som i en angiven datauppsättning.
- SMOTE: Ökar antalet exempel med låg förekomst i en datamängd med hjälp av syntetisk översampling av fördrampling.