Dela via


Snabbstart: Samlad inläsning med Synapse Studio

Det är enkelt att ladda upp data med guiden för massinläsning i Synapse Studio. Synapse Studio är en funktion i Azure Synapse Analytics. Guiden Massinläsning vägleder dig genom att skapa ett T-SQL-skript med COPY-instruktionen för att massinläsa data i en dedikerad SQL-pool.

Ingångspunkter till guiden för massinläsning

Du kan massinläsa data genom att högerklicka på följande område i Synapse Studio: en fil eller mapp från ett Azure-lagringskonto som är kopplat till din arbetsyta.

Skärmbild som visar hur du högerklickar på en fil eller mapp från ett lagringskonto.

Förutsättningar

  • Trollkarlen genererar en COPY-instruktion som använder Microsoft Entra pass-through för autentisering. Din Microsoft Entra-användare måste ha åtkomst till arbetsytan med minst Azure-rollen Storage Blob Data Contributor för Azure Data Lake Storage Gen2-kontot.

  • Du måste ha de behörigheter som krävs för att använda COPY-instruktionen och skapa tabellbehörigheter om du skapar en ny tabell att läsa in till.

  • Den länkade tjänsten som är associerad med Data Lake Storage Gen2-kontot måste ha åtkomst till filen eller mappen för att kunna läsas in. Om autentiseringsmekanismen för den länkade tjänsten är till exempel en hanterad identitet måste arbetsytans hanterade identitet ha minst Storage Blob Data Reader-behörighet för lagringskontot.

  • Om ett virtuellt nätverk är aktiverat på din arbetsyta, kontrollera att den integrerade körningen som är associerad med Data Lake Storage Gen2-kontots länkade tjänster för källdata och platsen för felfilen har interaktiv redigering aktiverad. Interaktiv redigering krävs för autoschemaupptäckt, förhandsgranskning av källfilinnehållet och bläddring av lagringskonton i Data Lake Storage Gen2 inom guiden.

Steg

  1. På panelen Källlagringsplats väljer du lagringskontot och den fil eller mapp som du läser in från. Guiden försöker automatiskt identifiera Parquet-filer och avgränsade textfiler (CSV), inklusive mappning av källfälten från filen till lämpliga SQL-måldatatyper.

    Skärmbild som visar hur du väljer en källplats.

  2. Välj inställningarna för filformat, inklusive dina felinställningar för när det finns avvisade rader under massinläsningsprocessen. Du kan också välja Förhandsgranska data för att se hur COPY-instruktionen parsar filen så att du kan konfigurera inställningarna för filformatet. Välj Förhandsgranska data varje gång du ändrar en inställning för filformat för att se hur COPY-instruktionen parsar filen med den uppdaterade inställningen.

    Skärmbild som visar förhandsgranskning av data.

    Anmärkning

    • Guiden för massinläsning stödjer inte förhandsgranskning av data med fältavgränsare med flera tecken. När du specificerar en fältavgränsare med flera tecken kommer guiden att förhandsgranska data i en enda kolumn.
    • När du väljer Härled kolumnnamn tolkar guiden Massinläsning kolumnnamnen från den första raden som anges av fältet Första raden. Verktyget Massinläsning ökar automatiskt FIRSTROW värdet i COPY-instruktionen med 1 för att ignorera rubrikraden.
    • Det finns stöd för att ange radavgränsare med flera tecken i COPY-instruktionen. Guiden Massinläsning stöder det dock inte och genererar ett fel.
  3. Välj den dedikerade SQL-pool som du använder för att läsa in, inklusive om belastningen ska vara för en befintlig tabell eller en ny tabell. Skärmbild som visar hur du väljer en målplats.

  4. Välj Konfigurera kolumnmappning för att se till att du har rätt kolumnmappning. Namn på anteckningskolumner identifieras automatiskt om du har aktiverat Infer-kolumnnamn. För nya tabeller är det viktigt att konfigurera kolumnmappningen för att uppdatera målkolumndatatyperna.

    Skärmbild som visar hur du konfigurerar kolumnmappning.

  5. Välj Öppna skript. Ett T-SQL-skript genereras med COPY-instruktionen för att ladda från din datasjö. Skärmbild som visar hur du öppnar SQL-skriptet.

Nästa steg