Dela via


Självstudie: Kopiera data till Azure Data Box via NFS

Viktigt!

Azure Data Box har nu stöd för tilldelning på åtkomstnivå på blobnivå. Stegen i den här guiden återspeglar den uppdaterade datakopieringsprocessen och är specifikt för blockblobar.

Hjälp med att fastställa lämplig åtkomstnivå för dina blockblobdata finns i avsnittet Fastställa lämpliga åtkomstnivåer för blockblobar . Följ stegen i avsnittet Kopiera data till Data Box för att kopiera dina data till lämplig åtkomstnivå.

Informationen i detta avsnitt gäller för beställningar som gjorts efter den 1 april 2024.

I den här handledningen beskrivs hur du ansluter till din värddator och kopierar data med hjälp av det lokala webbgränssnittet.

I den här tutorialen lär du dig följande:

  • Förutsättningar
  • Ansluta till Data Box
  • Kopiera data till Data Box

Förutsättningar

Innan du börjar bör du kontrollera att:

  1. Du har slutfört självstudien : Konfigurera Azure Data Box.
  2. Du har fått din Data Box-enhet och orderstatusen i portalen är Levererad.
  3. Du har en värddator som har de data du vill kopiera över till Data Box. Your host computer must:
    • Köra ett operativsystem som stöds.
    • Vara ansluten till en höghastighetsnätverk. Vi rekommenderar starkt att du har en anslutning på minst 10 GbE. Om en 10 GbE-anslutning inte är tillgänglig använder du en 1 GbE-datalänk, men kopieringshastigheterna påverkas.

Innan du börjar bör du kontrollera att:

  1. Du har slutfört självstudien : Konfigurera Azure Data Box.
  2. Du har fått din Data Box-enhet och orderstatusen i portalen är Levererad.
  3. Du har en värddator som har de data du vill kopiera över till Data Box. Your host computer must:
    • Köra ett operativsystem som stöds.
    • Vara ansluten till en höghastighetsnätverk. Vi rekommenderar starkt att du har minst en 100 GbE-anslutning. Om en 100 GbE-anslutning inte är tillgänglig använder du en 10 GbE- eller 1 GbE-datalänk, men kopieringshastigheterna påverkas.

Ansluta till Data Box

Utifrån det lagringskontot som väljs skapar Data Box upp till:

  • Tre aktier för varje associerat lagringskonto för GPv1 och GPv2.
  • En andel för premiumlagring.
  • En delning för ett bloblagringskonto, innehållande en mapp för var och en av de fyra åtkomstnivåerna.

I följande tabell identifieras namnen på de Data Box-resurser som du kan ansluta till och vilken typ av data som laddas upp till mållagringskontot. Den identifierar också hierarkin med resurser och kataloger som du kopierar dina källdata till.

Lagringstyp Share name Entitet på första nivån Entitet på andra nivån Entitet på tredje nivån
Block blob <lagringskontoNamn>_BlockBlob <\accessTier> <\containerName> <\blockBlob>
Page blob <\storageAccountName>_PageBlob <\containerName> <\pageBlob>
Filhantering <\storageAccountName>_AzFile <\fildelningsnamn> <\file>

Du kan inte kopiera filer direkt till rotmappen för någon Data Box-resurs. Skapa i stället mappar i Data Box-resursen beroende på ditt användningsfall.

Blockblobar stöder tilldelning av åtkomstnivåer på filnivå. Innan du kopierar filer till blockblobdelningen är vår rekommenderade bästa praxis att lägga till nya undermappar inom rätt åtkomstlager. När du har skapat nya undermappar fortsätter du sedan att lägga till filer i varje undermapp efter behov.

En ny container skapas för vilken som helst mapp som finns vid roten av blockblobdelningen. Alla filer i mappen kopieras till lagringskontots standardåtkomstnivå som en blockblob.

Mer information om blobåtkomstnivåer finns i Åtkomstnivåer för blobdata. Mer detaljerad information om metodtips för åtkomstnivå finns i Metodtips för att använda blobåtkomstnivåer.

I följande tabell visas UNC-sökvägen till resurserna i din Data Box och motsvarande URL för Azure Storage-sökväg som data laddas upp till. The final Azure Storage path URL can be derived from the UNC share path.

Azure Storage-typer Data Box-resurser
Azure Block blobs
  • UNC path to shares: \\<DeviceIPAddress>\<storageaccountname_BlockBlob>\<accessTier>\<ContainerName>\myBlob.txt
  • URL för Azure Storage: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.txt
  • Azure Page blobs
  • UNC path to shares: \\<DeviceIPAddress>\<storageaccountname_PageBlob>\<ContainerName>\myBlob.vhd
  • URL för Azure Storage: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.vhd
  • Azure Files
  • UNC path to shares: \\<DeviceIPAddress>\<storageaccountname_AzFile>\<ShareName>\myFile.txt
  • URL för Azure Storage: https://<storageaccountname>.file.core.windows.net/<ShareName>/myFile.txt
  • Om du använder en Linux-värddator utför du följande steg för att konfigurera Data Box för att tillåta åtkomst till NFS-klienter.

    1. Ange IP-adresserna för de tillåtna klienterna som har åtkomst till resursen. I det lokala webbgränssnittet går du till sidan Anslut och kopiera. Under NFS-inställningar väljer du NFS-klientåtkomst.

      Konfigurera NFS-klientåtkomst

    2. Ange IP-adressen för NFS-klienten och välj Lägg till. Du kan konfigurera åtkomst för flera NFS-klienter genom att upprepa det här steget. Välj OK.

      Konfigurera IP-adressen för en NFS-klient

    3. Kontrollera att Linux-värddatorn har en NFS-klient av en version som stöds installerad. Använd den specifika versionen för din Linux-distribution.

    4. När NFS-klienten har installerats använder du följande kommando för att montera NFS-resursen på Data Box-enheten:

      sudo mount <Data Box device IP>:/<NFS share on Data Box device> <Path to the folder on local Linux computer>

      Använd följande exempel för att ansluta till en Data Box-resurs med hjälp av NFS. I exemplet är 10.161.23.130Data Box-enhetens IP-adress . The share Mystoracct_Blob is mounted on the ubuntuVM, and the mount point is /home/databoxubuntuhost/databox.

      sudo mount -t nfs 10.161.23.130:/Mystoracct_Blob /home/databoxubuntuhost/databox

      För Mac-klienter måste du lägga till ett extra alternativ på följande sätt:

      sudo mount -t nfs -o sec=sys,resvport 10.161.23.130:/Mystoracct_Blob /home/databoxubuntuhost/databox

      Viktigt!

      Du kan inte kopiera filer direkt till lagringskontots rotmapp . I rotmappen för ett blockbloblagringskonto hittar du en mapp som motsvarar var och en av de tillgängliga åtkomstnivåerna.

      Om du vill kopiera dina data till Azure Data Box måste du först välja den mapp som motsvarar någon av åtkomstnivåerna. Skapa sedan en undermapp i den nivåns mapp för att lagra dina data. Kopiera slutligen dina data till den nyligen skapade undermappen. Den nya undermappen representerar containern som skapades i lagringskontot under inmatningen. Dina data laddas upp till den här containern som blobar.

    Fastställa lämpliga åtkomstnivåer för blockblobar

    Viktigt!

    Informationen i detta avsnitt gäller beställningar som görs efter den 1 april 2024.

    Med Azure Storage kan du lagra blockblobdata på flera åtkomstnivåer inom samma lagringskonto. Med den här möjligheten kan data organiseras och lagras mer effektivt baserat på hur ofta de används. Följande tabell innehåller information och rekommendationer om Azure Storage-åtkomstnivåer.

    Tier Rekommendation Bästa praxis
    Hot Användbart för onlinedata som används eller ändras ofta. Den här nivån har de högsta lagringskostnaderna, men de lägsta åtkomstkostnaderna. Data på den här nivån bör användas regelbundet och aktivt.
    Cool Användbart för onlinedata som används eller ändras sällan. Den här nivån har lägre lagringskostnader och högre åtkomstkostnader än den frekventa nivån. Data på den här nivån ska lagras i minst 30 dagar.
    Kall Användbart för onlinedata som används eller ändras sällan men som fortfarande kräver snabb hämtning. Den här nivån har lägre lagringskostnader och högre åtkomstkostnader än den cool-nivån. Data på den här nivån ska lagras i minst 90 dagar.
    Arkiv Användbart för offlinedata som sällan används och som har lägre svarstidskrav. Data på den här nivån bör lagras i minst 180 dagar. Data som tas bort från arkivnivån inom 180 dagar debiteras en avgift för tidig borttagning.

    Mer information om blobåtkomstnivåer finns i Åtkomstnivåer för blobdata. Mer detaljerade metodtips finns i Metodtips för att använda blobåtkomstnivåer.

    Du kan överföra blockblobdata till lämplig åtkomstnivå genom att kopiera dem till motsvarande mapp i Data Box. Den här processen beskrivs mer detaljerat i avsnittet Kopiera data till Azure Data Box .

    Kopiera data till Data Box

    När du har anslutit till en eller flera Data Box-resurser är nästa steg att kopiera data. Innan du påbörjar datakopian bör du tänka på följande begränsningar:

    • Se till att du kopierar dina data till den resurs som motsvarar det dataformat som krävs. For instance, copy block blob data to the share for block blobs. Copy VHDs to the page blob share. Om dataformatet inte matchar lämplig resurstyp misslyckas datauppladdningen till Azure under ett senare steg.
    • När du kopierar data till AzFile - eller PageBlob-resurserna skapar du först en mapp i resursens rot och kopierar sedan filer till den mappen.
    • När du kopierar data till BlockBlob-resursen skapar du en undermapp inom önskad åtkomstnivå och kopierar sedan data till den nyligen skapade undermappen. Undermappen representerar en container till vilken data laddas upp som blobar. You can't copy files directly to a share's root folder.
    • När du kopierar data kontrollerar du att datastorleken överensstämmer med de storleksgränser som beskrivs i storleksgränserna för Azure-lagringskontot.
    • Samtidiga uppladdningar av Data Box och ett annat program som inte är Data Box kan potentiellt leda till fel i uppladdningsjobbet och skadade data.
    • Om du använder både SMB- och NFS-protokollen för datakopior rekommenderar vi att du:
      • Använd olika lagringskonton för SMB och NFS.
      • Kopiera inte samma data till samma slutmål i Azure med både SMB och NFS. I sådana fall kan slutresultatet inte fastställas.
      • Även om kopiering via både SMB och NFS parallellt kan fungera rekommenderar vi inte att du gör det eftersom det är utsatt för mänskliga fel. Vänta tills SMB-datakopian är klar innan du startar en NFS-datakopia.
    • När du kopierar data till blockblobresursen skapar du en undermapp inom önskad åtkomstnivå och kopierar sedan data till den nyligen skapade undermappen. Undermappen representerar en container som dina data laddas upp till som blobar. Du kan inte kopiera filer direkt till rotmappen i lagringskontot.
    • If ingesting case-sensitive directory and file names from an NFS share to NFS on Data Box:
      • The case is preserved in the name.

      • The files are case-insensitive.

        Om du till exempel kopierar SampleFile.txt och Samplefile.Txtbevaras ärendet i namnet när det kopieras till Data Box. Men eftersom de anses vara samma fil skriver den senaste uppladdade filen över den första filen.

    Viktigt!

    Se till att du underhåller en kopia av källdata tills du kan bekräfta att dina data har kopierats till Azure Storage.

    Om du använder en Linux-värddator, använd ett kopieringsprogram som liknar Robocopy. Några av alternativen som är tillgängliga i Linux är rsync, FreeFileSync, Unison eller Ultracopier.

    Kommandot cp är ett av de bästa alternativen för att kopiera en katalog. Mer information om användningen finns på cp man-sidorna.

    Om du använder rsync alternativet för en kopia med flera trådar följer du dessa riktlinjer:

    • Installera CIFS Utils- eller NFS Utils-paketet, beroende på vilket filsystem din Linux-klient använder.

      sudo apt-get install cifs-utils

      sudo apt-get install nfs-utils

    • Installera rsync och parallell (varierar beroende på den Linux-distribuerade versionen).

      sudo apt-get install rsync

      sudo apt-get install parallel

    • Skapa en monteringspunkt.

      sudo mkdir /mnt/databox

    • Mount the volume.

      sudo mount -t NFS4 //Databox IP Address/share_name /mnt/databox

    • Mirror folder directory structure.

      rsync -za --include='*/' --exclude='*' /local_path/ /mnt/databox

    • Kopiera filerna.

      cd /local_path/; find -L . -type f | parallel -j X rsync -za {} /mnt/databox/{}

      där j anger antalet parallelliseringar, X = antal parallella kopior

      Vi rekommenderar att du börjar med 16 parallella kopior och öka antalet trådar beroende på tillgängliga resurser.

    Viktigt!

    Följande Linux-filtyper stöds inte: symboliska länkar, teckenfiler, blockfiler, sockets och pipes. Dessa filtyper resulterar i fel under steget Förbered för att skicka .

    Meddelanden visas under kopieringsprocessen för att identifiera fel.

    Ladda ned och visa fel i Anslut och kopiera

    Välj Ladda ned lista med ärenden.

    Ladda ned problemlistan för ett kopieringsfel

    Öppna listan för att visa information om felet och välj lösnings-URL:en för att visa den rekommenderade lösningen.

    Problem i en lista över problem med kopieringsfel

    Mer information finns i Visa felloggar under datakopiering till Data Box. En detaljerad lista över fel i samband med datakopieringen finns i Felsöka problem med Data Box.

    För att säkerställa dataintegriteten beräknas kontrollsumman direkt medan data kopieras. När kopieringen är klar kontrollerar du det använda utrymmet och det lediga utrymmet på enheten.

    Kontrollera ledigt och använt utrymme på instrumentpanelen

    Nästa steg

    I den här kursen har du lärt dig om Azure Data Box-ämnen som att:

    • Krav för Data Box-datakopiering
    • Ansluta till Data Box
    • Fastställa lämpliga åtkomstnivåer för blockblobar
    • Kopiera data till Data Box

    Gå vidare till nästa självstudie och lär dig hur du skickar tillbaka din Data Box-enhet till Microsoft.