Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Automatisk inläsning stöder två lägen för att identifiera nya filer: kataloglista och filavisering. Du kan växla filupptäckningslägen mellan strömomstarter och ändå få garantier för bearbetning av data exakt en gång.
Kataloglistningsläge
I kataloglistningsläge identifierar Auto Loader nya filer genom att visa indatakatalogen. Med kataloglistningsläget kan du snabbt starta automatiska inläsningsströmmar utan några andra behörighetskonfigurationer än åtkomst till dina data i molnlagringen.
I Databricks Runtime 9.1 och senare kan Auto Loader automatiskt identifiera om filer anländer med lexikal beställning till molnlagringen och avsevärt minska mängden API-anrop som behövs för att identifiera nya filer. Mer information finns i Auto Loader-strömmar med kataloglistningsläge .
Läge för filavisering (rekommenderas)
I filmeddelandeläget används filmeddelanden och kötjänster i ditt molninfrastrukturkonto. Automatisk inläsning kan automatiskt konfigurera en meddelandetjänst och kötjänst som prenumererar på filhändelser från indatakatalogen. Om du aktiverar filhändelser på den externa platsen som innehåller filerna i fråga behöver du inte ange ytterligare behörigheter när du konfigurerar den automatiska inläsningsströmmen.
Filmeddelandeläget med filhändelser är mer högpresterande och skalbart än kataloglistan. Databricks rekommenderar filmeddelandeläge med hjälp av filhändelser i stället för kataloglistningsläge för de flesta arbetsbelastningar. Om du använder Auto Loader i kataloglistningsläge i dag rekommenderar Databricks att du migrerar till filmeddelandeläget med hjälp av mfile-händelser för att se betydande prestandaförbättringar. Se Konfigurera Auto Loader-strömmar i filnotifieringsläge.
Molnlagring som stödjer olika lägen
Den här tabellen visar beräkning som stöds för varje filidentifieringsläge, efter molnlagringsprovider.
Om du migrerar från en extern plats eller ett DBFS-fäste till en Unity Catalog-volym, fortsätter Auto Loader att ge exakt en gångs garantier.
| Molnlagring | Kataloglista | Filmeddelanden utan filhändelser | Meddelanden om filhändelser |
|---|---|---|---|
| AWS S3 | Alla versioner | Alla versioner | Databricks Runtime 14.3 LTS och senare |
| ADLS | Alla versioner | Alla versioner | Databricks Runtime 14.3 LTS och senare |
| GCS | Alla versioner | Alla versioner | Databricks Runtime 14.3 LTS och senare |
| Azure Blob Storage-lagringstjänst | Alla versioner | Alla versioner | Stöd saknas |
| DBFS | Alla versioner | Endast för monteringspunkter | Databricks Runtime 14.3 LTS och senare, om DBFS-monteringspunkten har en extern plats definierad i Unity Catalog |
| Unity Catalog-volym | Databricks Runtime 13.3 LTS och senare | Stöd saknas | Databricks Runtime 14.3 LTS och senare |