Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Azure Databricks tillhandahåller flera tabelltyper och lagringsformat för att uppfylla olika datahanteringsbehov. Det här avsnittet beskriver hanterade, externa och externa tabeller, tillsammans med Delta Lake- och Apache Iceberg-lagringsformaten som driver avancerade funktioner som atomicitet, konsekvens, isolering och hållbarhetstransaktioner (ACID) och tidsresor.
Huvudkoncept
Lär dig grunderna för tabelltyper, lagringsformat och Integration av Unity Catalog.
| Ämne | Description |
|---|---|
| Tabellbegrepp | Grundläggande begrepp och grundläggande information om tabelltyper, lagringsformat och Integrering av Unity Catalog. |
Tabelltyper
Utforska olika tabelltyper och deras funktioner för olika datahanteringsscenarier.
| Tabelltyp | Description |
|---|---|
| Hanterade tabeller | Tabeller där Azure Databricks hanterar både metadata och datafiler. Rekommenderas för nya tabeller med optimerad prestanda och lagring. |
| externa tabeller | Tabeller som refererar till data som lagras i externa lagringssystem vid hantering av metadata i Unity Catalog. |
| Sekundärtabeller | Skrivskyddade tabeller som representerar data i externa system som är anslutna via Lakehouse Federation. |
Lagringsformat
Arbeta med öppna tabellformat som tillhandahåller avancerade funktioner för datahantering.
| Format | Description |
|---|---|
| Delta Lake | Standardlagringsformat som tillhandahåller ACID-transaktioner, tidsresor och schematillämpning för hanterade och externa tabeller. |
| Apache Iceberg | Öppna tabellformat för integrering med Iceberg-ekosystemet med stöd för avancerad metadatahantering. |
Tabellhantering
Konfigurera och optimera tabellbeteende, struktur och prestanda.
| Egenskap | Description |
|---|---|
| Tabellbegränsningar | Definiera och framtvinga datakvalitetsregler med kontrollbegränsningar och inte null-begränsningar. |
| Schemaframtvingande | Kontrollera hur Azure Databricks hanterar schemaändringar och datatypsframtvingande under skrivningar. |
| Tabellpartitionering | Organisera data efter partitionsnycklar för att förbättra frågeprestanda och datahantering. |
| Övervakning av tabellstorlek | Övervaka och analysera användnings- och tillväxtmönster för tabelllagring. |
| Konvertera externt till hanterat | Migrera externa tabeller till hanterade tabeller för bättre prestanda och hantering. |
| Extern partitionsidentifiering | Identifiera och registrera partitioner automatiskt i externa tabeller som lagras i molnlagring. |