Dela via


Azure Databricks-tabeller

Azure Databricks tillhandahåller flera tabelltyper och lagringsformat för att uppfylla olika datahanteringsbehov. Det här avsnittet beskriver hanterade, externa och externa tabeller, tillsammans med Delta Lake- och Apache Iceberg-lagringsformaten som driver avancerade funktioner som atomicitet, konsekvens, isolering och hållbarhetstransaktioner (ACID) och tidsresor.

Huvudkoncept

Lär dig grunderna för tabelltyper, lagringsformat och Integration av Unity Catalog.

Ämne Description
Tabellbegrepp Grundläggande begrepp och grundläggande information om tabelltyper, lagringsformat och Integrering av Unity Catalog.

Tabelltyper

Utforska olika tabelltyper och deras funktioner för olika datahanteringsscenarier.

Tabelltyp Description
Hanterade tabeller Tabeller där Azure Databricks hanterar både metadata och datafiler. Rekommenderas för nya tabeller med optimerad prestanda och lagring.
externa tabeller Tabeller som refererar till data som lagras i externa lagringssystem vid hantering av metadata i Unity Catalog.
Sekundärtabeller Skrivskyddade tabeller som representerar data i externa system som är anslutna via Lakehouse Federation.

Lagringsformat

Arbeta med öppna tabellformat som tillhandahåller avancerade funktioner för datahantering.

Format Description
Delta Lake Standardlagringsformat som tillhandahåller ACID-transaktioner, tidsresor och schematillämpning för hanterade och externa tabeller.
Apache Iceberg Öppna tabellformat för integrering med Iceberg-ekosystemet med stöd för avancerad metadatahantering.

Tabellhantering

Konfigurera och optimera tabellbeteende, struktur och prestanda.

Egenskap Description
Tabellbegränsningar Definiera och framtvinga datakvalitetsregler med kontrollbegränsningar och inte null-begränsningar.
Schemaframtvingande Kontrollera hur Azure Databricks hanterar schemaändringar och datatypsframtvingande under skrivningar.
Tabellpartitionering Organisera data efter partitionsnycklar för att förbättra frågeprestanda och datahantering.
Övervakning av tabellstorlek Övervaka och analysera användnings- och tillväxtmönster för tabelllagring.
Konvertera externt till hanterat Migrera externa tabeller till hanterade tabeller för bättre prestanda och hantering.
Extern partitionsidentifiering Identifiera och registrera partitioner automatiskt i externa tabeller som lagras i molnlagring.