Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
En Azure Databricks-tabell finns i ett schema och innehåller rader med data. Standardtabelltypen som skapas i Azure Databricks är en hanterad tabell i Unity Catalog.
I följande exempel visas en hanterad tabell med namnet prod.people_ops_employees som innehåller data om fem anställda. Som en hanterad tabell lagras datafilerna på Unity Catalogs hanterade lagringsplats i molnlagring.
Lagringsformat
Tabelltyper i Azure Databricks definierar hur data ägs och används. Separat definierar lagringsformatet hur data är fysiskt strukturerade och spåras på disken.
Azure Databricks har stöd för två primära lagringsformat för öppen tabell:
- Delta Lake är standardlagringsformatet för hanterade och externa tabeller i Azure Databricks.
- Apache Iceberg stöds i hanterade och externa tabeller i Azure Databricks. Det här formatet är användbart när du integrerar med Iceberg-ekosystemet.
Dessa format lägger till ett transaktionellt lagringslager som spårar metadata och möjliggör efterlevnad av atomicitet, konsekvens, isolering och hållbarhet (ACID), tidsresor och andra funktioner.
Tabelltyper
Azure Databricks erbjuder tre primära tabelltyper, var och en utformad för olika scenarier för datahantering och ägarskapsmodeller. Valet av tabelltyp avgör hur Azure Databricks hanterar underliggande datafiler och metadata.
Den primära differentiatorn för tabelltyper i Azure Databricks är den ägande katalogen enligt beskrivningen i följande tabell:
| Tabelltyp | Hantera katalog | Läs-/skrivstöd | Prestanda optimering | Kostnadsoptimering för lagring |
|---|---|---|---|---|
| Förvaltad | Unity-katalog | Yes | Yes | Yes |
| External | Ingen (endast filer) | Yes | Endast manuellt | Endast manuellt |
| Främmande | Ett externt system eller en katalogtjänst | Skrivskyddad | Nej | Nej |
Hanterade tabeller
Hanterade tabeller hanterar underliggande datafiler tillsammans med metaarkivregistreringen. Databricks rekommenderar att du använder hanterade tabeller när du skapar en ny tabell. Hanterade tabeller i Unity Catalog är standard när du skapar tabeller i Azure Databricks. Se Hanterade tabeller.
Externa tabeller
Externa tabeller, som ibland kallas ohanterade tabeller, refererar till data som lagras utanför Databricks i ett externt lagringssystem, till exempel lagring av molnobjekt. De frikopplar hanteringen av underliggande datafiler från registrering av metaarkiv. Unity Catalog stöder externa tabeller i flera format, inklusive Delta Lake. Externa tabeller i Unity Catalog kan lagra datafiler med hjälp av vanliga format som kan läsas av externa system. Se Externa tabeller.
Externa tabeller
Utländska tabeller representerar data som lagras i externa system som är anslutna till Azure Databricks via Lakehouse Federation. Sekundärtabeller är skrivskyddade i Azure Databricks. Se Sekundärtabeller.
Tabeller i Unity-katalogen
I Unity Catalog ligger tabellerna på den tredje nivån i namnområdet på tre nivåer (catalog.schema.table), enligt följande diagram:
Grundläggande tabellbehörigheter
De flesta tabellåtgärder kräver USE CATALOG och USE SCHEMA behörigheter för katalogen och schemat som innehåller en tabell.
I följande tabell sammanfattas de ytterligare behörigheter som krävs för vanliga tabellåtgärder i Unity Catalog:
| Verksamhet | Permissions |
|---|---|
| Skapa en tabell |
CREATE TABLE på det innehållande schemat |
| Fråga en tabell |
SELECT i tabellen |
| Uppdatera, ta bort, sammanfoga eller infoga data i en tabell |
SELECT och MODIFY på tabellen |
| Ta bort en tabell |
MANAGE i tabellen |
| Ersätt en tabell |
MANAGE i tabellen, CREATE TABLE i det innehållande schemat |
Mer information om behörigheter för Unity-katalogen finns i Hantera privilegier i Unity Catalog.