Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Gäller för:
Databricks SQL
Databricks Runtime 11.3 LTS och senare
Returnerar filnivåtillståndet för en Auto Loader eller read_files dataström.
Syntax
cloud_files_state( { TABLE ( table_name ) | checkpoint } )
Argumenten
-
table_name: Identifieraren för den strömmande tabell som skrivs till av
read_files. Namnet får inte innehålla någon temporal specifikation. Finns i Databricks Runtime 13.3 LTS och senare. -
checkpoint: EttSTRINGbokstavligt uttryck. Kontrollpunktskatalogen för en dataström som använder Auto Loader-källan. Se Vad är Auto Loader?.
Returer
Returnerar en tabell med följande schema:
path STRING NOT NULL PRIMARY KEYSökvägen till en fil.
size BIGINT NOT NULLStorleken på en fil i byte.
create_time TIMESTAMP NOT NULLDen tid då en fil skapades.
discovery_time TIMESTAMP NOT NULLGäller för:
Databricks SQL
Databricks Runtime 16.4 och senareDen tid då en fil upptäcktes.
processed_time TIMESTAMP NOT NULLGäller för:
Databricks SQL
Databricks Runtime 16.4 och senare när cloudFiles.cleanSourceär aktiverat. Se Alternativ för automatisk inläsning.Den tid då en fil bearbetades. Om en batch stöter på ett fel och görs ett nytt försök kan en fil bearbetas flera gånger. När återförsök görs innehåller det här fältet den senaste bearbetningstiden.
commit_time TIMESTAMPGäller för:
Databricks SQL
Databricks Runtime 16.4 och senare när cloudFiles.cleanSourceär aktiverat. Se Alternativ för automatisk inläsning.Den tid då en fil checkades in på kontrollpunkten efter bearbetningen.
NULLom filen inte har bearbetats ännu. Det finns ingen garanterad svarstid för att markera en fil som bekräftad. en fil kan bearbetas men markeras som bekräftad godtyckligt senare. Att markera filen som bekräftad innebär att Auto Loader inte kräver filen för bearbetning igen.archive_time TIMESTAMPGäller för:
Databricks SQL
Databricks Runtime 16.4 och senare när cloudFiles.cleanSourceär aktiverat. Se Alternativ för automatisk inläsning.Den tid då en fil arkiverades.
NULLom filen inte har arkiverats.archive_mode STRINGGäller för:
Databricks SQL
Databricks Runtime 16.4 och senare när cloudFiles.cleanSourceär aktiverat. Se Alternativ för automatisk inläsning.MOVEomcloudFiles.cleanSourcehar angetts tillMOVEnär filen arkiverades.DELETEomcloudFiles.cleanSourcehar angetts tillDELETEnär filen arkiverades.NULLomcloudFiles.cleanSourcehar angetts tillOFF(standard).move_location STRINGGäller för:
Databricks SQL
Databricks Runtime 16.4 och senare när cloudFiles.cleanSourceär aktiverat. Se Alternativ för automatisk inläsning.Den fullständiga sökvägen dit filen flyttades för arkiveringsåtgärden när
cloudFiles.cleanSourcevar inställd påMOVE.NULLom filen inte har arkiverats ellercloudFiles.cleanSourceär en avDELETEellerOFF.source_id STRINGID:t för den automatiska inläsningskällan i strömningsfrågan. Det här värdet är
'0'för strömmar som matas in från en enda plats för molnobjektarkivet.flow_name STRINGGäller för:
Databricks SQL
Databricks Runtime 13.3 och senareRepresenterar ett specifikt strömmande flöde i Lakeflow Deklarativa Pipelines som innehåller en eller flera molnfilkällor. NULL om ingen table_name angavs.
ingestion_state STRINGGäller för:
Databricks SQL
Databricks Runtime 16.4 och senare när cloudFiles.cleanSourceär aktiverat. Se Alternativ för automatisk inläsning.Om filen har matats in, vilket anges av något av följande status:
-
NULL: Filen har inte bearbetats än, eller så kan filtillståndet inte fastställas av Auto Loader. -
PROCESSING: Filen bearbetas. -
SKIPPED_CORRUPTED: Filen matades inte in eftersom den var skadad. -
SKIPPED_MISSING: Filen matades inte in eftersom den inte hittades under bearbetningen. -
INGESTED: Filen har bearbetats av mottagaren minst en gång. Den kan bearbetas igen av icke-idempotenta mottagare, somforeachBatch, vid fel i strömmen. Endast filer med ett icke-null-fältcommit_timesom är i tillståndetINGESTEDhar slutfört bearbetningen. -
NOT_RECOGNIZED_BY_DBR: Reserverad för versionskompatibilitet. Det här tillståndet visas för tillstånd som introduceras i senare Databricks Runtime-versioner som inte är okända av tidigare Databricks Runtime-versioner.
-
Behörigheter
Du måste ha:
- Om du använder en strömningstabellidentifierare
- Databricks Runtime 17.1 och nedan:
OWNERbehörigheter i strömningstabellen - Databricks SQL och Databricks Runtime 17.2 och senare:
SELECTochMODIFYbehörigheter i strömningstabellen
- Databricks Runtime 17.1 och nedan:
-
READ FILESbehörigheter på kontrollpunktsplatsen om du anger en kontrollpunkt på en extern plats.
Exempel
-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
/some/input/path
/other/input/path
-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
/some/input/path
/other/input/path
-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
/some/input/path
/other/input/path
Begränsningar
- Användare som läser en vy som refererar till
cloud_files_stateen strömmande tabell måste ha bådeSELECTbehörighet för vyn och de behörigheter som krävs för strömningstabellen.