create_streaming_table

2025-10-10

Använd create_streaming_table()-funktionen för att skapa en måltabell för poster som genereras av strömningsåtgärder, inklusive create_auto_cdc_flow(), create_auto_cdc_from_snapshot_flow(), och append_flow utdataposter.

Anmärkning

Funktionerna create_target_table() och create_streaming_live_table() är inaktuella. Databricks rekommenderar att du uppdaterar befintlig kod för att använda create_streaming_table() funktionen.

Syntax

from pyspark import pipelines as dp

dp.create_streaming_table(
  name = "<table-name>",
  comment = "<comment>",
  spark_conf={"<key>" : "<value", "<key" : "<value>"},
  table_properties={"<key>" : "<value>", "<key>" : "<value>"},
  path="<storage-location-path>",
  partition_cols=["<partition-column>", "<partition-column>"],
  cluster_by_auto = True,
  cluster_by = ["<clustering-column>", "<clustering-column>"],
  schema="schema-definition",
  expect_all = {"<key>" : "<value", "<key" : "<value>"},
  expect_all_or_drop = {"<key>" : "<value", "<key" : "<value>"},
  expect_all_or_fail = {"<key>" : "<value", "<key" : "<value>"},
  row_filter = "row-filter-clause"
)

Parameterar

Parameter	Typ	Description
`name`	`str`	Obligatoriskt. Tabellnamnet.
`comment`	`str`	En beskrivning av tabellen.
`spark_conf`	`dict`	En lista över Spark-konfigurationer för körning av den här frågan
`table_properties`	`dict`	En lista över `dict` för tabellen.
`path`	`str`	En lagringsplats för tabelldata. Om den inte har angetts använder du den hanterade lagringsplatsen för schemat som innehåller tabellen.
`partition_cols`	`list`	En lista över en eller flera kolumner som ska användas för partitionering av tabellen.
`cluster_by_auto`	`bool`	Aktivera automatisk klustring av vätska på tabellen. Detta kan kombineras med `cluster_by` och definiera de kolumner som ska användas som inledande klustringsnycklar, följt av övervakning och automatiska uppdateringar av val av nycklar baserat på arbetsbelastningen. Se Automatisk flytande klustring.
`cluster_by`	`list`	Aktivera flytande klustring i tabellen och definiera de kolumner som ska användas som klustringsnycklar. Se Använda flytande klustring för tabeller.
`schema`	`str` eller `StructType`	En schemadefinition för tabellen. Scheman kan definieras som en SQL DDL-sträng eller med ett Python-`StructType`.
`expect_all`, `expect_all_or_dropexpect_all_or_fail`	`dict`	Datakvalitetsbegränsningar för tabellen. Ger samma beteende och använder samma syntax som dekoratörsfunktioner för förväntningar, men implementeras som en parameter. Se Förväntningar.
`row_filter`	`str`	(Offentlig förhandsversion) En radfiltersats för tabellen. Se Publicera tabeller med radfilter och kolumnmasker.

Feedback

Var den här sidan till hjälp?

Dela via

create_streaming_table

Syntax

Parameterar

Feedback

Ytterligare resurser