Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Den här artikeln visar hur du lägger till en Källa för PostgreSQL Database Change Data Capture (CDC) i en händelseström.
Med källanslutningsappen PostgreSQL Database Change Data Capture (CDC) för Microsoft Fabric-händelseströmmar kan du samla in en ögonblicksbild av aktuella data i en PostgreSQL-databas. För närvarande stöds PostgreSQL Database Change Data Capture (CDC) från följande tjänster där databaserna kan nås offentligt:
- Azure-databas för PostgreSQL
- Amazon RDS för PostgreSQL
- Amazon Aurora PostgreSQL
- Google Cloud SQL för PostgreSQL
När PostgreSQL Database CDC-källan har lagts till i händelseströmmen avbildas ändringar på radnivå i de angivna tabellerna. Dessa ändringar kan sedan bearbetas i realtid och skickas till olika mål för ytterligare analys.
Anteckning
Den här källan stöds inte i följande regioner i din arbetsytekapacitet: Västra USA3, Västra Schweiz.
Förutsättningar
Åtkomst till en arbetsyta i Fabric-kapacitetslicensläge eller utvärderingslicensläge med medverkande eller högre behörighet.
Registrerad användaråtkomst i PostgreSQL-databasen.
PostgreSQL-databasen måste vara offentligt tillgänglig och inte vara bakom en brandvägg eller skyddas i ett virtuellt nätverk.
CDC aktiverat i PostgreSQL-databasen och tabellerna.
Om du har Azure Database for PostgreSQL följer du stegen i nästa avsnitt för att aktivera CDC. Detaljerad information finns i Logisk replikering och logisk avkodning – Azure Database for PostgreSQL – flexibel server.
För andra PostgreSQL-databaser, se Debezium Connector för PostgreSQL :: Debezium Documentation.
Om du inte har en händelseström, skapa en händelseström.
Aktivera CDC i din PostgreSQL-databas
I det här avsnittet används Azure Database for PostgreSQL- som exempel.
Följ dessa steg för att aktivera CDC i din flexibla Azure Database for PostgreSQL-server:
På sidan Azure Database for PostgreSQL – flexibel server i Azure Portal väljer du Serverparametrar i navigeringsmenyn.
På sidan Serverparametrar :
- Ange wal_level till logisk.
- Uppdatera max_worker_processes till minst 16.
Spara ändringarna och starta om servern.
Bekräfta att din Azure Database for PostgreSQL – flexibel server-instans tillåter offentlig nätverkstrafik.
Ge administratörsanvändaren replikeringsbehörigheter genom att köra följande SQL-instruktion. Om du vill använda ett annat användarkonto för att ansluta din PostgreSQL DB för att hämta CDC kontrollerar du att användaren är tabellägare.
ALTER ROLE <admin_user_or_table_owner_user> WITH REPLICATION;
Starta guiden Välj en datakälla
Om du inte har lagt till någon källa i händelseströmmen ännu väljer du Panelen Använd extern källa .
Om du lägger till källan i en redan publicerad händelseström växlar du till Redigeringsläge , väljer Lägg till källa i menyfliksområdet och väljer sedan Externa källor.
På sidan Välj en datakälla söker du efter och väljer Anslut på PostgreSQL DB (CDC)-rutan.
Konfigurera och ansluta till PostgreSQL Database CDC
På sidan Anslut väljer du Ny anslutning.
I avsnittet Anslutningsinställningar anger du följande information.
Server: Serveradressen för postgreSQL-databasen, till exempel my-pgsql-server.postgres.database.azure.com.
Databas: Databasnamnet, till exempel my_database.
Anslutningsnamn: Ange ett namn för anslutningen.
Autentiseringstyp, Välj Grundläggande och ange användarnamn ochlösenord för databasen.
Anteckning
För närvarande stöder Fabric-händelseströmmar endast grundläggande autentisering.
Välj Anslut för att slutföra anslutningsinställningarna.
Port: Ange portnumret för servern. Standardvärdet är 5432. Om den valda molnanslutningen har konfigurerats i Hantera anslutningar och gatewayerkontrollerar du att portnumret matchar den som anges där. Om de inte matchar kommer portnumret i molnanslutningen i Hantera anslutningar och gatewayer att ha företräde.
Du kan välja mellan två alternativ när du samlar in ändringar från databastabeller:
- Alla tabeller: Samla in ändringar från varje tabell i databasen.
-
Ange tabellnamn: Gör att du kan ange en delmängd av tabeller med hjälp av en kommaavgränsad lista. Du kan använda antingen: fullständiga tabellidentifierare i formatet
schemaName.tableNameeller giltiga reguljära uttryck. Exempel: -
dbo.test.*: Välj alla tabeller vars namn börjar medtesti schematdbo. -
dbo\.(test1|test2): Väljdbo.test1ochdbo.test2.
Du kan kombinera båda formaten i listan. Den totala teckengränsen för hela posten är 102 400 tecken.
Facknamn (valfritt): Ange namnet på det logiska postgreSQL-avkodningsfacket som skapades för strömmande ändringar från ett visst plugin-program för en viss databas/schema. Servern använder det här facket för att strömma händelser till Eventstream Streaming Connector. Det får endast innehålla små bokstäver, siffror och understreck.
- Om inget anges används ett GUID för att skapa facket, vilket kräver lämpliga databasbehörigheter.
- Om det finns ett angivet facknamn använder anslutningsappen det direkt.
Du kan expandera Avancerade inställningar för att få åtkomst till ytterligare konfigurationsalternativ för PostgreSQL Database CDC-källan:
Publikationsnamn: Anger namnet på den logiska replikeringspublikationen PostgreSQL som ska användas. Detta måste matcha en befintlig publikation i databasen, annars skapas den automatiskt beroende på autoskapningsläget. Standardvärde:
dbz_publication.Anteckning
Anslutningsanvändaren måste ha superanvändarbehörighet för att kunna skapa publikationen. Vi rekommenderar att du skapar publikationen manuellt innan du startar anslutningsappen för första gången för att undvika behörighetsrelaterade problem.
Läge för automatisk skapande av publikation: Styr om och hur publikationen skapas automatiskt. Alternativen inkluderar:
-
Filtered(standard): Om den angivna publikationen inte finns skapar anslutningsappen en som endast innehåller de valda tabellerna (enligt tabellens inkluderingslista). -
AllTables: Om den angivna publikationen finns använder anslutningsappen den. Om den inte finns skapar anslutningsappen en som innehåller alla tabeller i databasen. -
Disabled: Anslutningen skapar ingen publikation. Om den angivna publikationen saknas, utlöser anslutningen ett undantag och stoppar. I det här fallet måste publikationen skapas manuellt i databasen.
Mer information finns i Debezium-dokumentationen om autoskapningsläget för publicering
-
Decimalhanteringsläge: Anger hur anslutningsappen hanterar PostgreSQL
DECIMAL- ochNUMERICkolumnvärden:-
Precise: Representerar värden med exakta decimaltyper (till exempel JavaBigDecimal) för att säkerställa fullständig precision och noggrannhet i datarepresentationen. -
Double: Konverterar värden till flyttal med dubbel precision. Detta förbättrar användbarheten och prestandan, men kan leda till att precisionen går förlorad. -
String: Kodar värden som formaterade strängar. Detta gör dem enkla att använda i underordnade system men förlorar semantisk information om den ursprungliga numeriska typen.
-
På sidan Granska + anslut granskar du sammanfattningen och väljer sedan Lägg till.
Visa uppdaterad händelseström
Du kan se att PostgreSQL Database CDC-källan har lagts till i din händelseström i redigeringsläge.
Om du vill implementera den nya PostgreSQL DB CDC-källan väljer du Publicera. När du har slutfört dessa steg är din PostgreSQL DB CDC-källa tillgänglig för visualisering i Live View-funktionen.
Relaterat innehåll
Andra anslutningsappar:
- Amazon Kinesis Data Streams
- Azure Cosmos DB
- Azure Event Hubs
- Azure Service Bus
- Azure IoT Hub
- Azure SQL-databasens ändringsdatainsamling (CDC)
- Confluent Kafka
- Anpassad slutpunkt
- Google Cloud Pub/Sub
- MySQL Database CDC
- PostgreSQL Database CDC
- Exempeldata
- Azure Blob Storage-händelser
- Fabric-arbetsytehändelse