Van toepassing op: SQL Server 2016 (13.x) en latere versies
PolyBase versus gekoppelde servers
In de volgende tabel worden de verschillen tussen PolyBase- en gekoppelde serverfuncties gemarkeerd:
| PolyBase | Linked Servers |
|---|---|
| Databasebereikobject | Object met exemplaarbereik |
| Maakt gebruik van ODBC-stuurprogramma's | Maakt gebruik van OLEDB-providers |
| Ondersteunt alleen-lezenbewerkingen voor alle gegevensbronnen en schrijfbewerkingen naar sommige externe gegevensbronnen | Ondersteunt zowel lees- als schrijfbewerkingen |
| Query's naar externe gegevensbron vanuit één verbinding kunnen worden uitgeschaald | Query's naar een externe gegevensbron vanuit één verbinding kunnen niet worden uitgeschaald |
| Pushdown predicaten wordt ondersteund | Pushdown predicaten wordt ondersteund |
| Er is geen afzonderlijke configuratie nodig voor beschikbaarheidsgroep | Afzonderlijke configuratie die nodig is voor elk exemplaar in de beschikbaarheidsgroep |
| Alleen basisverificatie | Basis- en geïntegreerde verificatie |
| Geschikt voor analysequery's die een groot aantal rijen verwerken | Geschikt voor OLTP-query's die enkele of weinig rijen retourneren |
| Query's met behulp van een externe tabel kunnen niet deelnemen aan gedistribueerde transacties | Gedistribueerde query's kunnen deelnemen aan gedistribueerde transacties |
Wat is er nieuw in PolyBase in SQL Server 2022?
SQL Server 2022 (16.x) ondersteunt nu CSV-, Parquet- en Delta-bestanden die zijn opgeslagen in Azure Storage Account v2, Azure Data Lake Storage Gen2 of een S3-compatibele objectopslag met behulp van de S3 REST API, on-premises of in de cloud.
SQL Server 2022 (16.x) kan nu CREATE EXTERNAL TABLE als SELECT (CETAS) gebruiken, samen met opdrachten zoals OPENROWSET, CREATE EXTERNAL TABLE (CET) en alle nieuwe T-SQL-verbeteringen.
Momenteel is ondersteuning voor externe Hadoop-gegevensbronnen verwijderd in SQL Server 2022 (16.x).
Sql Server 2022 (16.x) Cumulatieve update 2 introduceert nu ondersteuning voor Oracle TNS-bestanden. Raadpleeg CREATE EXTERNAL DATA SOURCE voor meer informatie en voorbeelden.
Lees meer over Data Virtualization met PolyBase voor SQL Server 2022 en bekijk de verbeteringen van SQL Server 2022 PolyBase.
Wat is er nieuw in PolyBase in SQL Server 2019?
PolyBase in SQL Server 2019 (15.x) kan nu gegevens lezen uit een grotere verscheidenheid aan gegevensbronnen. De gegevens uit deze externe gegevensbronnen kunnen worden opgeslagen als externe tabellen op uw SQL Server. PolyBase biedt ook ondersteuning voor pushdownberekeningen voor deze externe gegevensbronnen, met uitzondering van algemene ODBC-typen.
Compatibele gegevensbronnen
- SQL Server
- Oracle
- Teradata
- MongoDB
- Compatibele algemene ODBC-typen
Sql Server 2019 (15.x) Cumulatieve update 19 introduceert nu ondersteuning voor Oracle TNS-bestanden. Raadpleeg CREATE EXTERNAL DATA SOURCE voor meer informatie en voorbeelden.
Note
PolyBase kan verbinding met externe gegevensbronnen toestaan met behulp van ODBC-stuurprogramma's van derden. Deze stuurprogramma's worden niet geleverd samen met PolyBase en werken mogelijk niet zoals bedoeld. Zie PolyBase configureren voor toegang tot externe gegevens met algemene ODBC-typen voor meer informatie.
Welke CONNECTION_OPTIONS kan ik opgeven voor verbinding met gegevensbronnen van derden?
Controleer de CONNECTION_OPTIONS CREATE EXTERNAL DATA SOURCE (Transact-SQL) voor ondersteunde verbindingsopties voor gegevensproviders voor SQL Server, Oracle, Teradata, de MongoDB-API voor Cosmos DB en algemene ODBC-gegevensproviders.
Hoe kan ik het uitvoeringsplan voor externe query's van PolyBase-pushdownberekeningen bekijken?
Dit is mogelijk via een aantal methoden, afhankelijk van de versie van SQL Server. Zie Problemen met PolyBase oplossen - Het PolyBase-queryplan weergeven.
Hoe kan ik zien of er een PolyBase-pushdownberekening plaatsvindt?
Wordt PolyBase ondersteund in Azure SQL Database?
Nee, maar u kunt query's uitvoeren op gegevens in de bestanden die zijn geplaatst in Azure Blob Storage met behulp van de functie OPENROWSET of CREATE EXTERNAL TABLE gebruiken om te lezen uit een serverloze SQL-pool in Synapse Analytics. Zie Azure SQL kan Azure Data Lake Storage-bestanden lezen met behulp van externe Synapse SQL-tabellen voor meer informatie.
Wordt PolyBase ondersteund in Azure SQL Managed Instance?
Azure SQL Managed Instance heeft zijn eigen mogelijkheden voor gegevensvirtualisatie voor Azure Data Lake Storage (ADLS) en Azure Blob Storage als gegevensbronnen. Zie Gegevensvirtualisatie met Azure SQL Managed Instance voor meer informatie.
Welke poorten moet ik toestaan via mijn firewall voor PolyBase?
Er zijn geen extra poorten nodig om te openen voor PolyBase zelf, behalve in het geval van een PolyBase-uitschaalgroep. Zonder een uitschaalgroep hoeft de PolyBase-service alleen geen firewallregel te vereisen.
Op Windows-servers maakt PolyBase gebruik van de poorten die worden gebruikt door SQL Server in de sectie IPAll van de TCP/IP-instellingen in SQL Server Configuration Manager. Zie TCP/IP-eigenschappen voor meer informatie. Op Linux-servers maakt PolyBase gebruik van de instelling network.tcpport . Zie TCP-poort voor meer informatie.
Zie poortinformatie in de volgende vraag voor PolyBase-uitschaalgroepen via meerdere Windows-servers.
U moet echter andere poorten toestaan voor communicatie met de verschillende externe gegevensbronnen die door PolyBase worden gebruikt. Raadpleeg de ODBC-configuratie, Azure-resourceconfiguratie of specifieke documentatie voor gegevensbronnen. For example:
| Source platform | Reference |
|---|---|
| Microsoft SQL Server | Poorten die worden gebruikt door SQL Server |
| Hortonworks HDP | Administering HDFS |
| Cloudera CDH | Poorten die worden gebruikt door CDH-onderdelen |
Welke poorten worden gebruikt voor polybase-uitschaalgroep?
De PolyBase-service voor gegevensverplaatsing maakt standaard verbinding met het hoofdknooppunt van een uitschaalgroep via een reeks poorten van TCP 16450-16460, meestal met 16450-16453, plus poort 17001. Deze poorten worden alleen gebruikt wanneer een PolyBase-uitschaalgroep is geconfigureerd en moet worden toegestaan via serverfirewalls. Sql Server Setup moet automatisch een lokale firewallregel maken die deze poorten toestaat bij de installatie van de functie. Zie PolyBase-scale-outgroepen configureren in Windows voor meer informatie.
Note
De uitschaalgroepen van Microsoft SQL Server PolyBase worden buiten gebruik gesteld. De functionaliteit van uitschalende groepen wordt verwijderd uit het product in SQL Server 2022 (16.x).
PolyBase in Big Data Clusters versus PolyBase in zelfstandige exemplaren
Voor meer informatie over verbindingen met de algemene ODBC-connector raadpleegt u onze handleiding voor het configureren van algemene ODBC-typen.
In de volgende tabel worden de PolyBase-functies gemarkeerd die beschikbaar zijn in sql Server 2019 (15.x) zelfstandige installatie en SQL Server 2019 (15.x) big data-cluster:
| Feature | Big Data-cluster | Zelfstandige instantie |
|---|---|---|
| Externe gegevensbron maken voor SQL Server, Oracle, Teradata en Mongo DB | X | X |
| Externe gegevensbron maken met behulp van een compatibel ODBC-stuurprogramma van derden | X | |
| Externe gegevensbron maken voor HADOOP-gegevensbron | X | X |
| Externe gegevensbron maken voor Azure Blob Storage | X | X |
| Een externe tabel maken in een SQL Server-gegevensgroep | X | |
| Een externe tabel maken in een SQL Server-opslaggroep | X | |
| Uitvoering van uitschalen van query's | X | X (alleen Windows) |
Important
Microsoft SQL Server 2019 Big Data Clusters wordt buiten gebruik gesteld. Zie de aankondigingsblogpost en Opties voor big data op het Microsoft SQL Server-platformvoor meer informatie.