Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Kommentar
Den här artikeln beskriver Databricks Connect för Databricks Runtime 13.3 LTS och senare.
I den här artikeln beskrivs hur du installerar Databricks Connect för Python. Se Vad är Databricks Connect?.
Krav
Kontrollera att din arbetsyta och lokala miljö uppfyller kraven innan du installerar Databricks Connect. Se Användningskrav för Databricks Connect.
Aktivera en virtuell Python-miljö
Databricks rekommenderar starkt att du har en virtuell Python-miljö aktiverad för varje Python-version som du använder med Databricks Connect. Virtuella Python-miljöer hjälper dig att se till att du använder rätt versioner av Python och Databricks Connect tillsammans. Mer information om dessa verktyg och hur du aktiverar dem finns i venv eller poesi.
Installera Databricks Connect-klienten
I det här avsnittet beskrivs hur du installerar Databricks Connect-klienten med venv eller poesi.
Kommentar
Om du redan har Databricks-tillägget för Visual Studio Code installerat kan du installera Databricks Connect för Databricks Runtime 13.3 LTS och senare med hjälp av tillägget. Se Felsöka kod med Databricks Connect för Databricks-tillägget för Visual Studio Code.
Installera Databricks Connect-klienten med venv
När den virtuella miljön är aktiverad avinstallerar du PySpark, om den redan är installerad, genom att
uninstallköra kommandot . Detta krävs eftersom paketet står idatabricks-connectkonflikt med PySpark. Mer information finns i PySpark-installationer i konflikt. Kör kommandot för att kontrollera om PySpark redan är installeratshow.# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pysparkNär den virtuella miljön fortfarande är aktiverad installerar du Databricks Connect-klienten genom att
installköra kommandot . Använd alternativet--upgradeför att uppgradera en befintlig klientinstallation till den angivna versionen.pip3 install --upgrade "databricks-connect==16.4.*" # Or X.Y.* to match your cluster version.Kommentar
Databricks rekommenderar att du lägger till notationen "dot-asterisk" för att ange
databricks-connect==X.Y.*i stället fördatabricks-connect=X.Y, för att se till att det senaste paketet är installerat. Detta är inte ett krav, men det hjälper dig att se till att du kan använda de senaste funktionerna som stöds för klustret.
Installera Databricks Connect-klienten med Poetry
När den virtuella miljön är aktiverad avinstallerar du PySpark, om den redan är installerad, genom att
removeköra kommandot . Detta krävs eftersom paketet står idatabricks-connectkonflikt med PySpark. Mer information finns i PySpark-installationer i konflikt. Kör kommandot för att kontrollera om PySpark redan är installeratshow.# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pysparkNär den virtuella miljön fortfarande är aktiverad installerar du Databricks Connect-klienten genom att
addköra kommandot .poetry add databricks-connect@~16.4 # Or X.Y to match your cluster version.Kommentar
Databricks rekommenderar att du använder notationen "at-tilde" för att ange
databricks-connect@~16.4i stället fördatabricks-connect==16.4, för att se till att det senaste paketet är installerat. Detta är inte ett krav, men det hjälper dig att se till att du kan använda de senaste funktionerna som stöds för klustret.