Dela via


Installera Databricks Connect för Python

Kommentar

Den här artikeln beskriver Databricks Connect för Databricks Runtime 13.3 LTS och senare.

I den här artikeln beskrivs hur du installerar Databricks Connect för Python. Se Vad är Databricks Connect?.

Krav

Kontrollera att din arbetsyta och lokala miljö uppfyller kraven innan du installerar Databricks Connect. Se Användningskrav för Databricks Connect.

Aktivera en virtuell Python-miljö

Databricks rekommenderar starkt att du har en virtuell Python-miljö aktiverad för varje Python-version som du använder med Databricks Connect. Virtuella Python-miljöer hjälper dig att se till att du använder rätt versioner av Python och Databricks Connect tillsammans. Mer information om dessa verktyg och hur du aktiverar dem finns i venv eller poesi.

Installera Databricks Connect-klienten

I det här avsnittet beskrivs hur du installerar Databricks Connect-klienten med venv eller poesi.

Kommentar

Om du redan har Databricks-tillägget för Visual Studio Code installerat kan du installera Databricks Connect för Databricks Runtime 13.3 LTS och senare med hjälp av tillägget. Se Felsöka kod med Databricks Connect för Databricks-tillägget för Visual Studio Code.

Installera Databricks Connect-klienten med venv

  1. När den virtuella miljön är aktiverad avinstallerar du PySpark, om den redan är installerad, genom att uninstall köra kommandot . Detta krävs eftersom paketet står i databricks-connect konflikt med PySpark. Mer information finns i PySpark-installationer i konflikt. Kör kommandot för att kontrollera om PySpark redan är installerat show .

    # Is PySpark already installed?
    pip3 show pyspark
    
    # Uninstall PySpark
    pip3 uninstall pyspark
    
  2. När den virtuella miljön fortfarande är aktiverad installerar du Databricks Connect-klienten genom att install köra kommandot . Använd alternativet --upgrade för att uppgradera en befintlig klientinstallation till den angivna versionen.

    pip3 install --upgrade "databricks-connect==16.4.*"  # Or X.Y.* to match your cluster version.
    

    Kommentar

    Databricks rekommenderar att du lägger till notationen "dot-asterisk" för att ange databricks-connect==X.Y.* i stället för databricks-connect=X.Y, för att se till att det senaste paketet är installerat. Detta är inte ett krav, men det hjälper dig att se till att du kan använda de senaste funktionerna som stöds för klustret.

Installera Databricks Connect-klienten med Poetry

  1. När den virtuella miljön är aktiverad avinstallerar du PySpark, om den redan är installerad, genom att remove köra kommandot . Detta krävs eftersom paketet står i databricks-connect konflikt med PySpark. Mer information finns i PySpark-installationer i konflikt. Kör kommandot för att kontrollera om PySpark redan är installerat show .

    # Is PySpark already installed?
    poetry show pyspark
    
    # Uninstall PySpark
    poetry remove pyspark
    
  2. När den virtuella miljön fortfarande är aktiverad installerar du Databricks Connect-klienten genom att add köra kommandot .

    poetry add databricks-connect@~16.4  # Or X.Y to match your cluster version.
    

    Kommentar

    Databricks rekommenderar att du använder notationen "at-tilde" för att ange databricks-connect@~16.4 i stället för databricks-connect==16.4, för att se till att det senaste paketet är installerat. Detta är inte ett krav, men det hjälper dig att se till att du kan använda de senaste funktionerna som stöds för klustret.