Dela via


Inaktivera åtkomst till Hive-metaarkivet som används av din Azure Databricks-arbetsyta

Note

Om du vill inaktivera åtkomst till Hive-metaarkivet på kontonivå för nya arbetsytor använder du kontoinställningen Inaktivera äldre funktioner .

Den här sidan beskriver hur du inaktiverar direkt åtkomst till det äldre Hive-metaarkivet som används av din Azure Databricks-arbetsyta, oavsett om det arbetsytelokala Hive-metaarkivet eller ett externt Hive-metaarkiv. När du har slutfört migreringen av Unity Catalog eller federerat ditt Hive-metaarkiv som en utländsk katalog som styrs av Unity Catalog kan du använda en enkel administratörsinställning för arbetsytor för att förhindra att användare kringgår Unity Catalog och kommer åt tabeller som är registrerade i Hive-metaarkivet.

Data i Hive-metaarkivet styrs inte av Unity Catalog. Att inaktivera direkt åtkomst till Hive-metaarkivet är ett viktigt steg i migreringen till Unity Catalog och se till att du utnyttjar datastyrningen i Unity Catalog fullt ut. Du kan inaktivera direktåtkomst och fortsätta köra frågor mot tabeller som hanteras av ditt Hive-metaarkiv genom att använda Hive-metaarkivfederationen. Du kan federera Hive-metaarkivtabeller före eller efter att du inaktiverar direkt åtkomst till hive-metaarkivet. Se Uppgradera en befintlig arbetsyta till Unity Catalog och Hive-metaarkivfederation: aktivera Unity Catalog för att styra tabeller som är registrerade i ett Hive-metaarkiv.

Databricks rekommenderar att du inaktiverar direkt åtkomst till Hive-metaarkivet för alla kluster och arbetsbelastningar samtidigt, men du kan också använda en Spark-konfiguration för att inaktivera åtkomsten kluster för kluster.

Innan du börjar: när ska du inaktivera det äldre metaarkivet?

Innan du inaktiverar det äldre Hive-metaarkivet bör du uppfylla följande kriterier:

  • Du har migrerat alla tabeller som är registrerade i det äldre metaarkivet till Unity Catalog, eller så har du alltid använt Unity Catalog och aldrig det äldre Hive-metaarkivet.
  • Du vill tvinga användarna att sluta använda tabeller som är registrerade i det äldre metaarkivet.
  • Du har uppgraderat alla jobb till Databricks Runtime 13.3 LTS eller senare.
  • En kontoadministratör har aktiverat Unity Catalog: Inaktivera äldre funktioner på sidan förhandsversioner av kontokonsolen.

Vad händer när du inaktiverar det äldre metaarkivet?

När du har inaktiverat det gamla metastore:

  • Jobb som körs mot tabeller som är registrerade i Hive-metaarkivet misslyckas.

  • Reservläge är inaktiverat.

  • Jobb som körs på Databricks Runtime-versioner under 13.3 misslyckas.

    Jobb som körs för närvarande fortsätter att fungera tills de avslutas, men omstarter på dessa kluster misslyckas.

  • Rubriken Legacy och hive_metastore katalogen försvinner från Katalogutforskarens webbläsarfönster.

  • SQL-kommandon som försöker visa innehållet i hive_metastore katalogen misslyckas.

Note

Att inaktivera äldre åtkomst hindrar inte användare från att använda autentiseringsuppgifter på klusternivå, till exempel tjänsthuvudnamn, som är tillgängliga i ett kluster. Databricks rekommenderar att du tar bort sådana autentiseringsuppgifter från dina kluster.

No Isolation shared kluster respekterar inte den äldre inställningen för avaktivering av Hive-metadatabutiken. Om du vill förhindra att användare skapar och använder sådana kluster aktiverar du inställningen Framtvinga användarisolering för arbetsytan. Se Framtvinga klustertyper för användarisolering på en arbetsyta.

Inaktivera all direkt åtkomst till Hive-metaarkivet

Inaktivera din arbetsytas äldre Hive-metaarkiv med hjälp av administratörsinställningen Inaktivera äldre åtkomst till arbetsytan:

  1. Som arbetsyteadministratör loggar du in på din Azure Databricks-arbetsyta.

  2. Klicka på användarprofilmenyn längst upp till höger och välj Inställningar på menyn.

  3. Gå till Arbetsytesadministratör> Säkerhet.

  4. Ange Inaktivera äldre åtkomst till Inaktiverad: äldre åtkomstfunktioner kan inte användas.

    Note

    Om den här inställningen saknas ber du kontoadministratören att aktivera inställningen Förhandsgranskningar > Unity Catalog: Inaktivera äldre funktioner i kontokonsolen.

  5. Vänta ungefär fem minuter för att säkerställa att den nya inställningen har börjat gälla.

  6. Starta om alla kluster som körs.

Inaktivera åtkomst för enskilda beräkningskluster

Du kan också inaktivera direkt åtkomst till Hive-metaarkivet gradvis, kluster för kluster. Den här metoden kan vara användbar under en migrering av Unity Catalog när du vill minska beroendet av Hive-metaarkiv stegvis tills du kan inaktivera det för hela arbetsytan.

Om du vill inaktivera direkt åtkomst anger du följande Spark-konfigurationer i klustret:

spark.databricks.unityCatalogOnlyMode True
spark.databricks.sql.initial.catalog.namespace <catalog-name>

Ersätt <catalog-name> med namnet på en Unity-katalogkatalog som finns i metaarkivet. När du aktiverar läget Endast Unity-katalog måste du också ange en första katalog eftersom klustret inte längre kan använda hive_metastore som standardkatalog.