Dela via


Använda ai.translate med PySpark

Funktionen ai.translate använder generativ AI för att översätta indatatext till ett nytt språk (valfritt) med en enda kodrad.

Anmärkning

Översikt

Funktionen ai.translate är tillgänglig för Spark DataFrames. Du måste ange ett befintligt kolumnnamn för indata som en parameter, tillsammans med ett målspråk.

Funktionen returnerar en ny DataFrame med översättningar för varje indatatextrad som lagras i en utdatakolumn.

Syntax

df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")

Parameterar

Namn Description
to_lang
Krävs
En sträng som representerar målspråket för textöversättningar.
input_col
Krävs
En sträng som innehåller namnet på en befintlig kolumn med indatatextvärden som ska översättas.
output_col
Valfritt
En sträng som innehåller namnet på en ny kolumn som lagrar översättningar för varje textrad. Om du inte anger den här parametern genereras ett standardnamn för utdatakolumnen.
error_col
Valfritt
En sträng som innehåller namnet på en ny kolumn som lagrar eventuella OpenAI-fel som uppstår när varje textrad bearbetas. Om du inte anger den här parametern genereras ett standardnamn för felkolumnen. Om en indatarad inte har några fel är värdet i den här kolumnen null.

Retur

Funktionen returnerar en Spark DataFrame som innehåller en ny kolumn som innehåller översättningar för texten i indatakolumnraden. Om indatatexten är nullblir resultatet null.

Example

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

Den här exempelkodcellen innehåller följande utdata:

Skärmbild av en dataram med kolumnerna