Dataset Klass

Representerar en resurs för att utforska, transformera och hantera data i Azure Machine Learning.

En datauppsättning är en referens till data i en Datastore eller bakom offentliga webb-URL:er.

För metoder som är inaktuella i den här klassen kontrollerar AbstractDataset du klassen för de förbättrade API:erna.

Följande typer av datauppsättningar stöds:

TabularDataset representerar data i ett tabellformat som skapats genom att parsa den angivna filen eller listan med filer.
FileDataset refererar till en eller flera filer i datalager eller från offentliga URL:er.

Om du vill komma igång med datauppsättningar kan du läsa artikeln Lägg till och registrera datauppsättningar eller se notebook-filerna https://aka.ms/tabulardataset-samplenotebook och https://aka.ms/filedataset-samplenotebook.

Initiera datauppsättningsobjektet.

Om du vill hämta en datauppsättning som redan har registrerats med arbetsytan använder du metoden get.

Konstruktor

Dataset(definition, workspace=None, name=None, id=None)

Parametrar

Name	Description
definition Obligatorisk	<xref:azureml.data.DatasetDefinition> Datamängdsdefinitionen.
workspace Obligatorisk	Workspace Arbetsytan där datauppsättningen finns.
name Obligatorisk	str Namnet på datauppsättningen.
id Obligatorisk	str Den unika identifieraren för datauppsättningen.

Kommentarer

Klassen Dataset exponerar två bekvämlighetsklassattribut (File och Tabular) som du kan använda för att skapa en datauppsättning utan att arbeta med motsvarande fabriksmetoder. Om du till exempel vill skapa en datauppsättning med hjälp av följande attribut:

Dataset.Tabular.from_delimited_files()
Dataset.File.from_files()

Du kan också skapa en ny TabularDataset eller FileDataset genom att direkt anropa motsvarande fabriksmetoder för klassen som definieras i TabularDatasetFactory och FileDatasetFactory.

I följande exempel visas hur du skapar en TabularDataset som pekar på en enda sökväg i ett datalager.


   from azureml.core import Dataset
   dataset = Dataset.Tabular.from_delimited_files(path = [(datastore, 'train-dataset/tabular/iris.csv')])

   # preview the first 3 rows of the dataset
   dataset.take(3).to_pandas_dataframe()

Fullständigt exempel är tillgängligt från https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/work-with-data/datasets-tutorial/train-with-datasets/train-with-datasets.ipynb

Variabler

Name	Description
azureml.core.Dataset.File	Ett klassattribut som ger åtkomst till FileDatasetFactory-metoderna för att skapa nya FileDataset-objekt. Användning: Dataset.File.from_files().
azureml.core.Dataset.Tabular	Ett klassattribut som ger åtkomst till TabularDatasetFactory-metoderna för att skapa nya TabularDataset-objekt. Användning: Dataset.Tabular.from_delimited_files().

Metoder

archive	Arkivera en aktiv eller inaktuell datauppsättning. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
auto_read_files	Analyserar filerna på den angivna sökvägen och returnerar en ny datauppsättning. Anmärkning Den här metoden är inaktuell och stöds inte längre. Vi rekommenderar att du använder metoderna Dataset.Tabular.from_* för att läsa filer. Mer information finns i https://aka.ms/dataset-deprecation.
compare_profiles	Jämför den aktuella datauppsättningens profil med en annan datamängdsprofil. Detta visar skillnaderna i sammanfattningsstatistik mellan två datauppsättningar. Parametern "rhs_dataset" står för "höger sida" och är helt enkelt den andra datauppsättningen. Den första datamängden (det aktuella datamängdsobjektet) anses vara "vänster sida". Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
create_snapshot	Skapa en ögonblicksbild av den registrerade datauppsättningen. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
delete_snapshot	Ta bort en ögonblicksbild av datauppsättningen efter namn. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
deprecate	Inaktuella en aktiv datauppsättning på en arbetsyta av en annan datauppsättning. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
diff	Diff den aktuella datauppsättningen med rhs_dataset. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
from_binary_files	Skapa en oregistrerad, minnesintern datauppsättning från binära filer. Anmärkning Den här metoden är inaktuell och stöds inte längre. Vi rekommenderar att du använder Dataset.File.from_files i stället. Mer information finns i https://aka.ms/dataset-deprecation.
from_delimited_files	Skapa en oregistrerad, minnesintern datauppsättning från avgränsade filer. Anmärkning Den här metoden är inaktuell och stöds inte längre. Vi rekommenderar att du använder Dataset.Tabular.from_delimited_files i stället. Mer information finns i https://aka.ms/dataset-deprecation. `# Create a dataset from delimited files with header option as ALL_FILES_HAVE_SAME_HEADERS dataset = Dataset.Tabular.from_delimited_files(path=(datastore, 'data/crime-spring.csv'), header='ALL_FILES_HAVE_SAME_HEADERS') df = dataset.to_pandas_dataframe()`
from_excel_files	Skapa en oregistrerad, minnesintern datauppsättning från Excel-filer. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
from_json_files	Skapa en oregistrerad, minnesintern datauppsättning från JSON-filer. Anmärkning Den här metoden är inaktuell och stöds inte längre. Vi rekommenderar att du använder Dataset.Tabular.from_json_lines_files i stället för att läsa från JSON-radfilen. Mer information finns i https://aka.ms/dataset-deprecation.
from_pandas_dataframe	Skapa en oregistrerad minnesintern datauppsättning från en Pandas-dataram. Anmärkning Den här metoden är inaktuell och stöds inte längre. Vi rekommenderar att du använder Dataset.Tabular.register_pandas_dataframe i stället. Mer information finns i https://aka.ms/dataset-deprecation.
from_parquet_files	Skapa en oregistrerad, minnesintern datauppsättning från parquet-filer. Anmärkning Den här metoden är inaktuell och stöds inte längre. Vi rekommenderar att du använder Dataset.Tabular.from_parquet_files i stället. Mer information finns i https://aka.ms/dataset-deprecation.
from_sql_query	Skapa en oregistrerad minnesintern datauppsättning från en SQL-fråga. Anmärkning Den här metoden är inaktuell och stöds inte längre. Vi rekommenderar att du använder Dataset.Tabular.from_sql_query i stället. Mer information finns i https://aka.ms/dataset-deprecation.
generate_profile	Generera en ny profil för datauppsättningen. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
get	Hämta en datauppsättning som redan finns på arbetsytan genom att ange antingen dess namn eller ID. Anmärkning Den här metoden är inaktuell och stöds inte längre. Rekommenderar att du använder get_by_name och get_by_id i stället. Mer information finns i https://aka.ms/dataset-deprecation.
get_all	Hämta alla registrerade datamängder på arbetsytan.
get_all_snapshots	Hämta alla ögonblicksbilder av datauppsättningen. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
get_by_id	Hämta en datauppsättning som sparas på arbetsytan.
get_by_name	Hämta en registrerad datauppsättning från arbetsytan med dess registreringsnamn.
get_definition	Hämta en specifik definition av datauppsättningen. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
get_definitions	Hämta alla definitioner av datauppsättningen. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
get_profile	Hämta sammanfattningsstatistik för datauppsättningen som beräknades tidigare. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
get_snapshot	Hämta en ögonblicksbild av datauppsättningen efter namn. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
head	Hämta det angivna antalet poster som angetts från den här datauppsättningen och returnera dem som en DataFrame. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
list	Visa en lista över alla datauppsättningar på arbetsytan, inklusive de med `is_visible` egenskapen false. Anmärkning Den här metoden är inaktuell och stöds inte längre. Rekommenderar att du använder get_all i stället. Mer information finns i https://aka.ms/dataset-deprecation.
reactivate	Återaktivera en arkiverad eller inaktuell datauppsättning. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
register	Registrera datauppsättningen på arbetsytan, vilket gör den tillgänglig för andra användare av arbetsytan. Anmärkning Den här metoden är inaktuell och stöds inte längre. Rekommenderar att du använder register i stället. Mer information finns i https://aka.ms/dataset-deprecation.
sample	Generera ett nytt exempel från källdatauppsättningen med hjälp av den samplingsstrategi och de parametrar som tillhandahålls. Anmärkning Den här metoden är inaktuell och stöds inte längre. Skapa en TabularDataset genom att anropa de statiska metoderna på Dataset.Tabular och använda take_sample metoden där. Mer information finns i https://aka.ms/dataset-deprecation.
to_pandas_dataframe	Skapa en Pandas-dataram genom att köra transformeringspipelinen som definieras av den här datauppsättningsdefinitionen. Anmärkning Den här metoden är inaktuell och stöds inte längre. Skapa en TabularDataset genom att anropa de statiska metoderna på Dataset.Tabular och använda to_pandas_dataframe metoden där. Mer information finns i https://aka.ms/dataset-deprecation.
to_spark_dataframe	Skapa en Spark DataFrame som kan köra transformeringspipelinen som definieras av den här datauppsättningsdefinitionen. Anmärkning Den här metoden är inaktuell och stöds inte längre. Skapa en TabularDataset genom att anropa de statiska metoderna på Dataset.Tabular och använda to_spark_dataframe metoden där. Mer information finns i https://aka.ms/dataset-deprecation.
update	Uppdatera attributen för datauppsättningen som kan ändras på arbetsytan och returnera den uppdaterade datauppsättningen från arbetsytan. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.
update_definition	Uppdatera datauppsättningsdefinitionen. Anmärkning Den här metoden är inaktuell och stöds inte längre. Mer information finns i https://aka.ms/dataset-deprecation.

auto_read_files

Analyserar filerna på den angivna sökvägen och returnerar en ny datauppsättning.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Vi rekommenderar att du använder metoderna Dataset.Tabular.from_* för att läsa filer. Mer information finns i https://aka.ms/dataset-deprecation.

static auto_read_files(path, include_path=False, partition_format=None)

Parametrar

Name	Description
path Obligatorisk	DataReference eller str En datasökväg i ett registrerat datalager, en lokal sökväg eller en HTTP-URL (CSV/TSV).
include_path Obligatorisk	bool Om du vill inkludera en kolumn som innehåller sökvägen till filen som data lästes från. Användbart när du läser flera filer och vill veta vilken fil en viss post kommer från. Också användbart om det finns information i filsökvägen eller namnet som du vill använda i en kolumn.
partition_format Obligatorisk	str Ange partitionsformatet i sökvägen och skapa strängkolumner från formatet {x} och datetime-kolumnen från formatet {x:åååå/MM/dd/HH/mm/ss}, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för extra år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med en filsökväg .. /Accounts/2019/01/01/data.csv" där data partitioneras efter avdelningsnamn och tid, kan vi definiera '/{Department}/{PartitionDate:yyyy/MM/dd}/data.csv' för att skapa kolumnerna "Avdelning" av strängtyp och "PartitionDate" av datetime-typ.

Returer

Typ	Description
Dataset	Datamängdsobjekt.

Kommentarer

Använd den här metoden när filformat och avgränsare ska identifieras automatiskt.

När du har skapat en datauppsättning bör du använda get_profile för att lista identifierade kolumntyper och sammanfattningsstatistik för varje kolumn.

Den returnerade datauppsättningen är inte registrerad på arbetsytan.

compare_profiles

Jämför den aktuella datauppsättningens profil med en annan datamängdsprofil.

Detta visar skillnaderna i sammanfattningsstatistik mellan två datauppsättningar. Parametern "rhs_dataset" står för "höger sida" och är helt enkelt den andra datauppsättningen. Den första datamängden (det aktuella datamängdsobjektet) anses vara "vänster sida".

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

compare_profiles(rhs_dataset, profile_arguments={}, include_columns=None, exclude_columns=None, histogram_compare_method=HistogramCompareMethod.WASSERSTEIN)

Parametrar

Name	Description
rhs_dataset Obligatorisk	Dataset En andra datauppsättning, även kallad en "höger sida" datauppsättning för jämförelse.
profile_arguments Obligatorisk	dict Argument för att försöka skapa en specifik profil igen.
include_columns Obligatorisk	list[str] Lista över kolumnnamn som ska ingå i jämförelsen.
exclude_columns Obligatorisk	list[str] Lista över kolumnnamn som ska undantas i jämförelse.
histogram_compare_method Obligatorisk	HistogramCompareMethod Uppräkning som beskriver jämförelsemetoden, t.ex. Wasserstein eller Energy

Returer

Typ	Description
<xref:azureml.dataprep.api.engineapi.typedefinitions.DataProfileDifference>	Skillnad mellan de två datauppsättningsprofilerna.

Kommentarer

Detta gäller endast för registrerade datauppsättningar. Genererar ett undantag om den aktuella datauppsättningens profil inte finns. För oregistrerade datauppsättningar använder du metoden profile.compare.

create_snapshot

Skapa en ögonblicksbild av den registrerade datauppsättningen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

create_snapshot(snapshot_name, compute_target=None, create_data_snapshot=False, target_datastore=None)

Parametrar

Name	Description
snapshot_name Obligatorisk	str Namnet på ögonblicksbilden. Namn på ögonblicksbilder bör vara unika i en datauppsättning.
compute_target Obligatorisk	Union[ComputeTarget, str] Valfritt beräkningsmål för att skapa ögonblicksbildprofilen. Om den utelämnas används den lokala beräkningen.
create_data_snapshot Obligatorisk	bool Om sant skapas en materialiserad kopia av data.
target_datastore Obligatorisk	Union[AbstractAzureStorageDatastore, str] Måldatalager för att spara ögonblicksbilder. Om den utelämnas skapas ögonblicksbilden i standardlagringen för arbetsytan.

Returer

Typ	Description
DatasetSnapshot	Objekt för ögonblicksbild av datauppsättning.

Kommentarer

Ögonblicksbilder samlar in sammanfattningsstatistik för tidpunkten för underliggande data och en valfri kopia av själva data. Mer information om hur du skapar ögonblicksbilder finns i https://aka.ms/azureml/howto/createsnapshots.

delete_snapshot

Ta bort en ögonblicksbild av datauppsättningen efter namn.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

delete_snapshot(snapshot_name)

Parametrar

Name	Description
snapshot_name Obligatorisk	str Namnet på ögonblicksbilden.

Returer

Typ	Description
None	Ingen.

Kommentarer

Använd det här alternativet om du vill frigöra lagringsutrymme som förbrukas av data som sparats i ögonblicksbilder som du inte längre behöver.

deprecate

Inaktuella en aktiv datauppsättning på en arbetsyta av en annan datauppsättning.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

deprecate(deprecate_by_dataset_id)

Parametrar

Name	Description
deprecate_by_dataset_id Obligatorisk	str Datamängds-ID:t som är den avsedda ersättningen för den här datauppsättningen.

Returer

Typ	Description
None	Ingen.

Kommentarer

Inaktuella datauppsättningar loggar varningar när de används. Om du inaktuella en datauppsättning blir alla dess definitioner inaktuella.

Inaktuella datauppsättningar kan fortfarande användas. Om du vill blockera en datauppsättning helt från att förbrukas arkiverar du den.

Om den är inaktuell av misstag aktiverar återaktiveringen den.

diff

Diff den aktuella datauppsättningen med rhs_dataset.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

diff(rhs_dataset, compute_target=None, columns=None)

Parametrar

Name	Description
rhs_dataset Obligatorisk	Dataset En annan datauppsättning kallas även datauppsättning på höger sida för jämförelse
compute_target Obligatorisk	Union[ComputeTarget, str] beräkningsmål för att utföra diffet. Om den utelämnas används den lokala beräkningen.
columns Obligatorisk	list[str] Lista över kolumnnamn som ska ingå i diff.

Returer

Typ	Description
DatasetActionRun	Körningsobjekt för datauppsättningsåtgärd.

from_binary_files

Skapa en oregistrerad, minnesintern datauppsättning från binära filer.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Vi rekommenderar att du använder Dataset.File.from_files i stället. Mer information finns i https://aka.ms/dataset-deprecation.

static from_binary_files(path)

Parametrar

Name	Description
path Obligatorisk	DataReference eller str En datasökväg i ett registrerat datalager eller en lokal sökväg.

Returer

Typ	Description
Dataset	Datamängdsobjektet.

Kommentarer

Använd den här metoden för att läsa filer som strömmar av binära data. Returnerar ett filströmsobjekt per filläsning. Använd den här metoden när du läser bilder, videor, ljud eller andra binära data.

get_profile och create_snapshot fungerar inte som förväntat för en datauppsättning som skapats med den här metoden.

Den returnerade datauppsättningen är inte registrerad på arbetsytan.

from_delimited_files

Skapa en oregistrerad, minnesintern datauppsättning från avgränsade filer.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Vi rekommenderar att du använder Dataset.Tabular.from_delimited_files i stället. Mer information finns i https://aka.ms/dataset-deprecation.


   # Create a dataset from delimited files with header option as ALL_FILES_HAVE_SAME_HEADERS
   dataset = Dataset.Tabular.from_delimited_files(path=(datastore, 'data/crime-spring.csv'),
       header='ALL_FILES_HAVE_SAME_HEADERS')

   df = dataset.to_pandas_dataframe()

static from_delimited_files(path, separator=',', header=PromoteHeadersBehavior.ALL_FILES_HAVE_SAME_HEADERS, encoding=FileEncoding.UTF8, quoting=False, infer_column_types=True, skip_rows=0, skip_mode=SkipLinesBehavior.NO_ROWS, comment=None, include_path=False, archive_options=None, partition_format=None)

Parametrar

Name	Description
path Obligatorisk	DataReference eller str En datasökväg i ett registrerat datalager, en lokal sökväg eller en HTTP-URL.
separator Obligatorisk	str Avgränsaren som används för att dela kolumner.
header Obligatorisk	PromoteHeadersBehavior Styr hur kolumnrubriker höjs upp när du läser från filer.
encoding Obligatorisk	FileEncoding Kodningen av de filer som läss.
quoting Obligatorisk	bool Ange hur nya radtecken ska hanteras inom citattecken. Standardvärdet (Falskt) är att tolka nya radtecken som att starta nya rader, oavsett om de nya radteckenen ligger inom citattecken eller inte. Om värdet är True resulterar inte nya radtecken inom citattecken i nya rader och filläsningshastigheten blir långsammare.
infer_column_types Obligatorisk	bool Anger om kolumndatatyper härleds.
skip_rows Obligatorisk	int Hur många rader du vill hoppa över i de filer som läss.
skip_mode Obligatorisk	SkipLinesBehavior Styr hur rader hoppas över när du läser från filer.
comment Obligatorisk	str Tecken som används för att ange kommentarsrader i de filer som läss. Rader som börjar med den här strängen hoppas över.
include_path Obligatorisk	bool Om du vill inkludera en kolumn som innehåller sökvägen till filen som data lästes från. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från eller för att behålla användbar information i filsökvägen.
archive_options Obligatorisk	<xref:azureml.dataprep.ArchiveOptions> Alternativ för arkivfil, inklusive arkivtyp och postglobmönster. Vi stöder endast ZIP som arkivtyp för tillfället. Du kan till exempel ange `archive_options = ArchiveOptions(archive_type = ArchiveType.ZIP, entry_glob = '*10-20.csv')` läser alla filer med namnet slutar med "10-20.csv" i ZIP.
partition_format Obligatorisk	str Ange partitionsformatet i sökvägen och skapa strängkolumner från formatet {x} och datetime-kolumnen från formatet {x:åååå/MM/dd/HH/mm/ss}, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för extra år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med en filsökväg .. /Accounts/2019/01/01/data.csv" där data partitioneras efter avdelningsnamn och tid, kan vi definiera '/{Department}/{PartitionDate:yyyy/MM/dd}/data.csv' för att skapa kolumnerna "Avdelning" av strängtyp och "PartitionDate" av datetime-typ.

Returer

Typ	Description
Dataset	Datamängdsobjekt.

Kommentarer

Använd den här metoden för att läsa avgränsade textfiler när du vill styra de alternativ som används.

När du har skapat en datauppsättning bör du använda get_profile för att lista identifierade kolumntyper och sammanfattningsstatistik för varje kolumn.

Den returnerade datauppsättningen är inte registrerad på arbetsytan.

from_excel_files

Skapa en oregistrerad, minnesintern datauppsättning från Excel-filer.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

static from_excel_files(path, sheet_name=None, use_column_headers=False, skip_rows=0, include_path=False, infer_column_types=True, partition_format=None)

Parametrar

Name	Description
path Obligatorisk	DataReference eller str En datasökväg i ett registrerat datalager eller en lokal sökväg.
sheet_name Obligatorisk	str Namnet på Excel-bladet som ska läsas in. Som standard läser vi det första bladet från varje Excel-fil.
use_column_headers Obligatorisk	bool Styr om den första raden ska användas som kolumnrubriker.
skip_rows Obligatorisk	int Hur många rader du vill hoppa över i de filer som läss.
include_path Obligatorisk	bool Om du vill inkludera en kolumn som innehåller sökvägen till filen som data lästes från. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från eller för att behålla användbar information i filsökvägen.
infer_column_types Obligatorisk	bool Om sant kommer kolumndatatyper att härledas.
partition_format Obligatorisk	str Ange partitionsformatet i sökvägen och skapa strängkolumner från formatet {x} och datetime-kolumnen från formatet {x:åååå/MM/dd/HH/mm/ss}, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för extra år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med en filsökväg .. /Accounts/2019/01/01/data.xlsx" där data partitioneras efter avdelningsnamn och tid, kan vi definiera '/{Department}/{PartitionDate:yyyy/MM/dd}/data.xlsx' för att skapa kolumnerna "Avdelning" av strängtyp och "PartitionDate" av datetime-typ.

Returer

Typ	Description
Dataset	Datamängdsobjekt.

Kommentarer

Använd den här metoden för att läsa Excel-filer i .xlsx format. Data kan läsas från ett blad i varje Excel-fil. När du har skapat en datauppsättning bör du använda get_profile för att lista identifierade kolumntyper och sammanfattningsstatistik för varje kolumn. Den returnerade datauppsättningen är inte registrerad på arbetsytan.

from_json_files

Skapa en oregistrerad, minnesintern datauppsättning från JSON-filer.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Vi rekommenderar att du använder Dataset.Tabular.from_json_lines_files i stället för att läsa från JSON-radfilen. Mer information finns i https://aka.ms/dataset-deprecation.

static from_json_files(path, encoding=FileEncoding.UTF8, flatten_nested_arrays=False, include_path=False, partition_format=None)

Parametrar

Name	Description
path Obligatorisk	DataReference eller str Sökvägen till de filer eller mappar som du vill läsa in och parsa. Det kan antingen vara en lokal sökväg eller en Azure Blob-URL. Globbning stöds. Du kan till exempel använda sökvägen = "./data*" för att läsa alla filer med namn som börjar med "data".
encoding Obligatorisk	FileEncoding Kodningen av de filer som läss.
flatten_nested_arrays Obligatorisk	bool Egenskap som styr programmets hantering av kapslade matriser. Om du väljer att platta ut kapslade JSON-matriser kan det resultera i ett mycket större antal rader.
include_path Obligatorisk	bool Om du vill inkludera en kolumn som innehåller sökvägen som data lästes från. Detta är användbart när du läser flera filer och kanske vill veta vilken fil en viss post kommer från eller för att behålla användbar information i filsökvägen.
partition_format Obligatorisk	str Ange partitionsformatet i sökvägen och skapa strängkolumner från formatet {x} och datetime-kolumnen från formatet {x:åååå/MM/dd/HH/mm/ss}, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för extra år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med en filsökväg .. /Accounts/2019/01/01/data.jsonoch data partitioneras efter avdelningsnamn och tid. Vi kan definiera '/{Department}/{PartitionDate:yyyy/MM/dd}/data.json' för att skapa kolumnerna Avdelning av strängtyp och PartitionDate av datetime-typ.

Returer

Typ	Description
Dataset	Det lokala datamängdsobjektet.

from_pandas_dataframe

Skapa en oregistrerad minnesintern datauppsättning från en Pandas-dataram.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Vi rekommenderar att du använder Dataset.Tabular.register_pandas_dataframe i stället. Mer information finns i https://aka.ms/dataset-deprecation.

static from_pandas_dataframe(dataframe, path=None, in_memory=False)

Parametrar

Name	Description
dataframe Obligatorisk	DataFrame The Pandas DataFrame.
path Obligatorisk	Union[DataReference, str] En datasökväg i ett registrerat datalager eller en lokal mappsökväg.
in_memory Obligatorisk	bool Om dataramen ska läsas från minnet i stället för att sparas på disken.

Returer

Typ	Description
Dataset	Ett datauppsättningsobjekt.

Kommentarer

Använd den här metoden för att konvertera en Pandas-dataram till ett Dataset-objekt. Det går inte att registrera en datauppsättning som skapats med den här metoden eftersom data kommer från minnet.

Om in_memory är False konverteras Pandas DataFrame till en CSV-fil lokalt. Om pat är av typen DataReference laddas Pandas-ramen upp till datalagret och datauppsättningen baseras på DataReference. Om sökvägen är en lokal mapp skapas datauppsättningen från den lokala filen som inte kan tas bort.

Genererar ett undantag om den aktuella DataReference inte är en mappsökväg.

from_parquet_files

Skapa en oregistrerad, minnesintern datauppsättning från parquet-filer.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Vi rekommenderar att du använder Dataset.Tabular.from_parquet_files i stället. Mer information finns i https://aka.ms/dataset-deprecation.

static from_parquet_files(path, include_path=False, partition_format=None)

Parametrar

Name	Description
path Obligatorisk	DataReference eller str En datasökväg i ett registrerat datalager eller en lokal sökväg.
include_path Obligatorisk	bool Om du vill inkludera en kolumn som innehåller sökvägen till filen som data lästes från. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från eller för att behålla användbar information i filsökvägen.
partition_format Obligatorisk	str Ange partitionsformatet i sökvägen och skapa strängkolumner från formatet {x} och datetime-kolumnen från formatet {x:åååå/MM/dd/HH/mm/ss}, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för extra år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med en filsökväg .. /Accounts/2019/01/01/data.parquet' där data partitioneras efter avdelningsnamn och tid, kan vi definiera '/{Department}/{PartitionDate:yyyy/MM/dd}/data.parquet' för att skapa kolumnerna "Department" av strängtyp och "PartitionDate" av datetime-typ.

Returer

Typ	Description
Dataset	Datamängdsobjekt.

Kommentarer

Använd den här metoden för att läsa Parquet-filer.

När du har skapat en datauppsättning bör du använda get_profile för att lista identifierade kolumntyper och sammanfattningsstatistik för varje kolumn.

Den returnerade datauppsättningen är inte registrerad på arbetsytan.

from_sql_query

Skapa en oregistrerad minnesintern datauppsättning från en SQL-fråga.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Vi rekommenderar att du använder Dataset.Tabular.from_sql_query i stället. Mer information finns i https://aka.ms/dataset-deprecation.

static from_sql_query(data_source, query)

Parametrar

Name	Description
data_source Obligatorisk	AzureSqlDatabaseDatastore Information om Azure SQL-datalagringen.
query Obligatorisk	str Frågan som ska köras för att läsa data.

Returer

Typ	Description
Dataset	Det lokala datamängdsobjektet.

generate_profile

Generera en ny profil för datauppsättningen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

generate_profile(compute_target=None, workspace=None, arguments=None)

Parametrar

Name	Description
compute_target Obligatorisk	Union[ComputeTarget, str] Ett valfritt beräkningsmål för att skapa ögonblicksbildprofilen. Om den utelämnas används den lokala beräkningen.
workspace Obligatorisk	Workspace Arbetsyta som krävs för tillfälliga(oregistrerade) datauppsättningar.
arguments Obligatorisk	dict[str, object] Profilargument. Giltiga argument är: "include_stype_counts" av typen bool. Kontrollera om värden ser ut som några välkända semantiska typer, till exempel e-postadress, IP-adress (V4/V6), amerikanskt telefonnummer, amerikanskt postnummer, Latitud/longitud. Aktivering av detta påverkar prestanda. "number_of_histogram_bins" av typen int. Representerar antalet histogram som ska användas för numeriska data. Standardvärdet är 10.

Returer

Typ	Description
DatasetActionRun	Körningsobjekt för datauppsättningsåtgärd.

Kommentarer

Synkront anrop blockeras tills det har slutförts. Anropa get_result för att hämta resultatet av åtgärden.

get

Hämta en datauppsättning som redan finns på arbetsytan genom att ange antingen dess namn eller ID.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Rekommenderar att du använder get_by_name och get_by_id i stället. Mer information finns i https://aka.ms/dataset-deprecation.

static get(workspace, name=None, id=None)

Parametrar

Name	Description
workspace Obligatorisk	Workspace Den befintliga AzureML-arbetsytan där datauppsättningen skapades.
name Obligatorisk	str Namnet på datauppsättningen som ska hämtas.
id Obligatorisk	str En unik identifierare för datauppsättningen på arbetsytan.

Returer

Typ	Description
Dataset	Datauppsättningen med det angivna namnet eller ID:t.

Kommentarer

Du kan ange antingen name eller id. Ett undantag utlöses om:

både name och id anges men matchar inte.
Datauppsättningen med angiven name eller id kan inte hittas på arbetsytan.

get_all

Hämta alla registrerade datamängder på arbetsytan.

get_all()

Parametrar

Name	Description
workspace Obligatorisk	Workspace Den befintliga AzureML-arbetsytan där datauppsättningarna registrerades.

Returer

Typ	Description
dict[str, Union[TabularDataset, FileDataset]]	En ordlista med TabularDataset- och FileDataset-objekt som är nyckelade efter deras registreringsnamn.

get_all_snapshots

Hämta alla ögonblicksbilder av datauppsättningen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

get_all_snapshots()

Returer

Typ	Description
list[DatasetSnapshot]	Lista över ögonblicksbilder av datauppsättningar.

get_by_id

Hämta en datauppsättning som sparas på arbetsytan.

get_by_id(id, **kwargs)

Parametrar

Name	Description
workspace Obligatorisk	Workspace Den befintliga AzureML-arbetsytan där datauppsättningen sparas.
id Obligatorisk	str ID:t för datamängden.

Returer

Typ	Description
Union[TabularDataset, FileDataset]	Datamängdsobjektet. Om datauppsättningen registreras returneras även dess registreringsnamn och version.

get_by_name

Hämta en registrerad datauppsättning från arbetsytan med dess registreringsnamn.

get_by_name(name, version='latest', **kwargs)

Parametrar

Name	Description
workspace Obligatorisk	Workspace Den befintliga AzureML-arbetsytan där datauppsättningen registrerades.
name Obligatorisk	str Registreringsnamnet.
version Obligatorisk	int Registreringsversionen. Standardvärdet är "senaste".

Returer

Typ	Description
Union[TabularDataset, FileDataset]	Det registrerade datamängdsobjektet.

get_definition

Hämta en specifik definition av datauppsättningen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

get_definition(version_id=None)

Parametrar

Name	Description
version_id Obligatorisk	str Versions-ID för datauppsättningsdefinitionen

Returer

Typ	Description
DatasetDefinition	Datamängdsdefinitionen.

Kommentarer

Om version_id anges försöker Azure Machine Learning hämta definitionen som motsvarar den versionen. Om den versionen inte finns genereras ett undantag. Om version_id utelämnas hämtas den senaste versionen.

get_definitions

Hämta alla definitioner av datauppsättningen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

get_definitions()

Returer

Typ	Description
dict[str, DatasetDefinition]	En ordlista med datauppsättningsdefinitioner.

Kommentarer

För oregistrerade datauppsättningar finns det bara en definition.

get_profile

Hämta sammanfattningsstatistik för datauppsättningen som beräknades tidigare.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

get_profile(arguments=None, generate_if_not_exist=True, workspace=None, compute_target=None)

Parametrar

Name	Description
arguments Obligatorisk	dict[str, object] Profilargument.
generate_if_not_exist Obligatorisk	bool Anger om en profil ska genereras om den inte finns.
workspace Obligatorisk	Workspace Arbetsyta som krävs för tillfälliga(oregistrerade) datauppsättningar.
compute_target Obligatorisk	Union[ComputeTarget, str] Ett beräkningsmål för att köra profilåtgärden.

Returer

Typ	Description
<xref:azureml.dataprep.DataProfile>	DataProfile för datauppsättningen.

Kommentarer

För en datauppsättning som registrerats med en Azure Machine Learning-arbetsyta hämtar den här metoden en befintlig profil som skapades tidigare genom att anropa get_profile om den fortfarande är giltig. Profiler ogiltigförklaras när ändrade data identifieras i datauppsättningen eller argumenten till get_profile skiljer sig från de som användes när profilen genererades. Om profilen inte finns eller ogiltigförklaras avgör generate_if_not_exist du om en ny profil genereras.

För en datauppsättning som inte är registrerad med en Azure Machine Learning-arbetsyta körs generate_profile och returnerar den här metoden alltid resultatet.

get_snapshot

Hämta en ögonblicksbild av datauppsättningen efter namn.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

get_snapshot(snapshot_name)

Parametrar

Name	Description
snapshot_name Obligatorisk	str Namnet på ögonblicksbilden.

Returer

Typ	Description
DatasetSnapshot	Objekt för ögonblicksbild av datauppsättning.

head

Hämta det angivna antalet poster som angetts från den här datauppsättningen och returnera dem som en DataFrame.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

head(count)

Parametrar

Name	Description
count Obligatorisk	int Antalet poster som ska hämtas.

Returer

Typ	Description
DataFrame	En Pandas DataFrame.

list

Visa en lista över alla datauppsättningar på arbetsytan, inklusive de med is_visible egenskapen false.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Rekommenderar att du använder get_all i stället. Mer information finns i https://aka.ms/dataset-deprecation.

static list(workspace)

Parametrar

Name	Description
workspace Obligatorisk	Workspace Den arbetsyta som du vill hämta listan över datauppsättningar för.

Returer

Typ	Description
list[Dataset]	En lista över datauppsättningsobjekt.

reactivate

Återaktivera en arkiverad eller inaktuell datauppsättning.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

reactivate()

Returer

Typ	Description
None	Ingen.

register

Registrera datauppsättningen på arbetsytan, vilket gör den tillgänglig för andra användare av arbetsytan.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Rekommenderar att du använder register i stället. Mer information finns i https://aka.ms/dataset-deprecation.

register(workspace, name, description=None, tags=None, visible=True, exist_ok=False, update_if_exist=False)

Parametrar

Name	Description
workspace Obligatorisk	Workspace Den AzureML-arbetsyta där datauppsättningen ska registreras.
name Obligatorisk	str Namnet på datauppsättningen på arbetsytan.
description Obligatorisk	str En beskrivning av datauppsättningen.
tags Obligatorisk	dict[str, str] Taggar som ska associeras med datauppsättningen.
visible Obligatorisk	bool Anger om datauppsättningen visas i användargränssnittet. Om det är falskt döljs datauppsättningen i användargränssnittet och är tillgänglig via SDK.
exist_ok Obligatorisk	bool Om sant returnerar metoden datauppsättningen om den redan finns på den angivna arbetsytan, annars fel.
update_if_exist Obligatorisk	bool Om `exist_ok` är Sant och `update_if_exist` är Sant uppdaterar den här metoden definitionen och returnerar den uppdaterade datauppsättningen.

Returer

Typ	Description
Dataset	Ett registrerat datauppsättningsobjekt på arbetsytan.

sample

Generera ett nytt exempel från källdatauppsättningen med hjälp av den samplingsstrategi och de parametrar som tillhandahålls.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Skapa en TabularDataset genom att anropa de statiska metoderna på Dataset.Tabular och använda take_sample metoden där. Mer information finns i https://aka.ms/dataset-deprecation.

sample(sample_strategy, arguments)

Parametrar

Name	Description
sample_strategy Obligatorisk	str Exempelstrategi som ska användas. Godkända värden är "top_n", "simple_random" eller "stratifierade".
arguments Obligatorisk	dict[str, object] En ordlista med nycklar från "Valfritt argument" i listan ovan och värden från kolumnen tye "Type". Endast argument från motsvarande samplingsmetod kan användas. För exempeltypen "simple_random" kan du till exempel bara ange en ordlista med nycklarna "sannolikhet" och "seed".

Returer

Typ	Description
Dataset	Datamängdsobjekt som ett exempel på den ursprungliga datauppsättningen.

Kommentarer

Exempel genereras genom att köra transformeringspipelinen som definieras av den här datamängden och sedan tillämpa samplingsstrategin och parametrarna på utdata. Varje samplingsmetod stöder följande valfria argument:

top_n
- Valfria argument
  - n, skriv heltal. Välj de översta N raderna som exempel.
simple_random
- Valfria argument
  - sannolikhet skriver du float. Enkel slumpmässig sampling där varje rad har samma sannolikhet att väljas. Sannolikheten bör vara ett tal mellan 0 och 1.
  - frö, typ float. Används av slumptalsgeneratorn. Används för repeterbarhet.
Skiktat
- Valfria argument
  - kolumner skriver du list[str]. Lista över strata-kolumner i data.
  - frö, typ float. Används av slumptalsgeneratorn. Används för repeterbarhet.
  - bråk, typ dikta[tuppeln, flyttal]. Tuppel: kolumnvärden som definierar ett stratum måste vara i samma ordning som kolumnnamn. Float: vikt fäst vid ett stratum under provtagningen.

Följande kodfragment är exempel på designmönster för olika exempelmetoder.


   # sample_strategy "top_n"
   top_n_sample_dataset = dataset.sample('top_n', {'n': 5})

   # sample_strategy "simple_random"
   simple_random_sample_dataset = dataset.sample('simple_random', {'probability': 0.3, 'seed': 10.2})

   # sample_strategy "stratified"
   fractions = {}
   fractions[('THEFT',)] = 0.5
   fractions[('DECEPTIVE PRACTICE',)] = 0.2

   # take 50% of records with "Primary Type" as THEFT and 20% of records with "Primary Type" as
   # DECEPTIVE PRACTICE into sample Dataset
   sample_dataset = dataset.sample('stratified', {'columns': ['Primary Type'], 'fractions': fractions})

to_pandas_dataframe

Skapa en Pandas-dataram genom att köra transformeringspipelinen som definieras av den här datauppsättningsdefinitionen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Skapa en TabularDataset genom att anropa de statiska metoderna på Dataset.Tabular och använda to_pandas_dataframe metoden där. Mer information finns i https://aka.ms/dataset-deprecation.

to_pandas_dataframe()

Returer

Typ	Description
DataFrame	En Pandas DataFrame.

Kommentarer

Returnera en Pandas DataFrame som är helt materialiserad i minnet.

to_spark_dataframe

Skapa en Spark DataFrame som kan köra transformeringspipelinen som definieras av den här datauppsättningsdefinitionen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Skapa en TabularDataset genom att anropa de statiska metoderna på Dataset.Tabular och använda to_spark_dataframe metoden där. Mer information finns i https://aka.ms/dataset-deprecation.

to_spark_dataframe()

Returer

Typ	Description
DataFrame	En Spark-dataram.

Kommentarer

Spark-dataramen som returneras är bara en körningsplan och innehåller inga data, eftersom Spark Dataframes utvärderas lazily.

update

Uppdatera attributen för datauppsättningen som kan ändras på arbetsytan och returnera den uppdaterade datauppsättningen från arbetsytan.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

update(name=None, description=None, tags=None, visible=None)

Parametrar

Name	Description
name Obligatorisk	str Namnet på datauppsättningen på arbetsytan.
description Obligatorisk	str En beskrivning av data.
tags Obligatorisk	dict[str, str] Taggar som datauppsättningen ska associeras med.
visible Obligatorisk	bool Anger om datauppsättningen visas i användargränssnittet.

Returer

Typ	Description
Dataset	Ett uppdaterat datauppsättningsobjekt från arbetsytan.

update_definition

Uppdatera datauppsättningsdefinitionen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

update_definition(definition, definition_update_message)

Parametrar

Name	Description
definition Obligatorisk	DatasetDefinition Den nya definitionen av den här datauppsättningen.
definition_update_message Obligatorisk	str Meddelandet om definitionsuppdatering.

Returer

Typ	Description
Dataset	Ett uppdaterat datauppsättningsobjekt från arbetsytan.

Kommentarer

Om du vill använda den uppdaterade datauppsättningen använder du objektet som returneras av den här metoden.

Attribut

definition

Returnera den aktuella datauppsättningsdefinitionen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

Returer

Typ	Description
DatasetDefinition	Datamängdsdefinitionen.

Kommentarer

En datauppsättningsdefinition är en serie steg som anger hur du läser och transformerar data.

En datauppsättning som är registrerad på en AzureML-arbetsyta kan ha flera definitioner som var och en skapas genom att anropa update_definition. Varje definition har en unik identifierare. Med flera definitioner kan du göra ändringar i befintliga datauppsättningar utan att bryta modeller och pipelines som är beroende av den äldre definitionen.

För oregistrerade datauppsättningar finns det bara en definition.

definition_version

Returnera versionen av den aktuella definitionen av datauppsättningen.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

Returer

Typ	Description
str	Datamängdens definitionsversion.

Kommentarer

En datauppsättningsdefinition är en serie steg som anger hur du läser och transformerar data.

En datauppsättning som är registrerad på en AzureML-arbetsyta kan ha flera definitioner som var och en skapas genom att anropa update_definition. Varje definition har en unik identifierare. Den aktuella definitionen är den senaste som skapats, vars ID returneras av detta.

För oregistrerade datauppsättningar finns det bara en definition.

description

Returnera beskrivningen av datauppsättningen.

Returer

Typ	Description
str	Beskrivningen av datauppsättningen.

Kommentarer

Genom att ange en beskrivning av data i datauppsättningen kan användarna på arbetsytan förstå vad data representerar och hur de kan använda dem.

id

Om datauppsättningen har registrerats på en arbetsyta returnerar du ID:t för datauppsättningen. Annars returnerar du Ingen.

Returer

Typ	Description
str	Datamängds-ID:t.

is_visible

Kontrollera synligheten för en registrerad datauppsättning i användargränssnittet för Azure ML-arbetsytan.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

Returer

Typ	Description
bool	Datamängdens synlighet.

Kommentarer

Värden som returneras:

Sant: Datauppsättningen visas i arbetsytans användargränssnitt. Standardinställning.
Falskt: Datauppsättningen är dold i arbetsytans användargränssnitt.

Har ingen effekt på oregistrerade datauppsättningar.

name

Returnera datauppsättningens namn.

Returer

Typ	Description
str	Namnet på datauppsättningen.

state

Returnera datauppsättningens tillstånd.

Anmärkning

Den här metoden är inaktuell och stöds inte längre.

Mer information finns i https://aka.ms/dataset-deprecation.

Returer

Typ	Description
str	Datamängdstillståndet.

Kommentarer

Innebörden och effekten av tillstånd är följande:

Aktiv. Aktiva definitioner är exakt vad de låter som, alla åtgärder kan utföras på aktiva definitioner.
Föråldrad. inaktuell definition kan användas, men resulterar i att en varning loggas i loggarna varje gång underliggande data används.
Arkiverad. En arkiverad definition kan inte användas för att utföra någon åtgärd. Om du vill utföra åtgärder på en arkiverad definition måste den återaktiveras.

workspace

Om datauppsättningen har registrerats på en arbetsyta returnerar du den. Annars returnerar du Ingen.

Returer

Typ	Description
Workspace	Arbetsytan.

Tabular

Fabrik för att skapa FileDataset

alias för TabularDatasetFactory

Feedback

Var den här sidan till hjälp?

Dela via

Dataset Klass

Konstruktor

Parametrar

Kommentarer

Variabler

Metoder

archive

Returer

Kommentarer

auto_read_files

Parametrar

Returer

Kommentarer

compare_profiles

Parametrar

Returer

Kommentarer

create_snapshot

Parametrar

Returer

Kommentarer

delete_snapshot

Parametrar

Returer

Kommentarer

deprecate

Parametrar

Returer

Kommentarer

diff

Parametrar

Returer

from_binary_files

Parametrar

Returer

Kommentarer

from_delimited_files

Parametrar

Returer

Kommentarer

from_excel_files

Parametrar

Returer

Kommentarer

from_json_files

Parametrar

Returer

from_pandas_dataframe

Parametrar

Returer

Kommentarer

from_parquet_files

Parametrar

Returer

Kommentarer

from_sql_query

Parametrar

Returer

generate_profile

Parametrar

Returer

Kommentarer

get

Parametrar

Returer

Kommentarer

get_all

Parametrar

Returer

get_all_snapshots

Returer

get_by_id

Parametrar

Returer

get_by_name

Parametrar

Returer

get_definition

Parametrar