output_dataset_config 模块

包含用于指定作业的输出应如何上载和提升到数据集的配置。

有关详细信息,请参阅 有关如何指定输出的文章。

HDFSOutputDatasetConfig

表示如何输出到 HDFS 路径,并将其提升为 FileDataset。

初始化 HDFSOutputDatasetConfig。

LinkFileOutputDatasetConfig

注释

这是一个实验类,随时可能会更改。 有关详细信息,请参阅 https://aka.ms/azuremlexperimental

表示如何链接运行输出并将其提升为 FileDataset。

LinkFileOutputDatasetConfig 允许将文件数据集作为输出数据集链接


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   output = LinkFileOutputDatasetConfig('link_output')

   script_run_config = ScriptRunConfig('.', 'link.py', arguments=[output])

   # within link.py
   # from azureml.core import Run, Dataset
   # run = Run.get_context()
   # workspace = run.experiment.workspace
   # dataset = Dataset.get_by_name(workspace, name='dataset_to_link')
   # run.output_datasets['link_output'].link(dataset)

   run = experiment.submit(script_run_config)
   print(run)

初始化 LinkFileOutputDatasetConfig。

LinkTabularOutputDatasetConfig

注释

这是一个实验类,随时可能会更改。 有关详细信息,请参阅 https://aka.ms/azuremlexperimental

表示如何链接运行输出并将其提升为 TabularDataset。

LinkTabularOutputDatasetConfig 允许将文件表格作为输出数据集链接


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   output = LinkTabularOutputDatasetConfig('link_output')

   script_run_config = ScriptRunConfig('.', 'link.py', arguments=[output])

   # within link.py
   # from azureml.core import Run, Dataset
   # run = Run.get_context()
   # workspace = run.experiment.workspace
   # dataset = Dataset.get_by_name(workspace, name='dataset_to_link')
   # run.output_datasets['link_output'].link(dataset)

   run = experiment.submit(script_run_config)
   print(run)

初始化 LinkTabularOutputDatasetConfig。

MountOptions

特定于要装载的输出的选项。

初始化 MountOptions。

OutputDatasetConfig

表示如何将作业的输出复制到远程存储位置,并将其提升到数据集。

这是一个基类,用于表示如何将作业的输出复制到远程存储位置、是否将其注册为命名数据集和版本控制的数据集,以及是否对创建的数据集应用任何其他转换。

不应直接创建此类的实例,而是应使用相应的子类。

初始化 OutputDatasetConfig。

OutputFileDatasetConfig

表示如何复制运行的输出并将其提升为 FileDataset。

OutputFileDatasetConfig 允许指定将计算目标上的特定本地路径上传到指定目标的方式。 如果未将任何参数传递给构造函数,我们将自动生成名称、目标和本地路径。

不传递任何参数的示例:


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   output = OutputFileDatasetConfig()

   script_run_config = ScriptRunConfig('.', 'train.py', arguments=[output])

   run = experiment.submit(script_run_config)
   print(run)

创建输出并将其提升为表格数据集的示例,并将其注册为名称 foo:


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   datastore = Datastore(workspace, 'example_adls_gen2_datastore')

   # for more information on the parameters and methods, please look for the corresponding documentation.
   output = OutputFileDatasetConfig().read_delimited_files().register_on_complete('foo')

   script_run_config = ScriptRunConfig('.', 'train.py', arguments=[output])

   run = experiment.submit(script_run_config)
   print(run)

初始化 OutputFileDatasetConfig。

OutputFileDatasetConfig 允许指定将计算目标上的特定本地路径上传到指定目标的方式。 如果未将任何参数传递给构造函数,我们将自动生成名称、目标和本地路径。

不传递任何参数的示例:


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   output = OutputFileDatasetConfig()

   script_run_config = ScriptRunConfig('.', 'train.py', arguments=[output])

   run = experiment.submit(script_run_config)
   print(run)

创建输出并将其提升为表格数据集的示例,并将其注册为名称 foo:


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   datastore = Datastore(workspace, 'example_adls_gen2_datastore')

   # for more information on the parameters and methods, please look for the corresponding documentation.
   output = OutputFileDatasetConfig().read_delimited_files().register_on_complete('foo')

   script_run_config = ScriptRunConfig('.', 'train.py', arguments=[output])

   run = experiment.submit(script_run_config)
   print(run)
OutputTabularDatasetConfig

表示如何复制运行的输出并将其提升为 TabularDataset。

初始化 OutputTabularDatasetConfig。

RegistrationConfiguration

指定如何将输出注册为数据集的配置。

初始化 RegistrationConfiguration。

TransformationMixin

此类提供输出数据集的转换功能。

UploadOptions

特定于要上传的输出的选项。

初始化 UploadOptions。