dataprep_utilities 模块

用于与 azureml.dataprep 交互的实用工具方法。

函数

dataprep_error_handler

处理数据准备错误。

param e:dataprep 服务类型引发的异常:DprepException

dataprep_error_handler(e: DataPrepException) -> NoReturn

参数

名称 说明
e
必需

get_dataprep_json

获取 dataprep json。

get_dataprep_json(X: Any | None = None, y: Any | None = None, sample_weight: Any | None = None, X_valid: Any | None = None, y_valid: Any | None = None, sample_weight_valid: Any | None = None, cv_splits_indices: Any | None = None) -> str | None

参数

名称 说明
X
<xref:azureml.dataprep.Dataflow>

训练功能。

默认值: None
y
<xref:azureml.dataprep.Dataflow>

训练标签。

默认值: None
sample_weight
<xref:azureml.dataprep.Dataflow>

训练数据的示例权重。

默认值: None
X_valid
<xref:azureml.dataprep.Dataflow>

验证功能。

默认值: None
y_valid
<xref:azureml.dataprep.Dataflow>

验证标签。

默认值: None
sample_weight_valid
<xref:azureml.dataprep.Dataflow>

验证集示例权重。

默认值: None
cv_splits_indices
<xref:azureml.dataprep.Dataflow>

自定义验证拆分索引。

默认值: None

返回

类型 说明

数据流听写的 JSON 字符串表示形式

get_dataprep_json_dataset

获取 dataprep json。

get_dataprep_json_dataset(training_data: Any | None = None, validation_data: Any | None = None, test_data: Any | None = None) -> str | None

参数

名称 说明
training_data
<xref:azureml.dataprep.Dataflow>

训练数据。

默认值: None
validation_data
<xref:azureml.dataprep.Dataflow>

验证数据

默认值: None
test_data
<xref:azureml.dataprep.Dataflow>

测试数据

默认值: None

返回

类型 说明

数据流听写的 JSON 字符串表示形式

is_dataflow

检查传递的对象是否为数据流类型。

is_dataflow(dataflow: Any) -> bool

参数

名称 说明
dataflow
必需

要检查的值。

返回

类型 说明

如此 如果数据流的类型为 azureml.dataprep.Dataflow

load_dataflows_from_json_dict

从 json 听写加载数据流。

load_dataflows_from_json_dict(dataflow_json_dict: Dict[str, Any]) -> Dict[str, Any]

参数

名称 说明
dataprep_json
必需
str

数据流听写的 JSON 字符串表示形式

dataflow_json_dict
必需

返回

类型 说明

包含键作为数据流名称和值作为数据流的听写,如果 JSON 格式不正确,则为 None

save_dataflows_to_json

将数据流保存到 json。

save_dataflows_to_json(dataflow_dict: Dict[str, Any]) -> str | None

参数

名称 说明
dataflow_dict
必需
dict(str, <xref:azureml.dataprep.Dataflow>)

将键作为数据流名称和值作为数据流的听写

返回

类型 说明

数据流听写的 JSON 字符串表示形式