LocationClosestSelector 类
使用最接近球面距离的条件定义客户数据与公共数据的联接。
使用位置粒度进行初始化。
构造函数
LocationClosestSelector(_granularity: LocationClosestGranularity, enable_telemetry: bool = True)
参数
| 名称 | 说明 |
|---|---|
|
_granularity
必需
|
要用于联接数据的位置粒度。 |
|
enable_telemetry
|
指示是否启用遥测。 默认值: True
|
注解
静态方法 process(self, env, customer_data, public_data, aggregator, join_keys, debug) 用于基于以下选择器联接数据:
customer_data是azureml.opendatasets.accessories.location_data的实例。LocationDatapublic_data是azureml.opendatasets.accessories.location_data的实例。LocationDataaggregator是 azureml.opendatasets.aggregators.aggregator.Aggregator 之一join_keys是联接密钥对的列表debug指示是否打印调试日志。
此方法返回一个元组:已更改的客户数据类实例、更改的公共数据类实例和联接密钥对的列表。
方法
| process |
使用指定的聚合器联接客户数据和公共数据。 |
process
使用指定的聚合器联接客户数据和公共数据。
process(env: SparkEnv | PandasEnv, customer_data: LocationData, public_data: LocationData, aggregator: Aggregator, join_keys: list, debug: bool)
参数
| 名称 | 说明 |
|---|---|
|
env
必需
|
运行时环境。 |
|
customer_data
必需
|
LocationData 派生类的实例。 |
|
public_data
必需
|
LocationData 派生类的实例。 |
|
aggregator
必需
|
聚合器。 |
|
join_keys
必需
|
联接键对的列表。 |
|
debug
必需
|
指示是否打印调试日志。 |
返回
| 类型 | 说明 |
|---|---|
|
元组:已更改的客户数据类实例、更改的公共数据类实例和联接密钥对的列表。 |