Vector 缺失值填充预测组件
功能介绍
使用 Vecotor 缺失值填充模型对流Vector数据进行数据填充。
参数说明
| 名称 |
中文名称 |
描述 |
类型 |
是否必须? |
默认值 |
| outputCol |
输出结果列 |
输出结果列列名,可选,默认null |
String |
|
null |
|
脚本示例
运行脚本
data = np.array([["1:3,2:4,4:7", 1],\ ["1:3,2:NaN", 3],\ ["2:4,4:5", 4]])df = pd.DataFrame({"vec" : data[:,0], "id" : data[:,1]})dataStream = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="stream")data = dataframeToOperator(df, schemaStr="vec string, id bigint",op_type="batch")vecFill = VectorImputerTrainBatchOp().setSelectedCol("vec")model = data.link(vecFill)VectorImputerPredictStreamOp(model).setOutputCol("vec1").linkFrom(dataStream).print()StreamOperator.execute()
运行结果
| vec |
id |
vec1 |
| 1:3,2:4,4:7 |
1 |
1:3.0 2:4.0 4:7.0 |
| 1:3,2:NaN |
3 |
1:3.0 2:4.0 |
| 2:4,4:5 |
4 |
2:4.0 4:5.0 |