• 功能介绍
  • 参数说明
  • 脚本示例
    • 脚本
    • 结果

    功能介绍

    vector归一化是对vector数据进行归一的组件, 将数据归一到min和max之间。

    参数说明

    名称 中文名称 描述 类型 是否必须? 默认值
    selectedCol 选中的列名 计算列对应的列名 String
    min 归一化的下界 归一化的下界 Double 0.0
    max 归一化的上界 归一化的上界 Double 1.0

    脚本示例

    脚本

    1. data = np.array([["a", "10.0, 100"],\
    2. ["b", "-2.5, 9"],\
    3. ["c", "100.2, 1"],\
    4. ["d", "-99.9, 100"],\
    5. ["a", "1.4, 1"],\
    6. ["b", "-2.2, 9"],\
    7. ["c", "100.9, 1"]])
    8. df = pd.DataFrame({"col" : data[:,0], "vec" : data[:,1]})
    9. data = dataframeToOperator(df, schemaStr="col string, vec string",op_type="batch")
    10. trainOp = VectorMinMaxScalerTrainBatchOp()\
    11. .setSelectedCol("vec")
    12. model = trainOp.linkFrom(data)
    13. batchPredictOp = VectorMinMaxScalerPredictBatchOp()
    14. batchPredictOp.linkFrom(model, data).collectToDataframe()

    结果

    col1 vec
    a 0.5473107569721115,1.0
    b 0.4850597609561753,0.08080808080808081
    c 0.9965139442231076,0.0
    d 0.0,1.0
    a 0.5044820717131474,0.0
    b 0.4865537848605578,0.08080808080808081
    c 1.0,0.0