- 数据集拆分
- 功能介绍
- 参数说明
- 脚本示例
数据集拆分
功能介绍
将数据集按比例拆分为两部分
参数说明
名称 | 中文名称 | 描述 | 类型 | 是否必须? | 默认值 | |
---|---|---|---|---|---|---|
fraction | 拆分到左端的数据比例 | 拆分到左端的数据比例 | Double | ✓ |
脚本示例
URL = "http://alink-dataset.cn-hangzhou.oss.aliyun-inc.com/csv/iris.csv"
SCHEMA_STR = "sepal_length double, sepal_width double, petal_length double, petal_width double, category string";
data = CsvSourceStreamOp().setFilePath(URL).setSchemaStr(SCHEMA_STR)
spliter = SplitStreamOp().setFraction(0.4)
train_data = spliter
test_data = spliter.getSideOutput(0)