- 功能介绍
- 参数说明
- 脚本示例
- 脚本
- 结果
功能介绍
- 随机采样是对数据进行按个数随机抽样,每个样本都以相同的概率被抽到。
参数说明
| 名称 | 中文名称 | 描述 | 类型 | 是否必须? | 默认值 | |
|---|---|---|---|---|---|---|
| size | 采样个数 | 采样个数 | Integer | ✓ | ||
| withReplacement | 是否放回 | 是否有放回的采样,默认不放回 | Boolean | false |
脚本示例
脚本
data = data = np.array([["0,0,0"],["0.1,0.1,0.1"],["0.2,0.2,0.2"],["9,9,9"],["9.1,9.1,9.1"],["9.2,9.2,9.2"]])df = pd.DataFrame({"Y": data[:, 0]})# batch sourceinOp = dataframeToOperator(df, schemaStr='Y string', op_type='batch')sampleOp = SampleBatchOp()\.setSize(2)\.setWithReplacement(False)inOp.link(sampleOp).print()
结果
| Y |
|---|
| 0,0,0 |
| 0.2,0.2,0.2 |
