功能介绍
- 随机采样是对数据进行随机抽样,每个样本都以相同的概率被抽到。
参数说明
| 名称 |
中文名称 |
描述 |
类型 |
是否必须? |
默认值 |
| ratio |
采样比例 |
采样率,范围为[0, 1] |
Double |
✓ |
|
| withReplacement |
是否放回 |
是否有放回的采样,默认不放回 |
Boolean |
|
false |
|
脚本示例
脚本
data = np.array([ ["-0.6264538 0.1836433"], ["-0.8356286 1.5952808"], ["0.3295078 -0.8204684"], ["0.4874291 0.7383247"], ["0.5757814 -0.3053884"], ["1.5117812 0.3898432"], ["-0.6212406 -2.2146999"], ["11.1249309 9.9550664"], ["9.9838097 10.9438362"], ["10.8212212 10.5939013"], ["10.9189774 10.7821363"], ["10.0745650 8.0106483"], ["10.6198257 9.9438713"], ["9.8442045 8.5292476"], ["9.5218499 10.4179416"],])df_data = pd.DataFrame({ "features": data[:, 0],})data = dataframeToOperator(df_data, schemaStr='features string', op_type='stream')sampleOp = SampleStreamOp().setRatio(0.3)data.link(sampleOp).print()StreamOperator.execute()
结果
| features |
| 10.9189774 10.7821363 |
| 10.0745650 8.0106483” |