一、假设有一个10行的数据(DataFrame)
在这里插入图片描述
二、生成随机序列
在这里插入图片描述
三、将数据分成训练集和测试集
训练集:8行数据
测试集:2行数据
在这里插入图片描述

四、代码

import pandas as pd
import numpy as np

d = np.arange(10) + 1
data = pd.DataFrame({
    "A": d,
    "B": d * 0.1,
    "C": d * 0.01
})
data
random_mask = np.random.permutation(data.shape[0])
random_mask
# 训练集
train_set = data.loc[random_mask[:8], :]
train_set
# 测试集
test_set = data.loc[random_mask[8:], :]
test_set
Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐