python机器学习 train_test_split()函数用法解析及示例
作者:野牛程序员:2023-12-18 19:31:26python阅读 3136
train_test_split()
函数是Python中Scikit-learn库中用于划分训练集和测试集的函数。该函数的目的是将数据集按照一定的比例划分为训练集和测试集,以便评估模型的性能。以下是该函数的用法解析及示例代码:
from sklearn.model_selection import train_test_split # 假设X是特征集,y是目标变量 X, y = ... # 你的数据 # 使用train_test_split()函数划分数据集 # test_size表示测试集的比例,可以是float(表示比例)或int(表示样本数量) # random_state是随机种子,确保每次运行结果相同 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 输出划分后的训练集和测试集大小 print("训练集大小:", len(X_train)) print("测试集大小:", len(X_test))
在这个例子中,X
是特征集,y
是目标变量。train_test_split()
函数根据指定的test_size
参数将数据集划分为训练集和测试集。random_state
参数用于设置随机种子,以确保每次运行代码时划分结果相同。
请注意,train_test_split()
函数的返回值是划分后的数据集,包括训练集和测试集的特征和目标变量。这些数据集可以用于训练机器学习模型并评估其性能。
野牛程序员教少儿编程与信息学奥赛-微信|电话:15892516892