当前位置:首页python > 正文

python机器学习 train_test_split()函数用法解析及示例

作者:野牛程序员:2023-12-18 19:31:26python阅读 3755

train_test_split()函数是Python中Scikit-learn库中用于划分训练集和测试集的函数。该函数的目的是将数据集按照一定的比例划分为训练集和测试集,以便评估模型的性能。以下是该函数的用法解析及示例代码:

from sklearn.model_selection import train_test_split
# 假设X是特征集,y是目标变量
X, y = ...  # 你的数据
# 使用train_test_split()函数划分数据集
# test_size表示测试集的比例,可以是float(表示比例)或int(表示样本数量)
# random_state是随机种子,确保每次运行结果相同
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 输出划分后的训练集和测试集大小
print("训练集大小:", len(X_train))
print("测试集大小:", len(X_test))

在这个例子中,X是特征集,y是目标变量。train_test_split()函数根据指定的test_size参数将数据集划分为训练集和测试集。random_state参数用于设置随机种子,以确保每次运行代码时划分结果相同。

请注意,train_test_split()函数的返回值是划分后的数据集,包括训练集和测试集的特征和目标变量。这些数据集可以用于训练机器学习模型并评估其性能。


野牛程序员教少儿编程与信息学奥赛-微信|电话:15892516892
野牛程序员教少儿编程与信息学竞赛-微信|电话:15892516892
相关推荐

最新推荐

热门点击