首页 > 分享 > 随机森林划分训练集与测试集(随机划分、自定义划分)

随机森林划分训练集与测试集(随机划分、自定义划分)

最新推荐文章于 2024-12-29 12:02:41 发布

原创 于 2020-06-06 09:22:53 发布 · 6.1k 阅读

· 2

· 45 ·

CC 4.0 BY-SA版权

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本部分是根据需求 自定义人为划分训练集和测试集,随机划分样本可见上一篇博客。

如有错误之处,欢迎批评指正~

因为是人为规定哪些样本是训练集,哪些样本是测试集,因此训练集和测试集不是随机的,是我们已知的。因此我将训练集和测试集分别放置在两个CSV文档中。
下图是训练集的部分原始数据。第一列是图像编号,中间列是图像特征,最后一列是图像的实际分类结果。(80张图像)
在这里插入图片描述下图是测试集的部分原始数据:(20张图像)
在这里插入图片描述
实际运行过程中可以提前将number列也就是图像编号列给删去,这里为了方便大家理解,就不删除啦~~

代码如下:(我用anaconda实现的哦~)

import pandas as pd import numpy as np #将训练集和测试集分别放在两个CSV文件中,并分别读取。 train=pd.read_csv('data-train.csv') test=pd.read_csv('data-test.csv') #定义训练集与测试集中的特征和分类结果 y_train=np.array(train['actual']) x_train=train.drop('actual',axis=1) y_test=np.array(test['actual']) x_test=test.drop('actual',axis=1) print(y_train.shape,x_train.shape,y_test.shape,x_test.shape)

123456789101112

上部分代码的运行结果:

相关知识

102类花卉分类数据集(已划分,有训练集、测试集、验证集标签)
数据集划分,Oxford Flower102花卉分类数据集,分为训练集、测试集、验证集
鸢尾花分类预测实战:随机森林模型
pytorch实现深度学习常用图像分类数据集的划分与读取(Oxford
鸢尾花数据集分类
【机器学习小实验5】基于决策树和随机森林的鸢尾花种类预测
深度学习:花朵图像生成模型训练数据集
【统计学习方法】线性可分支持向量机对鸢尾花(iris)数据集进行二分类
2.1 随机森林分类器
鸢尾花——随机森林分类模型(RandomForestClassifier)

网址: 随机森林划分训练集与测试集(随机划分、自定义划分) https://m.huajiangbk.com/newsview2537996.html

所属分类:花卉
上一篇: 《魔兽世界》乌龟服园艺种子任务攻
下一篇: 植物科普——复羽叶栾树