首页 > 分享 > Flowers102花分类的数据下载和处理

Flowers102花分类的数据下载和处理

本来找到了一个别人准备好的网盘文件,结果一对发现少了图片,张数没对上,最终还是自己处理吧

数据下载

https://www.robots.ox.ac.uk/~vgg/data/flowers/102/

在这里插入图片描述
下载145,对于1可以使用迅雷下载,快的不是一点!!

下载后解压,解压可以看到是102flowers的文件夹,下面有一个jpg文件,里面全是散的图片

在这里插入图片描述

数据分类

# encoding:utf-8 import scipy.io import numpy as np import os from PIL import Image import shutil labels = scipy.io.loadmat(r'E:Base_codetestFlower102dataimagelabels.mat')#该地址为imagelabels.mat的绝对地址 labels = np.array(labels['labels'][0]) - 1 print("labels:", labels) setid = scipy.io.loadmat(r'E:Base_codetestFlower102datasetid.mat')#该地址为setid.mat的绝对地址 validation = np.array(setid['valid'][0]) - 1 np.random.shuffle(validation) train = np.array(setid['trnid'][0]) - 1 np.random.shuffle(train) test = np.array(setid['tstid'][0]) - 1 np.random.shuffle(test) flower_dir = list() for img in os.listdir(r"E:Base_codetestFlower102102flowersjpg"):#该地址为源数据图片的绝对地址 flower_dir.append(os.path.join(r"E:Base_codetestFlower102102flowersjpg", img)) flower_dir.sort() # print(flower_dir) des_folder_train = r"E:Base_codetestFlower102prepare_pictrain"#该地址为新建的训练数据集文件夹的绝对地址 for tid in train: #打开图片并获取标签 img = Image.open(flower_dir[tid]) print(img) # print(flower_dir[tid]) img = img.resize((256, 256), Image.ANTIALIAS) lable = labels[tid] # print(lable) path = flower_dir[tid] print("path:", path) base_path = os.path.basename(path) print("base_path:", base_path) classes = "c" + str(lable) class_path = os.path.join(des_folder_train, classes) # 判断结果 if not os.path.exists(class_path): os.makedirs(class_path) print("class_path:", class_path) despath = os.path.join(class_path, base_path) print("despath:", despath) img.save(despath) des_folder_validation = r"E:Base_codetestFlower102prepare_picval"#该地址为新建的验证数据集文件夹的绝对地址 for tid in validation: img = Image.open(flower_dir[tid]) # print(flower_dir[tid]) img = img.resize((256, 256), Image.ANTIALIAS) lable = labels[tid] # print(lable) path = flower_dir[tid] print("path:", path) base_path = os.path.basename(path) print("base_path:", base_path) classes = "c" + str(lable) class_path = os.path.join(des_folder_validation, classes) # 判断结果 if not os.path.exists(class_path): os.makedirs(class_path) print("class_path:", class_path) despath = os.path.join(class_path, base_path) print("despath:", despath) img.save(despath) des_folder_test = r"E:Base_codetestFlower102prepare_pictest"#该地址为新建的测试数据集文件夹的绝对地址 for tid in test: img = Image.open(flower_dir[tid]) # print(flower_dir[tid]) img = img.resize((256, 256), Image.ANTIALIAS) lable = labels[tid] # print(lable) path = flower_dir[tid] print("path:", path) base_path = os.path.basename(path) print("base_path:", base_path) classes = "c" + str(lable) class_path = os.path.join(des_folder_test, classes) # 判断结果 if not os.path.exists(class_path): os.makedirs(class_path) print("class_path:", class_path) despath = os.path.join(class_path, base_path) print("despath:", despath) img.save(despath)

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165

按照上述代码替换自己的路径
在这里插入图片描述
ps: 可能下载的标签文件直接点是乱码的,没有关系,直接替换路径就好。

处理好的数据如下:
在这里插入图片描述

接下来就可以进行自己的下游任务了,因为我打算构图,所以就不在这里写CNN分类的那些训练代码了

别人写的完整代码:
https://github.com/gaoli1537/flower102

有点奇怪的就是这个GitHub的代码确实是按照官方所给的数据划分的,train1020,valid1020,test6149,训练集好少。。很快就过拟合了
但是kaggle的划分是按照8:1:1进行划分的,也就是train 6552,valid 818,test819.

kaggle的是处理了的训练集和验证集,下载链接:https://www.kaggle.com/datasets/nunenuh/pytorch-challange-flower-dataset

然后看paperwithcode的topline都没有数据处理部分,直接加载训练的。。。

相关知识

细粒度分类常用数据集介绍及下载
建立一个植物毒性分类器:数据准备和清理
Tensorflow鸢尾花分类(数据加载与特征处理)
探索昆虫世界:利用hymenoptera数据集提升图像分类能力
TensorFlow 2建立神经网络分类模型——以iris数据为例
pytorch——AlexNet——训练花分类数据集
图像分类之花卉图像分类(一)数据增强
探索花朵的秘密世界:高品质五分类花卉识别数据集
资源一号02D卫星高光谱数据黄河三角洲湿地景观分类
细粒度分类数据集汇总

网址: Flowers102花分类的数据下载和处理 https://m.huajiangbk.com/newsview340686.html

所属分类:花卉
上一篇: 中经评论:为美好生活增色,“鲜花
下一篇: 过完年了,年花年桔如何处理?这是