最近在入门深度学习,打算练一个花卉识别的项目,本文将阐述该项目用的数据集的介绍、下载、处理以及可能遇到的问题。
数据集介绍
该数据集为牛津工程大学2008年发布的用于图像分类的花卉数据集,其中包括102种花的类别,所选的花卉通常在英国常见。每个类别包含40到258张图片。
下载地址:Flower 102 Dataset
网页如下:

数据处理
第一个 Dataset Images 解压出来是一个**.jpg**文件,里面是各种花卉的图,我们需要将它们分类。第二个文件和第三个文件下载出来分别为 imagelabels.mat 和 setid.mat。我把它们 都放在工作路径下。数据处理代码如下:
import scipy.io import numpy as np import os from PIL import Image # 加载标签和数据集划分信息 imagelabels_path = './imagelabels.mat' labels = scipy.io.loadmat(imagelabels_path)['labels'][0] - 1 setid_path = './setid.mat' setid = scipy.io.lo
python
123456789
于 2025-03-17 09:08:52 发布 · 1.1k 阅读