首页 > 分享 > 卷积神经网络训练花卉识别分类器

卷积神经网络训练花卉识别分类器

花匠小妙招
2024-09-10 14:37

介绍

本部分是花卉分类器，后续会有更为详细的更新。

花卉分类器使用语言：Python，使用深度学习框架：PyTorch，方法：训练卷积神经网络

关于PyTorch的基本用法可以参考博客：PyTorch笔记

Gitee仓库：花卉识别

Github仓库：花卉识别

Git相关用法可以参考博客：Git使用笔记

数据集

目前选用了20种花卉数据用于分类

data文件夹内存放了我使用的20种花卉数据集。日后会继续扩增。

数据来源主要取决于3个方面：

5种花卉数据集，每类花卉包含600张到900张不等的图片来源于Oxford 102 Flowers数据集，该数据集包含102类英国花卉数据，每个类别包含 40 到 258 张图像最后一部分来源于百度图片，使用python程序批量采集花卉图像数据

有些花卉的name是我自己写的，采用的是花卉的学名，通常是拉丁文。

我选用的20种花卉数据如下所示：

编号name名称数量1daisy雏菊6332dandelion蒲公英8983roses玫瑰花6414sunflowers向日葵6995tulips郁金香7996Nymphaea睡莲2267Tropaeolum_majus旱金莲1968Digitalis_purpurea毛地黄1909peach_blossom桃花5510Jasminum茉莉花6011Matthiola紫罗兰5412Rosa月季5413Rhododendron杜鹃花5714Dianthus康乃馨4815Cerasus樱花5016Narcissus水仙花5217Pharbitis牵牛花4618Gazania勋章菊10819Eschscholtzia花菱草8220Tithonia肿柄菊47

花卉样式：

数据扩展

收集到的每种花卉数量不是很多，而像樱花、水仙花等都是每类50张左右，数据量过少，若直接拿去训练模型的话，正确率不会太高，且会发生严重的过拟合。

目前使用的数据扩展方法分为三种：镜像翻转、上下翻转和椒盐噪声。

镜像翻转：将图片左右翻转，生成新的数据

上下翻转：将图片上下翻转，生成新的数据

椒盐噪声：为图片增加噪声，生成新的数据

扩展后的花卉数量如下所示：

编号name名称数量增量后数量1daisy雏菊63324962dandelion蒲公英89835883roses玫瑰花64124004sunflowers向日葵69927965tulips郁金香79931966Nymphaea睡莲22618087Tropaeolum_majus旱金莲19615688Digitalis_purpurea毛地黄19013609peach_blossom桃花5544010Jasminum茉莉花6048011Matthiola紫罗兰5443212Rosa月季5443213Rhododendron杜鹃花5745614Dianthus康乃馨4838415Cerasus樱花5040016Narcissus水仙花5241617Pharbitis牵牛花4636818Gazania勋章菊10846419Eschscholtzia花菱草8265620Tithonia肿柄菊47376 数据切分

数据集准备好了，要切分为训练集、验证集和测试集。

在PyTorch的torchvision包内有一个关于计算机视觉的数据读取类ImageFolder，它的调用方式是torchvision.datasets.ImageFolder，主要功能是读取图片数据，且要求图片是下图这种存放方式。