首页 > 分享 > 基于PCA的数据降维（鸢尾花（iris）数据集）

基于PCA的数据降维（鸢尾花（iris）数据集）

花匠小妙招
2024-11-14 12:56

一、数据集

二、PCA降维

1）加载数据集

2）PCA降维过程

3）可视化降维效果

三、运行效果图

一、数据集

鸢尾花数据集是 Python 中 sklearn 库自带的数据集。数据本身是四维数据集，这里采用数据降维技术将数据降至二维，以便更好地可视化数据特征。

二、PCA降维

1）加载数据集

首先加载高维数据集（维度为4），并确定降维后空间维度n_components(维度为2）。

from sklearn.datasets import load_iris

data = load_iris()

y = data.target

x = data.data

n_components = 2

2）PCA降维过程

执行PCA算法进行降维操作，得到降维后的向量reduce_x。

from sklearn.decomposition import PCA

pca = PCA(n_components = n_components)

reduced_x = pca.fit_transform(x)

3）可视化降维效果

由于数据集已经进行了预定义为三类，为了有效区分不同类型之间特征以及同类别间的联系，将在二维空间进行可视化操作。

import matplotlib.pyplot as plt

red_x,red_y = [],[]

blue_x,blue_y = [],[]

green_x,green_y = [],[]

for i in range(len(reduced_x)):

if y[i] == 0:

red_x.append(reduced_x[i][0])

red_y.append(reduced_x[i][1])

elif y[i] == 1:

blue_x.append(reduced_x[i][0])

blue_y.append(reduced_x[i][1])

else:

green_x.append(reduced_x[i][0])

green_y.append(reduced_x[i][1])

plt.scatter(red_x,red_y,c='r',marker='x',label='Class1')

plt.scatter(blue_x,blue_y,c='b',marker='D',label='Class2')

plt.scatter(green_x,green_y,c='g',marker='.',label='Class3')

三、运行效果图

可以清晰地看到三类数据被分割，且 Class1 与 Class2 和 Class3 差别明显。这证明了PCA降维的确提取出了重要特征，并且这种特征可以更好地区分数据，从而避免了数据集的“高维灾难”。

原文链接: 基于PCA的数据降维（鸢尾花（iris）数据集） https://m.huajiangbk.com/newsview545966.html

分类：花卉

上一篇: iris数据

下一篇: 人工智能

沂蒙老李爱摄影：蕉花

鹤望兰，又称天堂鸟或极乐鸟花，芭蕉科、鹤望兰属植物

分享热点排名

明日花キララ:明日花绮罗年度好评作品番号汇总

明日花キララ(明日花绮罗)经典品番作品及内容预览

推荐分享

家庭养花风水知识家庭养花“五行说”

家庭养花知识大全家庭养花有什么好处

即时知识

新手必看！草莓高产种植技术，一学就会！

鸭脚木怎么养养殖要注意什么

分享分类导航

花卉

每日分享

花卉图片

养花生活

基于PCA的数据降维（鸢尾花（iris）数据集）

一、数据集

二、PCA降维

三、运行效果图

沂蒙老李爱摄影：蕉花

鹤望兰，又称天堂鸟或极乐鸟花，芭蕉科、鹤望兰属植物

明日花キララ:明日花绮罗年度好评作品番号汇总

明日花キララ(明日花绮罗)经典品番作品及内容预览

家庭养花风水知识 家庭养花“五行说”

家庭养花知识大全 家庭养花有什么好处

家庭养花风水知识家庭养花“五行说”

家庭养花知识大全家庭养花有什么好处