首页 > 分享 > 什么是聚类分析?

什么是聚类分析?

什么是聚类分析?

已完成100 XP

5 分钟

聚类分析是一种机器学习形式,在此形式下,基于观察值的数据值或特征的相似性,将观察值分组到群集中。 这种就是非监督式机器学习,因为它不使用先前已知的值(称为“标签”)来训练模型。 在聚类分析模型中,可以将标签视为一个群集,仅根据该群集特征向群集分配观察结果。

例如,假设一位植物学家观察花的样本,并记录每支花上的花瓣和叶子的数量。

Illustration showing flower clusters.

根据花的特征之间的相似性将这些花分组到群集中可能会很有用。 可通过多种方式来执行此操作。 例如,如果大多数花朵的叶数相同,则可以按花瓣数量的多少对其进行分组。 或者,如果花瓣和叶的计数差异很大,则可能会发现另一种模式,例如,叶数多的花朵的花瓣也很多。

聚类分析算法旨在找到将数据集拆分为组的最佳方法。 “最佳”的含义取决于使用的算法和提供的数据集。

虽然对人类来说此花朵示例可能十分简单,只需要对几个样本进行分组,但更复杂的示例可以从聚类分析算法中受益。 随着数据集逐渐增长到具有数千个样本或两个以上的特征,聚类分析算法可帮助你实现对数据集的快速分组。

下一单元: 练习 - 训练和评估聚类分析模型

上一篇下一步

相关知识

不同产地红花中微量元素的因子分析和聚类分析
什么是“国兰”?什么是“洋兰”?
什么是植物检疫?什么是检疫性有害生物
什么是商标?(什么是商标注册号)
什么是五色花,什么是五色花知识
什么是图像识别
有了K均值聚类,为什么还需要DBSCAN聚类算法?
什么是精油?什么是芳香疗法?
什么是草本植物
什么是鲜切花

网址: 什么是聚类分析? https://m.huajiangbk.com/newsview545953.html

所属分类:花卉
上一篇: 数据化模型实现阳光玫瑰精进化管理
下一篇: 第4周