import seaborn as sns iris = sns.load_dataset('iris') X_iris = iris.drop('species', axis=1) y_iris = iris['species'] print(X_iris) from sklearn.cross_validation import train_test_split Xtrain, Xtest, ytrain, ytest = train_test_split(X_iris, y_iris, random_state=1) from sklearn.naive_bayes import GaussianNB model = GaussianNB() model.fit(Xtrain, ytrain) y_model = model.predict(Xtest) from sklearn.metrics import accuracy_score accuracy_score(ytest, y_model)
1234567891011121314151617这里我们在线导入seaborn库的iris(鸢尾花)数据
import seaborn as sns iris = sns.load_dataset('iris') 12
这是github上的说明, 可直接下载csv文件
二-将数据格式化X_iris = iris.drop('species', axis=1) y_iris = iris['species'] 12
将类别那一列删除生成新的对象赋值给X_iris, y_iris为分类.
pandas的drop方法参考
from sklearn.cross_validation import train_test_split Xtrain, Xtest, ytrain, ytest = train_test_split(X_iris, y_iris, random_state=1) 12
cross validation是交叉验证的意思, 参考文章
参数random_state是固定的随机种子, 参考文章
from sklearn.naive_bayes import GaussianNB model = GaussianNB() model.fit(Xtrain, ytrain) y_model = model.predict(Xtest) # 进行预测 1234
调用Gaussian naive Bayes模型, 并进行拟合, 预测
五-对测试结果进行评估评估方法介绍
from sklearn.metrics import accuracy_score accuracy_score(ytest, y_model) 12
得到准确率为0.9736842105263158
metrics是指标的意思.
说明对特征明显的数据, 即使是非常简单的分类算法也可以高效地进行分析.
相关知识
朴素贝叶斯算法对鸢尾花分类
鸢尾花数据集分类(决策树,朴素贝叶斯,人工神经网络)
基于朴素贝叶斯的鸢尾花数据集分类
朴素贝叶斯分类(鸢尾花数据集)
鸢尾花的分类(四种方法)
KNN、NB、SVM实现鸢尾花分类
【python 文本分类】sklearn朴素贝叶斯分类模型
R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据
实战四:基于朴素贝叶斯方法对鸢尾花卉品种预测 代码+数据 课程设计
逻辑回归分类、决策树分类、朴素贝叶斯分类及手写数字识别
网址: 高斯朴素贝叶斯方法进行鸢尾花分类 https://m.huajiangbk.com/newsview1675270.html
上一篇: Python与机器学习实战:KN |
下一篇: 模糊聚类算法实现与应用 |