©著作权归作者所有:来自51CTO博客作者小慕先森的原创作品,请联系作者获取转载授权,否则将追究法律责任
鸢尾花数据集是分类任务中的经典数据集,本实例使用 Scikit - learn 库中的决策树分类器对鸢尾花进行分类。 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score加载鸢尾花数据集iris = load_iris() X = iris.data y = iris.target划分训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)创建决策树分类器并训练model = DecisionTreeClassifier() model.fit(X_train, y_train)进行预测y_pred = model.predict(X_test)评估模型accuracy = accuracy_score(y_test, y_pred) print(f"Accuracy: {accuracy}")代码解释: 从 Scikit - learn 库中导入加载数据集、划分数据集、决策树分类器以及准确率计算函数的模块。 加载鸢尾花数据集,该数据集包含 4 个特征(如花瓣长度、宽度等)和对应的鸢尾花类别(共 3 种)。 使用 train_test_split 函数将数据集划分为训练集和测试集,测试集占比 30%,并设置随机种子以确保结果可重复性。 创建决策树分类器实例,并使用训练集数据对模型进行训练。 使用训练好的模型对测试集数据进行预测。 通过计算准确率评估模型的性能,准确率表示预测正确的样本数占总样本数的比例。 赞 收藏 评论 举报相关文章