第一章 开启数据挖掘之旅
打开jupyter notebook的方式:
在命令提示符(cmd)中输入:jupyter notebook就可以打开Web浏览器创建新的实例。
关闭:在cmd中输入Ctrl+C,确认关闭即可。
1.3 亲和性分析
应用场景:超市商品的摆放、向网站用户推送、电影推荐等。
找出规则。对于找出的规则需要判断其优劣,通过支持度(support)和置信度(confidence)。
支持度指数据集中规则应验的次数,或者是次数除以规则有效前提下的总数量。衡量的是给定规则应验比例。
置信度是指符合给定条件的所有规则里,跟当前规则结论一致的比例有多大,衡量的是规则准确率。计算方法:当前规则的出现次数除以条件相同的规则的数量。
举例:顾客购买了苹果,也购买了香蕉为例。
给定条件即为:购买了苹果,该事件发生的次数:num_occurances
规则应验的次数为:购买了苹果而且购买了香蕉:valid_rules
规则失效的次数为:购买了苹果但是没有购买香蕉:invalid_rules
则支持度=valid_rules,置信度=valid_rules/num_occurances。
根据支持度和置信度对rules进行排名,就能得到可靠性比较高的关联规则,然后做出反应。
在该亲和性问题中,我们关心的是两个变量之间的关系,比如:如何卖出更过的苹果。
亲和性分析算法的目标是从数据集中发现用以指导实践的规则。
也可以将是否购买苹果作为标签,转化成一个二分类问题,只
相关知识
《Python程序设计:人工智能案例实践》((美) 保罗·戴特尔(Paul Deitel))【简介
python数据分析与展示
卷积神经网络实现鸢尾花数据分类python代码实现
深度学习花卉识别:Python数据集解析
Python+Django框架淘宝零食销售数据可视化系统网站作品截图和开题报告参考
高效农作物病虫害识别:Python项目源码及数据集教程
python利用c4.5决策树对鸢尾花卉数据集进行分类(iris)
使用Python实现深度学习模型:智能农业病虫害检测与防治
科学网—为什么生态学家要学习Python或者R?
使用Python一步一步地来进行数据分析总结
网址: python数据挖掘入门与实践(一) https://m.huajiangbk.com/newsview519679.html
上一篇: 我的植物朋友鸢尾花作文500字 |
下一篇: 我的植物朋友水仙花作文 |