首页 > 分享 > 第1关:酒店评价数据分析.任务描述 根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。 import jieba test

第1关:酒店评价数据分析.任务描述 根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。 import jieba test

任务描述 根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。 import jieba test_str = '武汉理工大学是一所世人仰慕的大学' result = jieba.lcut(test_str) # 参数是字符串,结果是将字符串切分为词的列表 print(result) # ['武汉理工大学', '是', '一所', '世人', '仰慕', '的', '大学'] 文件数据每行包括评论属性和评论内容两个数据,其中评论属性中’1‘代表好评,’0‘代表差评。 要求实现以下功能: 文件编码格式为GBK,读取函数示例如下: with open('comment.csv', 'r', encoding='GBK') as f: ls=[i.strip().split(',',maxsplit=1) for i in f.readlines()[1:]] 输入n 如果n为’总评‘,分别输出该文件评论总数,好评条数,差评条数,输出格式参照示例一。 如果n为’平均‘,输出该文件中所有评论内容的平均长度(不需要排除字母,标点符号和数字),输出四舍五入后的整数,输出格式参照示例二。 如果n为’好评‘,对文件中所有好评进行词频分析,并输出词频出现最多的前15个词以及出现次数,输出格式参照示例三 如果n为’差评‘,对文件中所有差评进行词频分析,并输出词频出现最多的前15个词以及出现次数,输出格式参照示例四 注:3,4两项功能中统计的词语,要求长度不小于2,不是数字组成,并且不是排除词. 排除词 ex=['不错','比较','可以','感觉','没有', '我们','就是','还是','非常','但是', '不过','有点','一个','一般','下次', '携程','不是','晚上','而且','他们', '什么','不好','时候','知道','这样', '这个','还有','总体','位置','客人', '因为','如果','这里','很多','选择', '居然','不能','实在','不会','这家', '结果','发现','竟然','已经','自己', '问题','不要','地方','只有','第二天', '酒店','房间','虽然']‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬ 如果n非以上输入,输出’无数据‘,格式参照示例五 输入输出示例 示例只是输出格式示例,其中数据均与题目无关! 根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。 import jieba test_str = '武汉理工大学是一所世人仰慕的大学' result = jieba.lcut(test_str) # 参数是字符串,结果是将字符串切分为词的列表 print(result) # ['武汉理工大学', '是', '一所', '世人', '仰慕', '的', '大学'] 文件数据每行包括评论属性和评论内容两个数据,其中评论属性中’1‘代表好评,’0‘代表差评。 要求实现以下功能: 文件编码格式为GBK,读取函数示例如下: with open('comment.csv', 'r', encoding='GBK') as f: ls=[i.strip().split(',',maxsplit=1) for i in f.readlines()[1:]] 输入n 如果n为’总评‘,分别输出该文件评论总数,好评条数,差评条数,输出格式参照示例一。 如果n为’平均‘,输出该文件中所有评论内容的平均长度(不需要排除字母,标点符号和数字),输出四舍五入后的整数,输出格式参照示例二。 如果n为’好评‘,对文件中所有好评进行词频分析,并输出词频出现最多的前15个词以及出现次数,输出格式参照示例三 如果n为’差评‘,对文件中所有差评进行词频分析,并输出词频出现最多的前15个词以及出现次数,输出格式参照示例四 注:3,4两项功能中统计的词语,要求长度不小于2,不是数字组成,并且不是排除词. 排除词 ex=['不错','比较','可以','感觉','没有', '我们','就是','还是','非常','但是', '不过','有点','一个','一般','下次', '携程','不是','晚上','而且','他们', '什么','不好','时候','知道','这样', '这个','还有','总体','位置','客人', '因为','如果','这里','很多','选择', '居然','不能','实在','不会','这家', '结果','发现','竟然','已经','自己', '问题','不要','地方','只有','第二天', '酒店','房间','虽然']‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬ 如果n非以上输入,输出’无数据‘,格式参照示例五 输入输出示例 示例只是输出格式示例,其中数据均与题目无关! 根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。 import jieba test_str = '武汉理工大学是一所世人仰慕的大学' result = jieba.lcut(test_str) # 参数是字符串,结果是将字符串切分为词的列表 print(result) # ['武汉理工大学', '是', '一所', '世人', '仰慕', '的', '大学'] 文件数据每行包括评论属性和评论内容两个数据,其中评论属性中’1‘代表好评,’0‘代表差评。 要求实现以下功能: 文件编码格式为GBK,读取函数示例如下: with open('comment.csv', 'r', encoding='GBK') as f: ls=[i.strip().split(',',maxsplit=1) for i in f.readlines()[1:]] 输入n 如果n为’总评‘,分别输出该文件评论总数,好评条数,差评条数,输出格式参照示例一。 如果n为’平均‘,输出该文件中所有评论内容的平均长度(不需要排除字母,标点符号和数字),输出四舍五入后的整数,输出格式参照示例二。 如果n为’好评‘,对文件中所有好评进行词频分析,并输出词频出现最多的前15个词以及出现次数,输出格式参照示例三 如果n为’差评‘,对文件中所有差评进行词频分析,并输出词频出现最多的前15个词以及出现次数,输出格式参照示例四 注:3,4两项功能中统计的词语,要求长度不小于2,不是数字组成,并且不是排除词. 排除词 ex=['不错','比较','可以','感觉','没有', '我们','就是','还是','非常','但是', '不过','有点','一个','一般','下次', '携程','不是','晚上','而且','他们', '什么','不好','时候','知道','这样', '这个','还有','总体','位置','客人', '因为','如果','这里','很多','选择', '居然','不能','实在','不会','这家', '结果','发现','竟然','已经','自己', '问题','不要','地方','只有','第二天', '酒店','房间','虽然']‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬ 如果n非以上输入,输出’无数据‘,格式参照示例五 输入输出示例 示例只是输出格式示例,其中数据均与题目无关!

相关知识

第1关:酒店评价数据分析 任务描述 根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。 import jieba test
第1关:酒店评价数据分析.任务描述 根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。 import jieba test
数据分析金庸武侠经典人物,我们喜欢江湖中的这群人
python中jieba库的使用
2023-2000年上市公司企业人工智能技术应用数据、AI技术应用数据
【Python】—— pandas 数据分析
数据分析(Python)入门—鸢尾植物数据集处理
部分常用分词工具使用整理
鸢尾花数据集分析
构建神经网络对鸢尾花进行多分类分析

网址: 第1关:酒店评价数据分析.任务描述 根据附件文件对酒店评价数据进行分析,本题使用jieba库中的lcut函数对数据进行分词。 import jieba test https://m.huajiangbk.com/newsview2508868.html

所属分类:花卉
上一篇: 【统计学习方法】线性可分支持向量
下一篇: 第1关:酒店评价数据分析 任务描