首页 > 分享 > Python+KNN 算法怎么实现城市空气质量分析与预测?看我用代码怎么解决

Python+KNN 算法怎么实现城市空气质量分析与预测?看我用代码怎么解决

随着中国工业和科技的发展,中国的一些发达城市的空气质量问题变得越来越严重,其中最为严重的便是PM2.5带来的恶劣环境问题。

本文在根据网络公开空气质量数据的基础上进行爬取相关数据,主要针对环境较为恶劣的城市,天津、北京、广州等几个城市,尤其是针对天津的质量数据进行对比分析。在分析的基础上得出空气质量变化情况,提出一些意见。并借助机器学习算法根据数据预测空气质量,以达到分析预测的典型大数据分析模式效果。

整体分析的流程图如下:

实验前的准备

1.1 数据获取

我们这里所得到的数据来源于网络公开的空气质量数据,数据来源于“天气后报”网站,网址为:http://www.tianqihoubao.com/aqi/tianjin.html。网址内容如下图可见:

图1-1 网址数据图

整个数据的获取使用python进行爬取。流程如下:

(1) 导入爬虫所需要的的库:

在air_tianjin_2019.py程序中。

其中Requests 是用Python语言编写,基于urllib,采用 Apache2 Licensed开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。

其中BeautifulSoup库是一个灵活又方便的网页解析库,处理高效,支持多种解析器。利用它就不用编写正则表达式也能方便的实现网页信息的抓取

对应代码如下:

import time

import requests

from

import

BeautifulSoup

(2)为了防止网站的反爬机制,我们设定模拟浏览器进行访问获取数据:

headers = {     'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36' }

(3)然后获取2019年全年的空气质量数据:

for i  in range ( 1 ,  13 ):

time. sleep ( 5 )

=  'http://www.tianqihoubao.com/aqi/tianjin-2019' + str( "%02d" % i) +  '.html'

response = requests. get (url=url, headers=headers)

soup = BeautifulSoup(response.text,  'html.parser' )

'tr'

)

1.2 数据预处理

如果仅仅是从网站上得到的数据会有一些标签等干扰项,我们针对一些标签进行去除即可:

for j  in tr[ 1 :]:

td = j.find_all( 'td' )

Date = td[ 0 ].get_text().strip()

Quality_grade = td[ 1 ].get_text().strip()

AQI = td[ 2 ].get_text().strip()

AQI_rank = td[ 3 ].get_text().strip()

PM = td[ 4 ].get_text()

with open( 'air_tianjin_2019.csv' ,  'a+' , encoding= 'utf-8-sig' )  as f:

f.write( Date +  ',' + Quality_grade +  ',' + AQI +  ',' + AQI_rank +  ','

'n'

)

最终爬

相关知识

基于土壤数据与机器学习算法的农作物推荐算法代码实现
基于STM32 的空气质量指数预测系统毕业设计【附代码】
花授粉优化算法及代码实现
Python原生代码实现KNN算法(鸢尾花数据集)
解密未来出行:揭秘智慧交通算法如何重塑城市出行新纪元
微气候环境下的城市通风、空气质量及空间优化
KNN算法实现鸢尾花数据集分类 C语言实现指南
数据结构与算法(二)—— 算法基础知识与效率度量
十本数据结构与算法书籍推荐
卷积神经网络实现鸢尾花数据分类python代码实现

网址: Python+KNN 算法怎么实现城市空气质量分析与预测?看我用代码怎么解决 https://m.huajiangbk.com/newsview2013619.html

所属分类:花卉
上一篇: 【空气质量数据分析专题六】污染物
下一篇: 【昆山PM2.5实时查询】