某市2020年1月至9月AQI数据可视化分析
空气质量指数(Air Quality Index,AQI)是能够对空气质量进行定量描述的数据。空气质量(Air quality)反映了空气污染程度,它是依据空气中污染物浓度来判断的。(2)解决中文显示问题,设置字体为黑体,并解决保存图像时负号“-”显示为方块的问题。(1)使用pandas库读取某市2020年1月-9月AQI统计数据。某市2020年1月-9月AQI的部分数据如表1所示。(2)掌握线性
·
【实验内容】
分析各空气质量指数之间的相关关系(使用seaborn实现)
【实验目的】
(1)掌握分类散点图的绘制方法。
(2)掌握线性回归拟合图的绘制方法。
(3)掌握热力图的绘制方法。
【实验技术/工具清单】
集成开发工具:Anaconda3、PyCharm、Jupyter
第三方模块:Numpy、Pandas、Matplotlib、Seaborn
【实验原理/思路】
空气质量指数(Air Quality Index,AQI)是能够对空气质量进行定量描述的数据。空气质量(Air quality)反映了空气污染程度,它是依据空气中污染物浓度来判断的。空气污染是一个复杂的现象,空气污染物浓度受到许多因素影响。
某市2020年1月-9月AQI的部分数据如表1所示。
表1 某市2020年1月-9月AQI的部分数据
【实验步骤】
(1)使用pandas库读取某市2020年1月-9月AQI统计数据。
(2)解决中文显示问题,设置字体为黑体,并解决保存图像时负号“-”显示为方块的问题。
(3)绘制质量等级分类散点图。
(4)绘制PM2.5与AQI线性回归拟合图。
(5)计算相关系数。
(6)绘制特征相关性热力图。
【实验记录与结果分析】
实现源代码和执行结果。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import seaborn as sns
# (1)使用pandas库读取某市2020年1月-9月AQI统计数据。
path ='aqi.csv'
aqi= pd.read_csv(path)
# (2)解决中文显示问题,设置字体为黑体,并解决保存图像时负号“-”显示为方块的问题。
plt.rcParams['font.sans-serif'] = ['SimHei'] # 解决命名时中文乱码的问题
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像负号显示为方块的问题
aqi.head()
# (3)绘制质量等级分类散点图。
sns.stripplot(x=aqi["质量等级"])
plt.title('质量等级分类散点图')
plt.show()
# (4)绘制PM2.5与AQI线性回归拟合图。
data = aqi[["AQI","PM2.5含量(ppm)"]]
y=data['AQI']
x=data['PM2.5含量(ppm)']
sns.regplot(x=x,
y=y,
ci=50)
plt.title('PM2.5与AQI线性回归拟合图')
plt.show()
# (5)计算相关系数。
aqi.corr()
# (6)绘制特征相关性热力图。
corr=aqi.corr()
sns.heatmap(corr)
plt.title('特征相关性矩阵热力图')
plt.show()
|
更多推荐
所有评论(0)