【实验内容】

分析各空气质量指数之间的相关关系(使用seaborn实现)

【实验目的】

(1)掌握分类散点图的绘制方法。

(2)掌握线性回归拟合图的绘制方法。

(3)掌握热力图的绘制方法。

实验技术/工具清单

集成开发工具:Anaconda3、PyCharm、Jupyter

第三方模块:Numpy、Pandas、Matplotlib、Seaborn

【实验原理/思路】

    空气质量指数(Air Quality Index,AQI)是能够对空气质量进行定量描述的数据。空气质量(Air quality)反映了空气污染程度,它是依据空气中污染物浓度来判断的。空气污染是一个复杂的现象,空气污染物浓度受到许多因素影响。

某市2020年1月-9月AQI的部分数据如表1所示。

表1 某市2020年1月-9月AQI的部分数据

【实验步骤】

(1)使用pandas库读取某市2020年1月-9月AQI统计数据。

(2)解决中文显示问题,设置字体为黑体,并解决保存图像时负号“-”显示为方块的问题。

(3)绘制质量等级分类散点图。

(4)绘制PM2.5与AQI线性回归拟合图。

(5)计算相关系数。

(6)绘制特征相关性热力图。

【实验记录与结果分析】

实现源代码和执行结果。

import numpy as np

 

import pandas as pd

import matplotlib.pyplot as plt

import statsmodels.api as sm

import seaborn as sns

# (1)使用pandas库读取某市2020年1月-9月AQI统计数据。

path ='aqi.csv'

aqi= pd.read_csv(path)

# (2)解决中文显示问题,设置字体为黑体,并解决保存图像时负号“-”显示为方块的问题。

plt.rcParams['font.sans-serif'] = ['SimHei']  # 解决命名时中文乱码的问题

plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像负号显示为方块的问题

aqi.head()

# (3)绘制质量等级分类散点图。

sns.stripplot(x=aqi["质量等级"])

plt.title('质量等级分类散点图')

 

 

plt.show()

# (4)绘制PM2.5与AQI线性回归拟合图。

data = aqi[["AQI","PM2.5含量(ppm)"]]

y=data['AQI']

x=data['PM2.5含量(ppm)']

sns.regplot(x=x,

            y=y,

            ci=50)

plt.title('PM2.5与AQI线性回归拟合图')

plt.show()

# (5)计算相关系数。

aqi.corr()

# (6)绘制特征相关性热力图。

corr=aqi.corr()

sns.heatmap(corr)

plt.title('特征相关性矩阵热力图')

plt.show()

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐