分组聚合操作

1.单层分组聚合
 df=df.groupby(‘列索引’)[‘列名’].mean():聚合求平均值
2.多层分组聚合
 df=df.groupby([‘列1’,‘列2’],……,as_index=False包含自带行索引)[‘列名’].mean()
 s.unstack()可以将多层聚合后的Series对象转变成DataFrame对象,将索引的最后一行转变成DataFrame对象的列索引,剩下的索引为DataFrame对象的行索引

数据可视化

1.可视化的三个功能:信息记录;支持对信息的推理和分析;信息传播与协同。
2.数据的五种相关关系:构成(占总体百分比),比较(项目排名),趋势(随时间变化),分布(项目频率),联系(变量之间关系)
3.让matplotlib库能够支持中文字体
 导入matplotlib库的pyplot模块:
  from matplotlib importt pyplot as plt
 设置中文字体
  plt.rcParms[‘font.family’]=[‘source Han Sans CN’]
4.图形简单绘制
 df.plot(kind=’ ‘,figsize=(7,7),title=’ '):
  kind:图表类型 line-折线 pie:饼图 bar:条形图
  figsize:画布大小
  title:标题
pandas库直接绘图,与matplotlib库没有直接关系

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐