数据分析
收集的数据要进行清洗,把无用的数据舍弃,对有效数据进行分析。
数据的质量:重复?完整?一致?时效?
数据的形式:结构化数据;半结构化数据;非结构化数据
结构化数据:SQL数据(完全限制格式)
半结构化数据:JSON(整体有着一定的格式,具体是非结构化的数据)——既有结构化数据,又有非结构化数据
非结构化数据:图像,文本
数据分析的好处(通俗化):
搞清事实,接近真相,预测未知,帮助决策
逐步挖掘商业价值的分析(学术):
描述分析,诊断分析,预测分析,指导分析(Excel,Python)
分析所用的一些模型:
分析方法与工具:
另外,学会使用GitHub!
数据可视化:
为了更好的阅读,为了更好的解析结果,我们把结果可视化,但是,可视化的方式不对,可能会得到完全没用的结论。举例如下:
这是9月份同比销售额的可视化:
不同的可视化方式,得到完全不一样的视觉效果,由此得到不一样的结果。更甚者,有恶意可视化,完全与真实相反,误导人们的眼球。
可视化的时候,注意选取正确的可视化方法。
典型数据驱动开发团队人员:
大型的项目需要一个团队共同协作才能做得更好!
所有评论(0)