经过数据探索和数据预处理, 得到了可以直接建模的数据。 根据挖掘目标, 和数据形式可以建立分类与预测、聚类分析、关联规则、时序模型和偏差检测等模型, 帮助企业提取数据中蕴含的商业价值, 提高企业的竞争力。

分类与预测:

分类模型的实现步骤:

常用的分类与预测算法:

可参考:

    逻辑回归(Logistic Regression)分类算法

    决策树(Decision Tree)分类算法

    KNN——K最近邻算法

    朴素贝叶斯分类

    SVM支持向量机

    集成学习

    人工神经网络

 

朴素贝叶斯:

\Omega是实验E 的样本空间,A为E 的事件,B_1, B_2\cdots B_n为\Omega\Omega 的一个划分

全概率公式为:

A=A\Omega =A\cap (B_1\cup B_2\cup\cdots B_n)\\ =AB_1 \cup AB_2 \cup \cdots AB_n\\ P(A)=P(B_1)P(A/B_1)\cdotsP(B_n)P(A/B_n)

 

有个朴素贝叶斯决策的例子

 

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐