《R语言与数据挖掘》⑥-⑤分类与预测建模【朴素贝叶斯分类】
算法思路:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。naiveBayes()函数# 朴素贝叶斯分类算法setwd("F:\\桌面")# 设置工作空间Data <- read.csv("./test.txt",sep = '\t')# 读入数据Data[, "MN"] <- as.factor(Data[, "MN"])# 将目
·
算法思路:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
naiveBayes()函数
# 朴素贝叶斯分类算法
setwd("F:\\桌面") # 设置工作空间
Data <- read.csv("./test.txt",sep = '\t') # 读入数据
Data[, "MN"] <- as.factor(Data[, "MN"]) # 将目标变量转换成因子型
set.seed(1234) # 设置随机种子
# 数据集随机抽70%定义为训练数据集,30%为测试数据集
ind <- sample(2, nrow(Data), replace = TRUE, prob = c(0.7, 0.3))
traindata <- Data[ind == 1, ]
testdata <- Data[ind == 2, ]
# 使用naiveBayes函数建立朴素贝叶斯分类模型
library(e1071) # 加载e1071包
naiveBayes.model <- naiveBayes(MN ~ ., data = traindata) # 建立朴素贝叶斯分类模型
# 预测结果
train_predict <- predict(naiveBayes.model, newdata = traindata) # 训练数据集
test_predict <- predict(naiveBayes.model, newdata = testdata) # 测试数据集
# 输出训练数据的分类结果
train_predictdata <- cbind(traindata, predictedclass = train_predict)
# 输出训练数据的混淆矩阵
(train_confusion <- table(actual = traindata$MN, predictedclass = train_predict))
# 输出测试数据的分类结果
test_predictdata <- cbind(testdata, predictedclass = test_predict)
# 输出测试数据的混淆矩阵
(test_confusion <- table(actual = testdata$MN, predictedclass = test_predict))
训练数据混淆矩阵
predictedclass
actual 0 1
0 32 185
1 18 588
测试数据混淆矩阵
predictedclass
actual 0 1
0 9 63
1 9 261
# 使用NaiveBayes函数建立朴素贝叶斯分类模型
library(klaR) # 加载klaR包
NaiveBayes.model <- NaiveBayes(MN ~ ., data = traindata) # 建立朴素贝叶斯分类模型
# 预测结果
train_predict <- predict(NaiveBayes.model) # 训练数据集
test_predict <- predict(NaiveBayes.model, newdata = testdata) # 测试数据集
# 输出训练数据的分类结果
train_predictdata <- cbind(traindata, predictedclass = train_predict$class)
# 输出训练数据的混淆矩阵
(train_confusion <- table(actual = traindata$MN, predictedclass = train_predict$class))
# 输出测试数据的分类结果
test_predictdata <- cbind(testdata, predictedclass = test_predict$class)
# 输出测试数据的混淆矩阵
(test_confusion <- table(actual = testdata$MN, predictedclass = test_predict$class))
训练数据混淆矩阵
predictedclass
actual 0 1
0 32 185
1 18 588
测试数据混淆矩阵
predictedclass
actual 0 1
0 9 63
1 9 261
更多推荐
所有评论(0)