博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习笔记(三):朴素贝叶斯
阅读量:4106 次
发布时间:2019-05-25

本文共 571 字,大约阅读时间需要 1 分钟。

当特征和类别有明显的因果关系时,看贝叶斯公式的时候我还能理解,对上号,但是当特征与类别没有明显的因果关系的时,用贝叶斯公式时经常对不上号,条件概率和后验概率傻傻分不清楚,所以特地花时间整理了一番。

1.条件概率的推导:

由上图可知:

                                                               

 

可得:

                                                                       

 

同理可得:

                                                                       

 

所以有:

                                                          

 

可得条件概率公式(贝叶斯公式)

                                                                            

 

 

2.换个容易理解的表达形式:

                                                          

 

上式中条件概率为:P(类别|特征),先验概率为P(类别),后验概率为P(特征|类别),先验概率和后验概率可有训练数据集计算得来。

 

3.这里的类别和特征都可能有多种,即特征A(,……,),类别B(,……,)。则

                                              

因为朴素贝叶斯算法是假设各个特征之间相互独立,那么

                                   

                                              

则:

                            

计算每个类别,……,的条件概率

,分类结果为条件概率最大的类别。因为计算条件概率时,分母都是一样的,所以可以不计算,直接计算分子比较结果即可。

 

编写代码实现贝叶斯算法,怎么计算不同类别对应的特征的后验概率:

#类别jpjNum += trainMatrix[i]pjDenom += sum(trainMatrix[i])pjVect = pjNum/pjDenom  #类别j每个特征对应的后验概率数组

预测的时候怎么运用通过测试数据集计算好的后验概率数组?

将测试数据的特征与特征对应的后验概率相乘。

 

解释得比较详细的博客:

转载地址:http://qtssi.baihongyu.com/

你可能感兴趣的文章
Ubuntu Could not open lock file /var/lib/dpkg/lock - open (13:Permission denied)
查看>>
collect2: ld returned 1 exit status
查看>>
C#入门
查看>>
查找最大值最小值
查看>>
杨辉三角
查看>>
冒泡排序法
查看>>
C#中ColorDialog需点两次确定才会退出的问题
查看>>
16、Memento 备忘录模式
查看>>
Java基础篇(一)
查看>>
数据库
查看>>
mysql update与group by
查看>>
nginx反代 499 502 bad gateway 和timeout
查看>>
linux虚拟机安装tar.gz版jdk步骤详解
查看>>
python猜拳游戏
查看>>
python实现100以内自然数之和,偶数之和
查看>>
python数字逆序输出及多个print输出在同一行
查看>>
python九九乘法表(详解)
查看>>
ESP8266 WIFI数传 Pixhaw折腾笔记
查看>>
苏宁产品经理面经
查看>>
百度产品经理群面
查看>>