这两天学习了一个相对比较简单但是十分实用的分类算法——贝叶斯分类算法,与我做项目使用的svm算法相比确实有很多精妙之处,。好比撒尿牛丸——好吃又好玩,而贝叶斯分类器则是简单又强大。
本文结合简单天气预报进行讲解。
贝叶斯定理:
贝叶斯定理是概率论里面一个计算条件概率的法器!为什么是法器,且看后文。先摆出计算公式:
如果用H表示湿度,并且湿度分为1、2、3级分别表示为h1、h2、h3; 而云层密度用G表示,也分为1、2、3级,分别用g1、g2、g3表示;另外,天气W表示,分为1、2两级,晴天和雨天分别表示为w1、w2 。
那么,通过以往的数据我们可以统计
出现晴天或者雨天结果时(条件)
h和g出现
的概率,即:P( H | W)、和 P( G | W ) ,其中H、G、W在之前提到的分级值范围内取值, 如果空气湿度H和云层密度G 相对独立,那么天气预报转换为求:
P
=P(W |G,H )
=P(W|G)
xP(W|H)
利用之前的公式转化为:
这两天学习了一个相对比较简单但是十分实用的分类算法——贝叶斯分类算法,与我做项目使用的svm算法相比确实有很多精妙之处,。好比撒尿牛丸——好吃又好玩,而贝叶斯分类器则是简单又强大。本文结合简单天气预报进行讲解。贝叶斯定理:贝叶斯定理是概率论里面一个计算条件概率的法器!为什么是法器,且看后文。先摆出计算公式:也许乍一看这公式没什么,但是我们先将公式移项得:P(A|B)P(B)=P
基于概率论的
分类
方法:
朴素
贝
叶斯
1. 概述
贝
叶斯
分类
是一类
分类
算法
的总称,这类
算法
均以
贝
叶斯
定理为基础,故统称为
贝
叶斯
分类
。本章首先介绍
贝
叶斯
分类
算法
的基础——
贝
叶斯
定理。最后,我们通过实例来讨论
贝
叶斯
分类
的中最
简单
的一种:
朴素
贝
叶斯
分类
。
2.
贝
叶斯
理论 & 条件概率
2.1
贝
叶斯
理论
我们现在有一个数据集,它由两类数据组成,数据分布如下图所示:
我们现在用 p1(x,y) 表示数据点 (x,y) 属于类别 1(图中用圆点表示的类别)的概率,用 p2(x,y) 表示数据点 (x,y) 属于类别 2(图中三角形表示的类别)的概率,那么对于一个新数据点
#导入数据
df_ferrara = pd.read_csv('WeatherData/ferrara_270615.csv')
df_milano = pd.read_csv('WeatherData/milano_270615.csv')
df_mant...
过去的7天当中,有3天下雨,4天没有下雨。用0代表灭有下雨,而1代表下雨,我们可以用一个数组来表示:
y=[0,1,1,0,1,0,0]
而在这7天当中,还有另外一些信息,包括刮北风,闷热,多云,以及
天气
预报
给出的信息,如下表:
对于一维数组或者列表,unique函数去除其中重复的元素,并按元素由大到小返回一个新的无重复元素的元组或者列表。
先上问题吧,我们统计了14天的气象数据(指标包括outlook,temperature,humidity,windy),并已知这些
天气
是否打球(play)。如果给出新一天的气象指标数据:sunny,cool,high,TRUE,判断一下会不会去打球。
table 1
outlook
temperature
humidity
windy
sunny
ho...
朴素
贝
叶斯
是一种基于
贝
叶斯
定理的
分类
方法。该
算法
是有监督的学习
算法
,解决
分类
问题。在该
算法
中,我们假设给定目标值时,属性之间相互条件独立,即
。
贝
叶斯
定理:对于
分类
问题,样本x属于类别y的概率
其中, P(y)是指未使用数据训练
分类
器之前的y的初始概率,称为先验概率; P(x|y)是样本x相对于类别y的类条件概率,称为似然; P(y|x)是给定x时,y成立的概率,称为后验概率;P(x)是归一