博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
拉普拉斯平滑处理 Laplace Smoothing
阅读量:4286 次
发布时间:2019-05-27

本文共 522 字,大约阅读时间需要 1 分钟。

背景:为什么要做平滑处理?

  零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(训练集)中没有出现过,会导致整个实例的概率结果是0。在文本分类的问题中,当一个词语没有在训练样本中出现,该词语调概率为0,使用连乘计算文本出现概率时也为0。这是不合理的,不能因为一个事件没有观察到就武断的认为该事件的概率是0。

拉普拉斯的理论支撑

  为了解决零概率的问题,法国数学家拉普拉斯最早提出用加1的方法估计没有出现过的现象的概率,所以加法平滑也叫做拉普拉斯平滑。

  假定训练样本很大时,每个分量x的计数加1造成的估计概率变化可以忽略不计,但可以方便有效的避免零概率问题。

应用举例

  假设在文本分类中,有3个类,C1、C2、C3,在指定的训练样本中,某个词语K1,在各个类中观测计数分别为0,990,10,K1的概率为0,0.99,0.01,对这三个量使用拉普拉斯平滑的计算方法如下:

  1/1003 = 0.001,991/1003=0.988,11/1003=0.011

  在实际的使用中也经常使用加 lambda(1≥lambda≥0)来代替简单加1。如果对N个计数都加上lambda,这时分母也要记得加上N*lambda。

转载地址:http://ulxgi.baihongyu.com/

你可能感兴趣的文章
Java面向对象特征有那些
查看>>
hibernate单表继承映射
查看>>
继承结构中每个子类单独一张表
查看>>
HQL查询-分页-条件-连接-过滤使用
查看>>
hibernate加载策略之lazy
查看>>
hibernate抓取策略fetch
查看>>
Hibernate的N+1条SQL查询问题-------Iterate
查看>>
hibernate 缓存机制
查看>>
悲观锁
查看>>
Spring官网下载的步骤
查看>>
Spring入门之-------搭建步骤
查看>>
Spring源码和jar包下载步骤
查看>>
Spring依赖注入(dependency injection)
查看>>
一位资深程序员大牛给予Java初学者的学习路线建议
查看>>
spring中bean的自动装配和作用域
查看>>
java中关于“==”和“equals()”方法的区别
查看>>
Could not create the view: An unexpected exception was thrown.
查看>>
mybatis入门之Helloworld
查看>>
使用http请求,中文乱码问题--解决方法
查看>>
mybatis入门之接口式编程
查看>>