朴素贝叶斯法(2) 之 恶意留言过滤
携程笔试的时候碰到了这个题目,当时其实没多想。贝叶斯这个路子怕也太过气了吧… 携程也真是…
回顾思路
- 计算先验概率
- 计算条件概率
- 不同类别概率估计
原始数据集

代码
加载数据集
1 | import numpy as np |
这里类别为两类,1-恶意留言;0-非恶意留言。
vocab
1 | def getVocabList(dataSet): |
先验概率与条件概率
1 | def native_bayes(vocab,postingList,classVec): |
argmax 判断
1 | def judge(testEntry): |
调用
1 | judge(testEntry = ['stupid', 'garbage']) |
输出 1,和我们预期的一样。
朴素贝叶斯法(2) 之 恶意留言过滤