一、贝叶斯分类器的训练过程以及判断过程都是一系列概率的乘积,这种方法主要关注的是做出决策的平均错误率,这对大多数的应用来说是合理的。但在一些特殊的应用中,不同类型的决策错误所要付出的代价和风险是不同的。癌症患者漏诊为正常代价很大,可能延误有效的治疗; 正常人误诊为癌症患者代价较小,通过后续检查可以排除。解决方法就是事先给每一类分一个系数来调整结果。
二、理解贝叶斯公式以及贝叶斯分类器
https://zhuanlan.zhihu.com/p/26262151
三、最大似然估计与最小二乘法是等价的:大致步骤是:最大后验估计等于最大似然等于忽略分母等于分子取对数两项无关省略后合并同类项得到2范数,本质上就是最小二乘。
https://www.bilibili.com/video/BV1aE411o7qd?p=10
四、拉普拉斯修正可避免其他属性携带的信息被训练集中未出现的属性值“抹去”
五、这个百度文库讲的也很清晰,但电脑上不能看完全,手机上可以
https://wenku.baidu.com/view/4b6491ae842458fb770bf78a6529647d262834c1?ivk_sa=1023194jhttps://wk.baidu.com/view/4b6491ae842458fb770bf78a6529647d262834c1?ivk_sa=1023194j