逻辑回归是有监督分类算法。
设带有标签的数据集
,
其中
。
我们定义条件概率函数:
,,
即:
其中:
,。
根据已知数据集我们定义极大似然函数:
。
,
对于最大化上式(属于无约束最优化),可以采用牛顿法或者梯度上升法,求最大值。
因为
,
所以
,
用牛顿法,对于处理分布式有些困难,我们用梯度上升法
即:
,
显然这一步可以通过MapReduce的原理。
逻辑回归是有监督分类算法。
设带有标签的数据集
,
其中
。
我们定义条件概率函数:
,,
即:
其中:
,。
根据已知数据集我们定义极大似然函数:
。
,
对于最大化上式(属于无约束最优化),可以采用牛顿法或者梯度上升法,求最大值。
因为
,
所以
,
用牛顿法,对于处理分布式有些困难,我们用梯度上升法
即:
,
显然这一步可以通过MapReduce的原理。