y^(x)=w0+∑l=1pwlxl+12∑f=1k((∑l=1pvl,fxl)2?∑l=1pv2l,fx2l) y ^ ( x ) = w 0 + ∑ l = 1 p w l x l + 1 2 ∑ f = 1 k ( ( ∑ l = 1 p v l , f x l ) 2 ? ∑ l = 1 p v l , f 2 x l 2 )
目标函数
一般用损失函数来量化预测评分y^ y ^ 和真实值y y 之间的误差,常用的损失函数有一下两种
lLS(y1,y2):=(y1?y2)2
lC(y1,y2):=?lnσ(y1y2) l C ( y 1 , y 2 ) := ? l n σ ( y 1 y 2 )
则优化目标函数为
OPTREG(S,λ):=argminΘ(∑(x,y)∈Sl(y^(x|Θ),y)+∑θ∈Θλθθ2) O P T R E G ( S , λ ) := a r g m i n Θ ? ( ∑ ( x , y ) ∈ S l ( y ^ ( x | Θ ) , y ) + ∑ θ ∈ Θ λ θ θ 2 )
λ?:=argminλ∈Rc+∑(x,y)∈SVl(y^(x|Θt+1),y) λ ? := a r g m i n λ ∈ R + c ? ∑ ( x , y ) ∈ S V l ( y ^ ( x | Θ t + 1 ) , y )
梯度计算
λt+1=λt+α??λl(y^(x|Θt+1),y) λ t + 1 = λ t + α ? ? λ l ( y ^ ( x | Θ t + 1 ) , y )
对于
lLS l L S
:
??λ(y^(x|Θt+1)?y)2=2(y^(x|Θt+1)?y)??λ(y^(x|Θt+1) ? ? λ ( y ^ ( x | Θ t + 1 ) ? y ) 2 = 2 ( y ^ ( x | Θ t + 1 ) ? y ) ? ? λ ( y ^ ( x | Θ t + 1 )
对于
lC l C
??λ?lnσ(y^(x|Θt+1)y)=σ(y^(x|Θt+1)y?1)y??λ(y^(x|Θt+1) ? ? λ ? l n σ ( y ^ ( x | Θ t + 1 ) y ) = σ ( y ^ ( x | Θ t + 1 ) y ? 1 ) y ? ? λ ( y ^ ( x | Θ t + 1 )
正则化系数一共有k+2 k + 2 个,
λ0(w0) λ 0 ( w 0 ) ,
λw(w1,w2,...,wp) λ w ( w 1 , w 2 , . . . , w p ) ,
λf(v?f),f=1,2,...k λ f ( v ? f ) , f = 1 , 2 , . . . k
??λ0y^(x|Θt+1)=?2αwt0 ? ? λ 0 y ^ ( x | Θ t + 1 ) = ? 2 α w 0 t
??λwy^(x|Θt+1)=?2α∑i=1pwtixi ? ? λ w y ^ ( x | Θ t + 1 ) = ? 2 α ∑ i = 1 p w i t x i
??λfy^(x|Θt+1)=?2α[∑i=1xivt+1i,f∑j=1xjvtj,f?∑j=1x2jvt+1j,fvtj,f] ? ? λ f y ^ ( x | Θ t + 1 ) = ? 2 α [ ∑ i = 1 x i v i , f t + 1 ∑ j = 1 x j v j , f t ? ∑ j = 1 x j 2 v j , f t + 1 v j , f t ]