SVM和logistic regression的一些对比

全栈程序员-用户IM • 2021年6月15日下午7:00 • 未分类

一、SVM的常用目标函数形式

soft margin svm可表示为：

SVM和logistic regression的一些对比

其中，C表示惩罚系数；C越大，表示对margin越严格，即对不满足约束的样本数要更少；

反之，C越小，表示对margin越宽松，即可接受不满足约束的样本数越多。

例如下图所示：

SVM和logistic regression的一些对比

二、SVM和logistic regression的对比

1、对于SVM目标函数的解读

SVM的目标函数与带了L2正则的Model的目标函数很相似，并且具有相同的一些性质。

SVM和logistic regression的一些对比

2、三种常用替代损失函数对比

SVM和logistic regression的一些对比

因此，SVM目标函数中的max(1-ys,0)函数与Logistic regression的目标函数很像；如果给LR加入L2正则化，那么有：

SVM和logistic regression的一些对比

三、Probabilistic SVM的实现思路

1、鉴于SVM和加L2正则的LR model很相似出发：

（1）idea1

将soft margin的SVM进行求解，将得到的w,b参数当作LR model的w’,b’的近似解，然后使用sigmoid函数进行概率求解。

优点：直接使用了svm和LR的相似性，实际使用上，较为简单，通常表现还不错。

缺点：实际上几乎丧失了LR model推导中的maximum likelyhood等性质。

SVM和logistic regression的一些对比

（2）idea2

将soft margin的SVM进行求解，将得到的w,b参数当作LR model解的起始点，再进行LR模型的求解。

缺点：效果和单独使用LR model求解差不多，并且对于kernel svm，则无法使用LR model进行近似。

SVM和logistic regression的一些对比

2、采用融合SVM和LR各自优势的思路

（1）做法

将SVM求解出来的结果（即求解出w和b）后计算(wx+b)的值value，然后在value上加上两个自由度的操作，即放缩操作A，平移操作B；在A和B两个参数上使用logistic regression进行训练（实际上是把A和B分别当作LR model里的w和b参数来求解），这样可以比较吻合在logistic regression中的maximum likelyhood的需求。

优点：保留了svm原有的性质，包括kernel svm的性质；可以使用LR model获得概率值表示。

几何解释：用SVM 找出分类超平面的法向量，然后不改变法向量，但是在法向量之上再加上一些放缩和平移操作，使其更吻合在logistic regression中的maximum likelyhood的需求。

SVM和logistic regression的一些对比