Bootstrap

逻辑回归算法及其在文本分类中的应用

总结一下工作学习中的算法,如有纰漏,请大家多多指教,一起探讨共同进步!

这里首先讲解一下逻辑回归算法,并给出其在文本分类中的应用。

相关代码见我的github,地址为:https://github.com/duguiming111/Text_Classification/blob/master/lr_main.py


逻辑回归算法原理 

逻辑回归(logistic regression)虽然名字是回归,但是它是统计学习中的经典分类方法,是一种判别学习模型。以二分类为例:

首先大致说一下线性回归,详细的线性回归算法见我的线性回归算法原理,线性模型是在给定的数据集上进行模型参数的训练,使得模型能够尽可能地预测实际输出标记。引用周志华老师西瓜书上的例子:

                                                                f_{good}(x)=0.2\cdot x_{colour}+0.5\cdot x_{root}+0.3\cdot x_{sound}+1

其中,变量代表样本(西瓜)的属性,常量就是训练得到的模型参数,

;