总结一下工作学习中的算法,如有纰漏,请大家多多指教,一起探讨共同进步!
这里首先讲解一下逻辑回归算法,并给出其在文本分类中的应用。
相关代码见我的github,地址为:https://github.com/duguiming111/Text_Classification/blob/master/lr_main.py
逻辑回归算法原理
逻辑回归(logistic regression)虽然名字是回归,但是它是统计学习中的经典分类方法,是一种判别学习模型。以二分类为例:
首先大致说一下线性回归,详细的线性回归算法见我的线性回归算法原理,线性模型是在给定的数据集上进行模型参数的训练,使得模型能够尽可能地预测实际输出标记。引用周志华老师西瓜书上的例子:
其中,变量代表样本(西瓜)的属性,常量就是训练得到的模型参数,