Bootstrap

文本向量学习笔记

文本向量其实是文本的一个数字化表达,以利于计算机理解文本,文本向量表达文本的好坏就决定了计算能否准确文本的意思。
文本向量分为词向量,文档向量,句向量。
文本向量算法学习笔记 :
词袋模型:简单的统计词频,不能表示句中的词序,也无法表达语议。
词向量模型:
上下文相似的词其语议也相似。

在这里插入图片描述
词向量直观理解学习笔记:
词义相似度高在空间上越近。

在这里插入图片描述
深度神经网络语言模型学习笔记:
神经网络求取文本向量,是在不断优化训练网络带来的结果,他把文本向量先全部拼接在一起保留词序与语议,回避了词袋模型的缺点。
在这里插入图片描述CBOW模型原理讲解学习笔记:
在这里插入图片描述
CBOW模型去除了隐藏层,虽然使参数大量减少,但是各种词的条件组合计算太多&#

;