Bootstrap

基于新闻数据的情感分析与用户推荐系统的设计与实现(文献综述)

文献综述
–基于新闻数据的情感分析与用户推荐系统的设计与实现
1 前 言
随着信息技术的迅速发展,人们在互联网上获取新闻信息的方式发生了颠覆性的变化。新闻网站的迅猛发展和用户个性化需求的不断增长使得如何更有效地从海量新闻中获取感兴趣内容成为一个迫切需要解决的问题。本研究旨在设计与实现一套基于新闻数据的情感分析与用户推荐系统,以提升用户体验、提供个性化的新闻推荐服务。
情感分析一直以来都是自然语言处理领域中一个十分重要的任务。文本情感分析基本上就是从文本中挖掘情感倾向,对文本按情感倾向进行分类,一般而言,主要有三种情感极性:积极情感、中性情感和消极情感。文本情感分析目前多用于自然语言处理、文本挖掘、信息提取等多个领域。如今对于文本情感分析的研究,可以从处理文本粒度、情感分类粒度和实现方法三个方面来分类。首先根 据输入文本的不同粒度,可以分为篇章级、语句级以及方面级。其中句子级别和篇章级别的文本在根本上没有什么区别,文章就是由许多句子组成的。
其次根据情感分析的分类粒度,可以分为主观情感倾向分析、主客观情感分析、以及细粒度 情感分析。最后从情感分析技术的主流研究方法来看,可以分为基于规则的情感分析方法、基于机器学习算法的情感分析方法以及基于深度学习的情感分析方法。基于情感词典和机器学习的方法其词典和特征的构造选择都较为复杂,且分类性能有限,往往无法考虑到充分的语义信息。深度学习的出现在很大程度上解决了这些问题,在实现自动提取特征的同时,也大大提高了文本情感分类模型的精度。
2017 年 Vaswani 等人首次提出了 Transformer 模型,该模型完全基于注意力机制,解决了长期以来 CNN 网络无法获取全局的结构信息与 RNN 网络无法并行计算的问题。模型 中使用的自注意力机制(Self-Attention)可以充分考虑到每个词在全局的作用。 2018 年,以多层双向 LSTM 的 ELMo 模型[66]带来了一

;