Bootstrap

昇思25天学习打卡营第二十四天|RNN实现情感分类

       情感分类是自然语言处理中的经典任务,是典型的分类问题。本节使用MindSpore实现一个基于RNN网络的情感分类模型。

       本节使用情感分类的经典数据集IMDB影评数据集,数据集包含Positive和Negative两类。为了方便数据集合和预训练词向量的下载,首先设计数据下载模块,实现可视化下载流程,并保存至指定路径。数据下载模块使用requests库进行http请求,并进行tqdm库对下载百分比进行可视化。此外针对下载安全性,使用IO的方式下载临时文件,而后保存至指定的路径被返回。

11a9bfc70b6445c596924a944eae58cc.jpg

eb365b06288042b5966008ff4eacc1b2.png 

ea0cbfb560e74f01b182e4b3af2465da.png 

        下载好的IMDB数据集为tar.gz文件,我们使用Python的tarfile库对其进行读取,并将所有数据和标签分别进行存放。

9eea85c24736421fafa9705b3f0818e0.jpg

4f33e2ce9a9b4e32b9698e56f89edce1.jpg 

f919bfb13a9348289bbb996aad976841.png 

869c5c30b33244b5b5dff0fee32e36ab.png 

a193084d88934fe09b76876b9941a2e6.png 

008a6b8f2a9346fc9f42b2688f06a020.jpg 

47272532afdf47cea2a6a542f6a60147.jpg 

1335a9a0e403420dab3e1d1a406b4fa6.jpg 

933a6fe51e3e4d708fd21470a9c2fc36.png 

636bc6a369604f96a150d4e6a54fa249.jpg 

 

;