Bootstrap

实验6语义计算

实验6语义计算

一、目的及要求:

  1. 掌握文本分类、聚类等语义计算的基本原理;
  2. 掌握常用语义计算NLP工具包的使用;

二、实验准备:

测试语料

三、实验内容及过程:

1)文本分类实验

使用任意方法或NLP工具,编写文本分类程序。

要求:

  • 至少包含3个分类。
  • 至少给出10个测试用例,用于测试分类算法,并计算分类准确度。

本次三个分类分别为positive,negative和neutral,我们首先预设置了三种情感色彩的句子各30句以txt格式保存作为预训练数据集,其中情感色彩与句子用空格分离,方便提取标签以及内容。

 

在实验中,我们采用了特征提取和拟合的方式来训练模型,下面是代码展示:

 

这次实验的分词我们使用jieba分词,之后定义了一个类来实现:

初始化定义特征提取以及模型,首先现训练,run_classify这个方法用于输出标签以及语句,下面是测试main函数

我们定义了每种语句各4句用于输出结果,下是运行结果:

 

 

可以看出,当句子含义较为明确时,上述的简单分类器有很好的效果。

相关资源:

https://download.csdn.net/download/dxxmsl/87761748

;