对于句法复杂度这个指标,可能很多人都想去提取,这里有一个分析器叫做L2SCA可以用于Python,但它不是Python的包,网上相关资源又特别少,所以可能苦于寻找。
这里是在下在某篇论文下标处找到的下载网址:http://personal.psu.edu/xxl13/downloads/ 可以到这里去下载,我是在Ubuntu的系统上运用的
这个上面还包含了D-level(句法发展水平分析器),但是测试了一下发现这个分析器好像没有作用,感兴趣的也可以去试一下
下载好了之后提取到自己想存放的某个地方,然后进入文件夹,可以看到有很多文件,打开readme里面有非常详细的教程,当然如果有点小懒不想看readme的话也可以,看这里就好啦
对单个文件标注:
python analyzeText.py samples/sample1.txt samples/sample1_testing.txt 前面的是文本文件,后面的是存放的文件。
对一个文件夹的文件进行标注:
python analyzeFolder.py samples/ samples/samples_testing.txt 前面是文本文件夹,后面是存放的文件&