Bootstrap

利用工具Spacy批量对文本进行分句——踩坑

先说坑:

Spacy不能处理空的文本,会报错:

435         DOCS: https://spacy.io/api/language#call
    436         """
--> 437         if len(text) > self.max_length:
    438             raise ValueError(
    439                 Errors.E088.format(length=len(text), max_length=self.max_length)

所以这个时候把空的文本删掉就好了,,,,这么简单一个问题,,,,困扰了我好久。。。。。

然后,就for循环即可。 

;