ocr学习_模型改进
1.paddleocr如何提升性能思考
目前困境:
场景分析:识别用户上传的图片中的文本
存在的问题:
1、图片倾斜导致ocr识别不准
2、图片颠倒,导致识别出来的文本,顺序错乱
3、图片尺寸太大,识别效率太慢
4、部分图片模糊,导致识别准确率率下降
ocr处理流程:
版面分析 -> 预处理-> 行列切割 -> 字符识别 -> 后处理识别矫正
1.1 初步优化
1、矫正图像
2、缩放图像
3、提高图像对比度
待续
1.2 方向优化
paddleocr的方向分类器,在这0度和180度个方向上的识别准确率比较高
待续