paddleocr
文章目录
参数设定
参考:
| |
使用流程和参数说明
主要参数和流程:
- 探测 detection
- 文本方向 direction classification
- 设定语言 lang
- 识别 recognition
一般 paddleOCR 识别字符涉及到的流程是
- 探测区域 detection (即参数
det) 文本区域方向分类 direction classification (即参数
use_angle_cls)cls_model_dir: 方向分类器模型路径cls_image_shape: 预测尺度?cls_thresh预测阈值
- 选定字符的语言(即参数
lang) - 设置使用的计算硬件,是否使用 gpu (
use_gpu) - 识别字符 recognition (
rec) 设定模型版本
ocr_version- 这里说的版本是 PP-OCRv4, PP-OCRv3, …,它们其实是一套模型,负责 detection, direction classifier, recognition
- 如果识别 pdf 文件,可是设置识别哪一页 (
page_num)
- 探测区域 detection (即参数
wsl + paddle
源码笔记
代码入口: paddleocr/paddleocr.py
模型下载
下载工具:
1 2from paddleocr.ppocr.utils.network import maybe_download maybe_download(model_folder, url)- 模型下载 url:
paddleocr.paddleocr.MODEL_URLS
PPStructure 和 PaddleOCR 类的默认参数
parser_args(mMain=True)函数
FAQ
paddlepaddle + conda 修复 glibcxx 版本问题方法
参考:
修复 libstdc++ 版本过低的方法:
方法:
| |
- 这种方法只适合 conda, venv + pip 需要修改系统的 gcc 和 libstdc++.so
cuda 12.2 + gcc 12.4: 测试正常
| |
注意:如果还是报错,需要修复 LD_LIBRARY_PATH
LD_LIBRARY_PATH="/home/sawyer/miniconda3/envs/<my-conda-env>/lib:${LD_LIBRARY_PATH}"
cudnn 修复方法
| |
paddlepaddle 3.0 rc gpu + layoutparser
- 修改 layoutparser 代码
| |
文章作者
上次更新 2025-06-20 (811ee6f)