Pix2text

table_ocr 表格识别和解析

代码阅读

  1. 源码 pix2text/table_ocr.py

    • 模型下载方法:

      1
      
      download_cmd = f'huggingface-cli download --repo-type model --resume-download --local-dir-use-symlinks False breezedeus/pix2text-table-rec --local-dir {model_dir}'
      • 结构识别使用的是微软的表格识别模型 fork : breezedeus/pix2text-table-rec 基于 microsoft/table-transformer-structure-recognition-v1.1-all