Releases: breezedeus/CnOCR
Releases · breezedeus/CnOCR
Fix links of the docs
Update 2024.06.22:发布 V2.3.0.3
主要变更:
- 修复文档中 broken 的链接。
更改默认下载模型地址
主要变更:
- CN OSS 不可用了,默认下载模型地址由
CN
改为HF
。
bugfix: onnx providers for ppocr
Merge pull request #304 from breezedeus/dev fix: onnx providers for ppocr
New Models with Better accuracy
2023.12.24:发布 V2.3
主要变更:
- 重新训练了所有的模型,比上一版精度更高。
- 模型按使用场景分为 3 大类场景:
scene
:场景图片,适合识别一般拍照图片中的文字。doc
:文档图片,适合识别规则文档的截图图片,如书籍扫描件等。general
: 通用场景,适合图片无明显倾向的一般图片。
注意
⚠️ :以上说明仅供参考,具体选择模型时建议以实际效果为准。 - 加入了两个更大的系列模型:
*-densenet_lite_246-gru_base
:优先供 知识星球 CnOCR/CnSTD私享群 会员使用,一个月后会免费开源。*-densenet_lite_666-gru_large
:Pro 模型,购买后可使用。
use environment variable to determine the download source for models
add number-densenet_lite_666-gru_large
Merge pull request #283 from breezedeus/dev add number-densenet_lite_666-gru_large
一大波改动,如 加入了纯数字识别系列模型 `number-*`
主要变更:
- 加入了纯数字识别系列模型
number-*
(见 识别模型列表),可用于纯数字识别场景,如银行卡识别、身份证识别、硬币年份识别等; - 对各个包的新版做了接口适配,如
pytorch_lightning
、onnxruntime
、pillow
等; - 优化了训练过程使用的数据增强方式,并借鉴了Nougat 中的数据增强方法;
- 增加了对更大模型的支持,如
densenet-lite-666
、gru_large
等; - 以前的
*-gru
系列模型,现在也有 ONNX 版了; - 修复了一堆的bugs,如
val-complete_match-epoch
训练过程一直为0
等。
fix: export_to_onnx
Merge pull request #273 from breezedeus/dev fix: export_to_onnx
use hf_hub_download to download model files from huggingface
Merge pull request #261 from breezedeus/dev fix: model download from huggingface
support torch>=2.0
Merge pull request #241 from breezedeus/dev support torch>=2.0