- 添加了新的OCR模型
48px
- 添加了4x-UltraSharp超分辨率
- 无数bug修复和重构
- 添加了CRAFT文本检测器,使用
--detector craft
启用
- 增加了来自dmMaze的LaMa MPE图像修补模型
版本更新为beta-0.3
- 增加了来自dmMaze的英语文本渲染器
- 增加了基于CTC的OCR模型,识别速度大幅提升
- 新OCR模型增加韩语识别支持
- 增加了来自pokedexter的新文本渲染器
- 增加了来自rspreet92的人工翻译页面
- 增加了来自dmMaze的文本检测模型
- 文本区域合并算法更新,先已经实现几乎完美文本行合并
- 增加演示模式百度翻译支持
- 增加演示模式谷歌翻译支持
- 各类 bug 修复
- 网页版增加翻译器、分辨率和目标语言选项
- 文本颜色提取小腹提升
程序所有组件都大幅升级,本程序现已进入 beta 版本!
注意:该版本所有英文检测只会输出大写字母。
你需要 Python>=3.8 版本才能运行
- 检测模型升级
- OCR 模型升级,文本颜色抽取质量大幅提升
- 图像修补模型升级
- 文本渲染升级,渲染更快,并支持更高质量的文本和文本阴影渲染
- 文字掩膜补全算法小幅提升
- 各类 BUG 修复
- 默认检测分辨率为 1536
- 修复不使用 inpainting 时图片错误
- 增加手动翻译选项
- 支持倾斜文本的识别和渲染
- 文字掩膜补全算法更新为基于 CRF 算法,补全质量大幅提升
- 完善文本渲染
- 使用基于区域的文本方向检测,文本方向检测效果大幅提升
- 增加 web 服务功能
- 检测模型更新为基于 ResNet34 的 DBNet
- OCR 模型更新增加更多英语预料训练
- 图像修补模型升级到基于AOT的模型,占用更少显存
- 图像修补默认分辨率增加到 2048
- 支持多行英语单词合并
- 增加并默认使用有道翻译
- 检测模型更新为基于 ResNet101 的 DBNet
- OCR 模型更新更深
- 默认检测分辨率增加到 2048
注意这个版本除了英文检测稍微好一些,其他方面都不如之前版本
- 添加图片修补模型
- 初步版本发布