Umi-OCR 文字识别工具v2.1.4 正式版

Umi-OCR 文字识别工具v2.1.4 正式版插图

软件介绍

Umi-OCR图片转文字是一款批量对本地图片文件进行离线OCR文字识别工具。

软件特点

支持生成内联图片的Markdown文件

支持 win10 x64

能批量识别普通图片,支持忽略指定区域功能

输出到软件面板或本地txt文件/md文件

无需联网

可用于批量识别视频截图时排除右上角水印的干扰,批量识别游戏截图时排除UI与按钮的干扰,让识别结果只留下所需的文本

注意事项

软件是本地图片文件处理工具,没有实时屏幕截图识别的功能

不建议使用 win7 ,核心c++模块PaddleOCR-json基本无法运行

如果想尝试,win7 x64 sp1 打满系统升级补丁+安装vc运行库后有小概率能跑起来

打开忽略区域设置窗口,拖入任一张截图,会显示出图片,识别到的文字区域会被虚线框起来。右上角的水印也会被识别到,点击选择 +忽略区域 1 ,鼠标按住,绘制矩形完全包裹住水印区域,范围可以大一些,点击 完成 。返回主窗口, 开始任务即可。

Umi-OCR 文字识别工具v2.1.4 正式版插图1

软件特点

免费:本项目所有代码开源,完全免费。

方便:解压即用,离线运行,无需网络。

批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。

高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。

精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

更新日志

V2.1.2主要更新

新增:批量任务(图片、文档)支持 暂停任务 。只要不退出软件,在待机/休眠后可以恢复任务。

新增:文档任务支持保存为 单层纯文本PDF 。

新增:HTTP OCR接口 允许设置 忽略区域 参数。

新增:HTTP 二维码接口 允许设置 图像预处理 参数。

新增:命令行--screenshot允许 指定屏幕范围 ,自动进行截图。

修复:文档内容提取和写入时的坐标旋转、比例适配问题。

优化:批量文档标签页,拖入大量文件、提交大批任务时的性能和流畅度。

优化:文档任务保存的文件名规则。

UI:优化一些布局,调整一些文本,美化一些视觉效果。

GitHub:https://github.com/hiroi-sora/Umi-OCR/releases/latest
下载地址
123盘
密码:无
百度云盘
密码:无
阿里云盘
密码:无
夸克
密码:无
THE END