大家都知道如果文字出现在图片上,就无法直接复制或编辑文字内容,必须透过 OCR 光学字符识别技术进行扫描,再把结果转为纯文本格式输出,以前介绍过 Project Naptha 扩充功能让图片里的文字可以直接被复制、选取,后来也有不少支持中文的免费 OCR 工具像是 EasyScreenOCR 和 NewOCR、Free Online OCR 等等,而现在手机相机镜头也内建 OCR 效果,直接拍摄后辨识取得文字内容,非常方便。
本文要推荐的「PearOCR」是一个相当强大的免费 OCR 文字辨识工具,这项服务完全免费,而且没有任何使用次数限制,支持繁体中文、简体中文和英文内容,最大特色是 PearOCR 可在脱机状态下完成所有运算,不需要用到任何的第三方服务 API,也无需将图片上传,这也确保用户数据不会在过程中泄漏或有隐私安全疑虑。
PearOCR 使用自行开发的轻量化识别引擎,透过深度学习训练得到的模型拥有非常强大的文字识别能力,整个识别过程都在网页中完成,只要选择本机图片或是直接读取剪贴簿(在复制图片的情况下)就能进行文字辨识,将图片出现的中英文内容转换为纯文本或 PDF 格式。
前面有提到 PearOCR 可以在脱机状态使用,本身支持 PWA 标准(Progressive Web App,渐进式网页应用程序),只要之前打开过网站,即使没有联机亦可正常使用文字辨识功能,或以应用方式安装到桌面使用。
PearOCR 文字识别
网站链接:https://pearocr.com/
使用教学
开启 PearOCR 文字辨识工具,从下方的「识别语言」选择要使用的语言,可以切换为繁体中文、简体中文或英文三种。
接着直接把要辨识的图片拖曳到 PearOCR 网站,或是从下方选择「本地图片」或「读剪贴板」两项功能,前者是选择要上传辨识的图片文件,如果图片已经复制到剪贴簿,可以使用后者直接让网页读取剪贴簿内容(会跳出提示讯息需要给网站部分权限)。
浏览器会开始扫描、识别用户上传的图片文字,耗费时间不会太久,速度相当快。
OCR 识别完成后侦测到的文字部分就会显示于右侧,右侧纯文本可以直接复制使用。
点选右侧下方选项「纯文本方式显示」会将扫描后的文字部分显示为纯文本格式,当然有可能因为文字大小、字型或颜色等等原因而造成辨识错误或误植为其他文字,取用后还是需要手动校正一次以避免有错字产生。
除此之外,下方的选项还有一个「以表格方式显示」也很有趣,会显示在图片上识别出的本文和置信度,也方便取出某段文字,而这个数值可以透过右下角「设定」选项进行调整。
点选右下角的 PearOCR 设定功能,可以设定「置信度阀值」或是文字背景色、文字颜色等参数,设定后保存、点选「重新识别所有图片」有助于得出更正确的结果,如果扫描出来的结果差异非常多可以试着调整这些参数再重试看看。
PearOCR 有个很有用的功能就是右下角的「在文本底下显示图片」,可以在辨识结果下方重叠原有图片,让用户在取用文字内容时马上知道在那个位置。
除了直接复制 OCR 识别出来的纯文本内容,也能点选「导出所有图像到 PDF」,将识别的文字转为 PDF 格式,预设情况下会将辨识的文字内容和图片一起导出,而且可以让原图附在下一页,方便让浏览者检视对照,直接复制纯文本。
值得一试的三个理由:
PearOCR 是免费文字识别工具,提供没有次数限制的文字辨识功能
支持繁体中文、简体中文和英文三种语言
可在脱机状态下完成运算,不需使用第三方 API 或上传图片
作者: PSERIC