有什么好办法可以提取图片的各个元素的坐标
比如下面的图片的分辨率是 720 × 1600
比如我想获取 「喝牛奶有效缓解暑热并促进身体健康」这几个字出现在图片中的坐标
我想到的办法就是把图片先转出 pdf,因为 pdf 是绝对坐标渲染内容的,所以再读取 pdf 中元素就能获取坐标了
截图 ——> 使用 ocrmypdf 转成文本化的 PDF ——> 使用 pdfplumber 按行读取 PDF ——> 统计坐标点
- ocrmypdf: https://github.com/ocrmypdf/OCRmyPDF
- pdfplumber: https://github.com/jsvine/pdfplumber
图片转 pdf 我选用的是 ocrmypdf,为什么选它,因为他是 github 排名第一的
但是这个 ocrmypdf 的实际效果很差劲!
使用上面的图片提取文字都是错版的
比如我想复制这几个字
复制出来是
由 RS 器 牛奶 有 效 缓解 暑热 并 促进 身体 健康感觉还不如微信和钉钉那个 OCR 呢?
而且再用 pdfplumber 读取文本的坐标也不准
x0 应该是 100+,但是它显示的确是 x0
{
"text": "由RS器牛奶有效缓解暑热并促进身体健康",
"x0": 4.9832,
"top": 106.97799,
"x1": 109.63488972813998,
"bottom": 112.97800000000001,
"chars": null,
"char": null
}有什么好用的方案可以实现「有什么好办法可以提取图片的各个元素的坐标」吗?
所谓的元素是什么意思,怎么判定为一个元素,还是说就是想提取文字的坐标?