小程序云函数处理图片型PDF,Tesseract.js OCR提取文字失败,报错“未提取到文字,可能是扫描件”怎么解决?

新手上路,请多包涵

目前基于小程序云函数开发,调用DeepSeek 4Pro模型,用Tesseract.js对图片型PDF做OCR文字提取,但始终返回空内容,数据库报错提示“未提取到文字,可能是扫描件”。尝试过调整图片清晰度、更换PDF样本都没用,有没有遇到过类似情况的朋友,能给点排查方向或替代方案吗?

阅读 504
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进