目前基于小程序云函数开发,调用DeepSeek 4Pro模型,用Tesseract.js对图片型PDF做OCR文字提取,但始终返回空内容,数据库报错提示“未提取到文字,可能是扫描件”。尝试过调整图片清晰度、更换PDF样本都没用,有没有遇到过类似情况的朋友,能给点排查方向或替代方案吗?
目前基于小程序云函数开发,调用DeepSeek 4Pro模型,用Tesseract.js对图片型PDF做OCR文字提取,但始终返回空内容,数据库报错提示“未提取到文字,可能是扫描件”。尝试过调整图片清晰度、更换PDF样本都没用,有没有遇到过类似情况的朋友,能给点排查方向或替代方案吗?