java在读取文件的时候怎么去判断文件的编码:
有三种编码方式:有BOM的UTF-8、无BOM的UTF-8、GBK
在网上找了很多,都不是很准确的判断
特别是对无BOM的UTF-8和GBK的判断,有些例子要把文件读几遍,这样效率太低,不实用,有没有什么好的解决方法,请指教
java在读取文件的时候怎么去判断文件的编码:
有三种编码方式:有BOM的UTF-8、无BOM的UTF-8、GBK
在网上找了很多,都不是很准确的判断
特别是对无BOM的UTF-8和GBK的判断,有些例子要把文件读几遍,这样效率太低,不实用,有没有什么好的解决方法,请指教
2 回答939 阅读✓ 已解决
4 回答963 阅读
4 回答876 阅读
583 阅读
486 阅读
用户上传的文件确实可能出现各种编码的情况,完美的解决方法不敢保证,但可以基于统计学原理的,最大限度的提供文件编码的侦测。
我使用过这个 cpdetector 基本可以解决我的需要。
附上代码示例:
就不给你写文件的方法了,File有获取URL的方法的。
我使用的时候导入了这几个jar。
找不到的话,可以留下邮箱,可以发你。