java如何获取一个文件的编码方式呢?
下文笔者讲述java代码获取文件编码方式的方法分享,如下所示
获取文件编码方式的实现思路
获取文件的编码,我们可以使用以下方法: 借助第三方库: Apache Tika、juniversalchardet、ICU 可自动对文件进行编码方式检测例:
使用 Apache Tika 获取文件编码
Apache Tika 是一个用Java实现的开源文档检测和内容提取框架 它支持自动检测多种文件编码
Maven项目中 添加以下依赖 org.apache.tika tika-core 1.22 import org.apache.tika.detect.EncodingDetector; import org.apache.tika.detect.TxtDetector; import org.apache.tika.io.TikaInputStream; import java.io.File; import java.io.InputStream; import java.nio.charset.Charset; public class FileEncodingUtil { public static void main(String[] args) throws Exception { File file = new File("java265.txt"); // 构建一个txt类型的编码探测器 EncodingDetector encodingDetector = new TxtDetector(); // 获取文件流,方便Tika工具进行编码检测 InputStream inputStream = TikaInputStream.get(file); Charset charset = encodingDetector.detect(inputStream, null); System.out.println("文件编码:" + charset.name()); } } //上述代码 // 使用TxtDetector方式进行编码探测 // 输出结果charset.name()指文件编码
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。