Java计算文件的hash值
2017-12-21 14:04
316 查看
如何知道一个文件是否改变了呢?当然是用比较文件hash值的方法,文件hash又叫文件签名,文件中哪怕一个bit位被改变了,文件hash就会不同。
比较常用的文件hash算法有MD5和SHA-1。
我用的是MD5算法,java中,计算MD5可以用MessageDigest这个类。
下面提供两个工具类(任选其一即可)
第一个工具类:
代码如下:
运行结果如下图:
第二个工具类:
结果一定为32位的,具体可看代码,代码如下:
运行结果如下图:
两个工具类的对比:
测试代码如下:
结论:
对比用时,建议使用第二个工具类!
番外篇:
其实还有一个重点,就是如何知道自己生成的MD5值是否正确呢?
方法很多,其实有一个挺简单的方法,不需要另外安装什么软件。
使用windows自带的命令即可:certutil -hashfile [文件路径] MD5,
例子如下:
比较常用的文件hash算法有MD5和SHA-1。
我用的是MD5算法,java中,计算MD5可以用MessageDigest这个类。
下面提供两个工具类(任选其一即可)
第一个工具类:
代码如下:
package com.test; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.InputStream; import java.math.BigInteger; import java.security.MessageDigest; public class MD5Util { public static void main(String[] args) { try { //此处我测试的是我本机jdk源码文件的MD5值 String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip"; String md5Hashcode = md5HashCode(filePath); String md5Hashcode32 = md5HashCode32(filePath); System.out.println(md5Hashcode + ":文件的md5值"); System.out.println(md5Hashcode32+":文件32位的md5值"); //System.out.println(-100 & 0xff); } catch (FileNotFoundException e) { e.printStackTrace(); } } /** * 获取文件的md5值 ,有可能不是32位 * @param filePath 文件路径 * @return * @throws FileNotFoundException */ public static String md5HashCode(String filePath) throws FileNotFoundException{ FileInputStream fis = new FileInputStream(filePath); return md5HashCode(fis); } /** * 保证文件的MD5值为32位 * @param filePath 文件路径 * @return * @throws FileNotFoundException */ public static String md5HashCode32(String filePath) throws FileNotFoundException{ FileInputStream fis = new FileInputStream(filePath); return md5HashCode32(fis); } /** * java获取文件的md5值 * @param fis 输入流 * @return */ public static String md5HashCode(InputStream fis) { 4000 try { //拿到一个MD5转换器,如果想使用SHA-1或SHA-256,则传入SHA-1,SHA-256 MessageDigest md = MessageDigest.getInstance("MD5"); //分多次将一个文件读入,对于大型文件而言,比较推荐这种方式,占用内存比较少。 byte[] buffer = new byte[1024]; int length = -1; while ((length = fis.read(buffer, 0, 1024)) != -1) { md.update(buffer, 0, length); } fis.close(); //转换并返回包含16个元素字节数组,返回数值范围为-128到127 byte[] md5Bytes = md.digest(); BigInteger bigInt = new BigInteger(1, md5Bytes);//1代表绝对值 return bigInt.toString(16);//转换为16进制 } catch (Exception e) { e.printStackTrace(); return ""; } } /** * java计算文件32位md5值 * @param fis 输入流 * @return */ public static String md5HashCode32(InputStream fis) { try { //拿到一个MD5转换器,如果想使用SHA-1或SHA-256,则传入SHA-1,SHA-256 MessageDigest md = MessageDigest.getInstance("MD5"); //分多次将一个文件读入,对于大型文件而言,比较推荐这种方式,占用内存比较少。 byte[] buffer = new byte[1024]; int length = -1; while ((length = fis.read(buffer, 0, 1024)) != -1) { md.update(buffer, 0, length); } fis.close(); //转换并返回包含16个元素字节数组,返回数值范围为-128到127 byte[] md5Bytes = md.digest(); StringBuffer hexValue = new StringBuffer(); for (int i = 0; i < md5Bytes.length; i++) { int val = ((int) md5Bytes[i]) & 0xff;//解释参见最下方 if (val < 16) { /** * 如果小于16,那么val值的16进制形式必然为一位, * 因为十进制0,1...9,10,11,12,13,14,15 对应的 16进制为 0,1...9,a,b,c,d,e,f; * 此处高位补0。 */ hexValue.append("0"); } //这里借助了Integer类的方法实现16进制的转换 hexValue.append(Integer.toHexString(val)); } return hexValue.toString(); } catch (Exception e) { e.printStackTrace(); return ""; } } /** * 方法md5HashCode32 中 ((int) md5Bytes[i]) & 0xff 操作的解释: * 在Java语言中涉及到字节byte数组数据的一些操作时,经常看到 byte[i] & 0xff这样的操作,这里就记录总结一下这里包含的意义: * 1、0xff是16进制(十进制是255),它默认为整形,二进制位为32位,最低八位是“1111 1111”,其余24位都是0。 * 2、&运算: 如果2个bit都是1,则得1,否则得0; * 3、byte[i] & 0xff:首先,这个操作一般都是在将byte数据转成int或者其他整形数据的过程中;使用了这个操作,最终的整形数据只有低8位有数据,其他位数都为0。 * 4、这个操作得出的整形数据都是大于等于0并且小于等于255的 */ }
运行结果如下图:
第二个工具类:
结果一定为32位的,具体可看代码,代码如下:
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.nio.ByteBuffer; import java.nio.channels.FileChannel; import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; import java.util.Arrays; /** * Md5校验工具类 */ public class MD5Util2 { private static final char[] hexDigits = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f'}; public static void main(String[] args) { //此处我测试的是我本机jdk源码文件的MD5值 String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip"; String md5Hashcode2 = MD5Util2.getFileMD5(new File(filePath)); System.out.println("MD5Util2计算文件md5值为:" + md5Hashcode2); System.out.println("MD5Util2计算文件md5值的长度为:" + md5Hashcode2.length()); } /** * Get MD5 of a file (lower case) * @return empty string if I/O error when get MD5 */ public static String getFileMD5( File file) { FileInputStream in = null; try { in = new FileInputStream(file); FileChannel ch = in.getChannel(); return MD5(ch.map(FileChannel.MapMode.READ_ONLY, 0, file.length())); } catch (FileNotFoundException e) { return ""; } catch (IOException e) { return ""; } finally { if (in != null) { try { in.close(); } catch (IOException e) { // 关闭流产生的错误一般都可以忽略 } } } } /** * MD5校验字符串 * @param s String to be MD5 * @return 'null' if cannot get MessageDigest */ private static String getStringMD5( String s) { MessageDigest mdInst; try { // 获得MD5摘要算法的 MessageDigest 对象 mdInst = MessageDigest.getInstance("MD5"); } catch (NoSuchAlgorithmException e) { e.printStackTrace(); return ""; } byte[] btInput = s.getBytes(); // 使用指定的字节更新摘要 mdInst.update(btInput); // 获得密文 byte[] md = mdInst.digest(); // 把密文转换成十六进制的字符串形式 int length = md.length; char str[] = new char[length * 2]; int k = 0; for (byte b : md) { str[k++] = hexDigits[b >>> 4 & 0xf]; str[k++] = hexDigits[b & 0xf]; } return new String(str); } @SuppressWarnings("unused") private static String getSubStr( String str, int subNu, char replace) { int length = str.length(); if (length > subNu) { str = str.substring(length - subNu, length); } else if (length < subNu) { // NOTE: padding字符填充在字符串的右侧,和服务器的算法是一致的 str += createPaddingString(subNu - length, replace); } return str; } private static String createPaddingString(int n, char pad) { if (n <= 0) { return ""; } char[] paddingArray = new char ; Arrays.fill(paddingArray, pad); return new String(paddingArray); } /** * 计算MD5校验 * @param buffer * @return 空串,如果无法获得 MessageDigest实例 */ private static String MD5(ByteBuffer buffer) { String s = ""; try { MessageDigest md = MessageDigest.getInstance("MD5"); md.update(buffer); byte tmp[] = md.digest(); // MD5 的计算结果是一个 128 位的长整数, // 用字节表示就是 16 个字节 char str[] = new char[16 * 2]; // 每个字节用 16 进制表示的话,使用两个字符, // 所以表示成 16 进制需要 32 个字符 int k = 0; // 表示转换结果中对应的字符位置 for (int i = 0; i < 16; i++) { // 从第一个字节开始,对 MD5 的每一个字节 // 转换成 16 进制字符的转换 byte byte0 = tmp[i]; // 取第 i 个字节 str[k++] = hexDigits[byte0 >>> 4 & 0xf]; // 取字节中高 4 位的数字转换, >>>, // 逻辑右移,将符号位一起右移 str[k++] = hexDigits[byte0 & 0xf]; // 取字节中低 4 位的数字转换 } s = new String(str); // 换后的结果转换为字符串 } catch (NoSuchAlgorithmException e) { e.printStackTrace(); } return s; } }
运行结果如下图:
两个工具类的对比:
测试代码如下:
package com.test; import java.io.File; import java.io.FileNotFoundException; public class test { public static void main(String[] args) { try { //此处我测试的是我本机jdk源码文件的MD5值 String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip"; long start = System.currentTimeMillis(); String md5Hashcode = MD5Util.md5HashCode(filePath); long end = System.currentTimeMillis(); String md5Hashcode2 = MD5Util2.getFileMD5(new File(filePath)); long end1 = System.currentTimeMillis(); System.out.println("MD5Util 计算文件md5值为:" + md5Hashcode + " --useTime:"+(end-start)); System.out.println("MD5Util2计算文件md5值为:" + md5Hashcode2 + " --useTime:"+(end1-end)); } catch (FileNotFoundException e) { e.printStackTrace(); } } }运行结果如下图:
结论:
对比用时,建议使用第二个工具类!
番外篇:
其实还有一个重点,就是如何知道自己生成的MD5值是否正确呢?
方法很多,其实有一个挺简单的方法,不需要另外安装什么软件。
使用windows自带的命令即可:certutil -hashfile [文件路径] MD5,
例子如下:
相关文章推荐
- JAVA-读取文件部分内容计算HASH值
- java计算目录及文件个数,文件夹大小
- java 计算文件目录下文件总大小的几种多线程并发实现
- java 计算文件目录下文件总大小的几种多线程并发实现
- JAVA计算文件的crc32校验码
- java 数据与文本文件存储读取,文件大小计算。
- java快速计算文本文件行数
- Java--计算文件md5值
- Java解析魔兽争霸3录像W3G文件(五):Action和APM计算
- java计算过G文件md5 值计算
- JAVA计算文件的MD5及SHA1等值
- java使用计算md5校验码方式比较两个文件是否相同
- JAVA计算文件的MD5值
- Android/java 计算大文件的SHA1值
- 计算一个目录下的所有.java文件的行数
- java--计算文件或目录大小
- js跟java计算文件MD5不一致问题
- Java 利用Linux Openssl 库计算文件校验码
- 通过/proc/stat文件信息,java实现计算cpu使用率
- JAVA练习(计算指定目录下有多少子目录及文件)