有一个
文件要和很多
文件比较
内容,看是否相同,如果
文件大小相同,一个一个字节地比较
内容,速度很慢,可以根据
文件的
内容各自生成
MD5,然后对比
文件的
MD5值就可以快速排除不相同的
文件。
MD5值相同,极大概率就是相同的
文件,不放心的话可以再遍历字节对比一下。
文件越多,效率越明显。增加
文件时就可以存储对应的
MD5值,改动
文件时更新
MD5值。
MD5:https://blog.csdn.net/u012611878/article/details/54000607
一、md5sum作用
在网络传输、设备之间转存、复制大文件等时,可能会出现传输前后数据不一致的情况。这种情况在网络这种相对更不稳定的环境中,容易出现。那么校验文件的完整性,也是势在必行的。
md5sum命令用于生成和校验文件的md5值。它会逐位对文件的内容进行校验。是文件的内容,与文件名无关,也就是文件内容相同,其md5值相同。md5值是一个128位的二进制数据,转换成16进制则是32(128/4)位的进制值。
md5校验,有很小的概率不同的文件生成的md5可能相同。比md5更安全的校验算法还有SHA*系列
例如计算某个url的
md5值
echo -n "https://www.toutiao.com/amos_land_page/?topic_id=7056654219297685518" |
md5sum | cut -d " " -f1
7abb72ac5f9eccccc3150d65ae6ada23
echo -n : 不打印换行符。(注意: echo -n 后面的-n参数必须加上, 这样算出的字符串的md