删除重复文件的脚本代码
2014-02-25 09:51
357 查看
#!/bin/bash
#文件名:remove duplicates.sh
#用途: 查找并删除重复文件,每一个文件只保留一个样本
ls -lS | awk 'BEGIN { getline; getline; name1=$8; size=$5}
{ name2=$8;
if (size == $5)
{
"md5sum " name1 | getline; csum1=$1;
"md5sum " name2 | getline; csum2=$1;
if (csum1 == csum2)
{ print name1; print name2}
}
size=$5; name1=name2;
}' | sort -u >duplicate_files
cat duplicate_files | xars -I { } md5sum { } | sort | uniq -w 32 | awk ' { print "^"$2"$" } ' | sort -u > duplicate_sample
echo Removing..
comm dupliacte_files duplicate_sample -2 -3 | tee /dev/stderr | xargs rm
echo Removed duplicate files successfully.
#上面的黑体I不是L,而是大写的i
#文件名:remove duplicates.sh
#用途: 查找并删除重复文件,每一个文件只保留一个样本
ls -lS | awk 'BEGIN { getline; getline; name1=$8; size=$5}
{ name2=$8;
if (size == $5)
{
"md5sum " name1 | getline; csum1=$1;
"md5sum " name2 | getline; csum2=$1;
if (csum1 == csum2)
{ print name1; print name2}
}
size=$5; name1=name2;
}' | sort -u >duplicate_files
cat duplicate_files | xars -I { } md5sum { } | sort | uniq -w 32 | awk ' { print "^"$2"$" } ' | sort -u > duplicate_sample
echo Removing..
comm dupliacte_files duplicate_sample -2 -3 | tee /dev/stderr | xargs rm
echo Removed duplicate files successfully.
#上面的黑体I不是L,而是大写的i
相关文章推荐
- sed删除文件中的一行内容的脚本代码
- shell脚本实现查找文件夹下重复的文件,并提供删除功能
- shell脚本---查找并删除重复的文件
- Oracle Rman备份脚本与自动删除重复备份文件
- python删除重复文件代码
- 删除重复的脚本文件
- shell脚本实现查找文件夹下重复的文件,并提供删除功能
- linux文本排序、交集、差集,查找并删除重复文件脚本、comm命令
- 人生第一份python脚本 ---- 遍历文件夹中文件,删除特定文件中的一行代码
- 针对php脚本文件执行锁定的代码,避免脚本在同一时间重复运行
- Python中删除文件的程序代码
- Linux中删除文件中空行的脚本
- linux 下pyhton 删除指定目录下所有的重复内容的文件
- SQL 备份数据 脚本 -添加到作业 步骤里面 可删除历史天文件
- svn配置脚本 防止删除文件和空注释
- 包含了重复的“Content”项。.NET SDK 默认包含你项目目录中的“Content”项。可从项目文件中删除这些项;如果希望将其显式包含在项目文件中,可将“EnableDefaultContentItems”属性设置为“false”
- 删除两个升序正数组中重复元素的C程序实现代码
- 批量转换目录下文件编码的shell脚本代码
- git checkout----若删除文件,恢复到线上库最新代码