如何清洗 Git Repo 代码仓库
2015-07-22 00:00
375 查看
相信不少团队的代码仓库 Git Repo 变得越来越大。除了代码的提交外,时常有人会把二进制文件比如 Jar 包或者不小心把不该提交到代码库的文件提交到代码库中,比如用户名密码之类的保密信息。如何清洗代码仓库 Git Repo,彻底从历史中删除此类文件呢?
处理速度慢,尝试清理 2G 大小的代码库,用了一晚上还没跑完。
只能按文件名清理,如果不同的路径有同样的文件名就无法处理了,可能误删文件或者忽略某些文件。
当然有个非常好的解决方案完美解决了这个问题。如下:
手动清理
如果你们的代码仓库问题比较少,只有几个不该提交的文件,可以参考 Atlassian 的一篇关于维护 Git Repo 的文章。大致过程如下:
首先进行 Git 垃圾回收:其次查看 Git 仓库占用空间:git gc --auto
然后找出历史中超过一定大小的文件,最后在历史中删除并且提交。如果感兴趣手动处理这个过程可以参照文章后边的链接。$ du -hs .git/objects45M .git/objects
相关的几个命令:
清理历史中的文件:强制提交覆盖:git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch ****/nohup.out' --prune-empty --tag-name-filter cat -- --allgit filter-branch --index-filter 'git rm --cached --ignore-unmatch ****/nohup.out' HEADgit for-each-ref --format="%(refname)" refs/original/ | xargs -n 1 git update-ref -d
但是这个方案有 2 个问题:git reflog expire --expire=now --allgit gc --prune=nowgit push --all --forcegit push --all --tags --force
处理速度慢,尝试清理 2G 大小的代码库,用了一晚上还没跑完。
只能按文件名清理,如果不同的路径有同样的文件名就无法处理了,可能误删文件或者忽略某些文件。
当然有个非常好的解决方案完美解决了这个问题。如下:
自动清理
答案就是 bfg-repo-cleaner,这是一个 Java 写的清理工具,多线程处理清理过程,命令很简单,只需要几分钟就清理了之前 一晚上都跑不完的任务:java -jar bfg-1.11.7.jar --delete-files *.zip myrepo.gitjava -jar bfg-1.11.7.jar --delete-files *.log myrepo.gitjava -jar bfg-1.11.7.jar --delete-files *.out myrepo.gitjava -jar bfg-1.11.7.jar --strip-blobs-bigger-than 1M myrepo.git
附上几个常用的但又不常见的 git 小技巧:
复制代码仓库:Git 后悔药,覆盖最后一次修改:git clone --bare /var/www/html/myrepo.git
Git 放弃本地修改:git add .git commit --amendgit push origin master -f
Git 销毁最后一次提交:git checkout .
打包时候嵌入版本号:git reset --hard HEAD^git push -f origin HEAD^:master
git rev-parse HEAD > version.txt
相关文章推荐
- 在Python的Django框架中编写错误提示页面
- 在Django中同时使用多个配置文件的方法
- 使用FastCGI部署Python的Django应用的教程
- 在主机商的共享服务器上部署Django站点的方法
- 在Python的Django框架中生成CSV文件的方法
- 利用Python的Django框架生成PDF文件的教程
- 在Django中使用Sitemap的方法讲解
- 详解Python的Django框架中的Cookie相关处理
- .NET Visual Studio 代码性能分析工具
- ASP.NET中图片显示方法实例
- ASP.NET仿新浪微博下拉加载更多数据瀑布流效果
- 使用PHP编写发红包程序
- 使用PHP生成二维码的方法汇总
- PHP使用array_merge重新排列数组下标的方法
- PHP正则匹配手机号(2015最新号段)
- Spring 3.1配置文件
- 集群环境下的Spring Quartz
- myeclipse中记载mysql驱动器注意的问题
- Spring3.1 mvc + junit4
- Java下数字类型的转换