您的位置:首页 > 编程语言

如何清洗 Git Repo 代码仓库

2016-12-22 16:48 260 查看

git prune

如何清洗 Git Repo 代码仓库

在腾讯云上创建您的SQL Cluster>>> »


相信不少团队的代码仓库 Git Repo 变得越来越大。除了代码的提交外,时常有人会把二进制文件比如 Jar 包或者不小心把不改提交到代码库的文件提交到代码库中,比如用户名密码之类的保密信息。如何清洗代码仓库 Git Repo,彻底从历史中删除此类文件呢?

手动清理

如果你们的代码仓库问题比较少,只有几个不该提交的文件,可以参考 Atlassian 的一篇关于维护 Git Repo 的文章(见文章最后的链接)。

大致过程如下:

首先进行 Git 垃圾回收:

?
其次查看 Git 仓库占用空间:

?
然后找出历史中超过一定大小的文件,最后在历史中删除并且提交。如果感兴趣手动处理这个过程可以参照文章后边的链接。

相关的几个命令:

清理历史中的文件:

?
强制提交覆盖:

?
但是这个方案有 2 个问题:1. 处理速度慢,尝试清理 2 G 大小的代码库,用了 1 晚上还没跑完。2. 只能按文件名清理,如果不同的路径有同样的文件名就无法处理了,可能误删文件或者忽略某些文件。当然有个非常好的解决方案完美解决了这个问题。

自动清理

答案就是 bfg-repo-cleaner,这是一个 Java 写的清理工具,多线程处理清理过程,命令很简单,只需要几分钟就清理了之前 1 晚上都跑不完的任务:

?

附上几个常用的但又不常见的 git 小技巧:

复制代码仓库:

?
Git 后悔药,覆盖最后一次修改:

?
Git 放弃本地修改:

?
Git 销毁最后一次提交:

?
打包时候嵌入版本号:

?
文章中涉及的链接:

https://confluence.atlassian.com/display/BITBUCKET/Maintaining+a+Git+Repository

http://rtyley.github.io/bfg-repo-cleaner/

http://www.d-wood.com/blog/2014/10/03_6965.html

文章来源:Bruce Dou Blog
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: