您的位置:首页 > 运维架构 > 网站架构

批量下载twt网站mp3的方法

2008-09-15 18:07 295 查看




wget -r -l 2 -c -R jpg,jepg,JPG,css,js,gif 专辑列表的地址1 2 4...
-r 递归下载 -l 限制在两层 -c 断点续传 -R阻止文件扩展名列表
可以把很多专辑列表同时贴进去,这样下载时间总和比较小
这道命令下去,会先下载一些没有用的文件,大概3分钟以后开始下载歌曲。下载的速度很快,看来他们的服务器还是很清闲的。

如果在windows系统上,这样就可以了,但是如果在linux的UTF-8 locale 下,麻烦就来了。这样就引伸出了两个子问题:

1. 文件名乱码的解决方法:

那个该死服务器还在用cp936的locale,太古旧一点了吧?好好的utf-8为什么不用?懒得升级?讨厌!
经过大量的查询(google辛苦了)还有maillist提问。。我发现如下命令可以解决linux平台下类似的文件名乱码问题!
首先 sudo apt-get install convmv
然后 convmv -f WINDOWS-936 -t utf-8 -r --notest --replace *
ok 文件名乱码就此解决

2. ID3标签乱码问题:

这个问题讨论的比较多了如下命令,不用害怕这个东西很智能的,如果是UTF-8的ID3标签,那么他不会给你弄坏的,放心。
find . -iname "*.mp3" -execdir mid3iconv -e GBK {} /;
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: