您的位置:首页 > 其它

Azureus源码剖析(二) ---解析Torrent种子文件(上)

2009-05-06 21:50 489 查看
BT种子文件使用了一种叫bencoding的编码方法来保存数据。

bencoding有四种类型的数据:srings(字符串),integers(整数),lists(列表),dictionaries(字典)

编码规则如下:

(1)strings(字符串)编码为:<字符串长度>:<字符串>

例如: 4:test 表示为字符串"test"

4:例子 表示为字符串“例子”

字符串长度单位为字节

没开始或结束标记
(2)integers(整数)编码为:i<整数>e

开始标记i,结束标记为e

例如: i1234e 表示为整数1234

i-1234e 表示为整数-1234

整数没有大小限制

i0e 表示为整数0

i-0e 为非法

以0开头的为非法如: i01234e 为非法

(3)lists(列表)编码为:l<bencoding编码类型>e

开始标记为l,结束标记为e

列表里可以包含任何bencoding编码类型,包括整数,字符串,列表,字典。

例如: l4:test5:abcdee 表示为二个字符串["test","abcde"]

(4)dictionaries(字典)编码为d<bencoding字符串><bencoding编码类型>e

开始标记为d,结束标记为e

关键字必须为bencoding字符串

值可以为任何bencoding编码类型

例如: d3:agei20ee 表示为{"age"=20}

d4:path3:C:"8:filename8:test.txte

表示为{"path"="C:"","filename"="test.txt"}

(5)具体文件结构如下:

全部内容必须都为bencoding编码类型。

整个文件为一个字典结构,包含如下关键字

announce:tracker服务器的URL(字符串)

announce-list(可选):备用tracker服务器列表(列表)

creation date(可选):种子创建的时间,Unix标准时间格式,从1970 1月1日 00:00:00到创建时间的秒数(整数)

comment(可选):备注(字符串)

created by(可选):创建人或创建程序的信息(字符串)

info:一个字典结构,包含文件的主要信息,为分二种情况:单文件结构或多文件结构

单文件结构如下:

length:文件长度,单位字节(整数)

md5sum(可选):长32个字符的文件的MD5校验和,BT不使用这个值,只是为了兼容一些程序所保留!(字符串)

name:文件名(字符串)

piece length:每个块的大小,单位字节(整数)

pieces:每个块的20个字节的SHA1 Hash的值(二进制格式)

多文件结构如下:

files:一个字典结构

length:文件长度,单位字节(整数)

md5sum(可选):同单文件结构中相同

path:文件的路径和名字,是一个列表结构,如"test"test.txt 列表为l4:test8test.txte

name:最上层的目录名字(字符串)

piece length:同单文件结构中相同

pieces:同单文件结构中相同

(6)实例:

用记事本打开一个.torrent可以看来类似如下内容

d8:announce35:http://www.manfen.net:7802/announce13:creation datei1076675108e4:infod6:lengthi17799e4:name62:MICROSOFT.WINDOWS.2000.AND.NT4.SOURCE.CODE-SCENELEADER.torrent12:piece lengthi32768e6:pieces20:?W ?躐?緕排T酆ee

很容易看出

announce=http://www.manfen.net:7802/announce

creation date=1076675108秒(02/13/04 20:25:08)

文件名=MICROSOFT.WINDOWS.2000.AND.NT4.SOURCE.CODE-SCENELEADER.torrent

文件大小=17799字节

文件块大小=32768字节
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息