您的位置:首页 > 数据库 > Mongodb

mongodb指南(翻译)(十二) - developer zone - 数据类型和约定(一)

2011-12-08 17:12 549 查看
MongoDB(BSON)数据类型

除了基本的JSON类型:string,integer,boolean,double,null,array和object,mongo还使用了特殊的数据类型。这些类型包括date,object id,binary data,regular expression 和code。每一个驱动都以特定语言的方式实现了这些类型,查看你的驱动的文档来获取详细信息。

从shell中检查数据类型

在shell中,浮点型和整型被视为是标准javascript数字,因此不能将两者区分开。

> // v1.8+ shell
> x
{
"_id" : ObjectId("4dcd3ebc9278000000005158"),
"d" : ISODate("2011-05-13T14:22:46.777Z"),
"b" : BinData(0,""),
"c" : "aa",
"n" : 3,
"e" : [ ],
"n2" : NumberLong(33)
}
> x.d instanceof Date
true
> x.b instanceof BinData
true
> typeof x
object
> typeof x.b
object
> typeof x.n
number
> typeof x.n
number
> typeof x.n2
object
> x.n2 instanceof NumberLong
true
> typeof x.c
string


时间戳数据类型

在mongodb中,BSON包含了有着特殊语义的时间戳数据类型。

时间戳被存储为64位,并在同一个mongod中保证唯一性。前面的32位是time_t值(从UTC时间到当前的秒数)。后面的32位是同一秒内操作的递增的顺序值。

mongodb对复制组oplog中字段“ts”使用时间戳数据类型作为“OpTimes”.

当为null时,时间戳有特殊语义。如果为null,并且时间戳是对象的前两个字段之一,时间戳会自动被转换为一个唯一的值。(它必须是前两个顶级字段之一是考虑到性能原因;整个文档未扫描时间戳。)

下面是一个mongo shell中的例子(v1.7.5或者更高)。

> // not one of the first 2 fields
> db.foo.insert( { x : 1, y : new Timestamp() } )
> db.foo.find()
{ "_id" : ObjectId("4d1d4ce78b1a04eeb294c098"), "x" : 1, "y" : { "t" : 0, "i" : 0 } }
> // in first 2 fields, auto fill of value works
> db.foo.drop()
> db.foo.insert( { y : new Timestamp(), x : 3 } )
> // the shell displays timestamps as { t : ..., i : ... } where t is the time
> // component and i is the ordinal component
> db.foo.find()
{ "_id" : ObjectId("4d1d4cfd8b1a04eeb294c099"), "y" : { "t" : 1293765885000, "i" : 1 }, "x" : 3 }
> db.foo.drop()
> for( var i = 0; i < 10; i++ ) db.foo.insert({y:new Timestamp(), x : i})
> db.foo.find()
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c09a"), "y" : { "t" : 1293765911000, "i" : 1 }, "x" : 0 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c09b"), "y" : { "t" : 1293765911000, "i" : 2 }, "x" : 1 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c09c"), "y" : { "t" : 1293765911000, "i" : 3 }, "x" : 2 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c09d"), "y" : { "t" : 1293765911000, "i" : 4 }, "x" : 3 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c09e"), "y" : { "t" : 1293765911000, "i" : 5 }, "x" : 4 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c09f"), "y" : { "t" : 1293765911000, "i" : 6 }, "x" : 5 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c0a0"), "y" : { "t" : 1293765911000, "i" : 7 }, "x" : 6 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c0a1"), "y" : { "t" : 1293765911000, "i" : 8 }, "x" : 7 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c0a2"), "y" : { "t" : 1293765911000, "i" : 9 }, "x" : 8 }
{ "_id" : ObjectId("4d1d4d178b1a04eeb294c0a3"), "y" : { "t" : 1293765911000, "i" : 10 }, "x" : 9 }
>


UTC DateTime 数据类型

按照BSON Date/Time数据类型被称为UTC DateTime 。(这里还有另一个时间戳数据类型,但是它是mongodb的一个特殊内部类型并且你不应该使用)。UTC DateTime将自Unix纪元(Jan 1, 1970)以来的毫秒数存储为一个64位整型数据。这个整数是有符号的,所以早于1970的时间都会被存储为负数。

但是,在版本1.9.1以前的mongodb将DateTime数错误的解析为无符号整数,这影响到了排序,范围查询,DateTime类型的字段的索引。当升级的时候索引不会重建。因此如果你使用低于版本1.9.1的程序在DateTime类型的字段上面建立了索引,然后升级到高于或等于版本1.9.1的程序后,有的索引将还是把日期按无符号整数排序(早于日期1970的会排到晚于或等于日期1970的之后),这会影响到排序和范围查询。要解决这个问题,你必须丢弃并重建你的索引。

国际化的字符串

mongodb支持UTF-8格式的字符串存储到对象和查询中。(特别的,BSON的字符串是UTF-8的.)

通常来说,每种语言的驱动在序列化和反序列号BSON时会将该语言的字符串转换为UTF-8。例如,java驱动在序列化时将java unicode字符串转换为UTF-8.

这意味着在大多数场合你可以高效的存储大多数的国际间的字符到mongodb的字符串。一些提醒:

mongodb正则表达式查询支持在正则表达式字符串中使用UTF-8.

当前,在一个字符串上进行sort()会使用strcmp:排序顺序可能是合理的但在国际间数据上面不是完全正确的。将来的mongodb版本可能会支持完全UTF-8排序次序。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐