您的位置:首页 > 编程语言 > Python开发

Python学习笔记12:标准库之对象序列化(pickle包,cPickle包)

2014-10-15 08:33 1066 查看
计算机的内存中存储的是二进制的序列。

我们可以直接将某个对象所对应位置的数据抓取下来,转换成文本流 (这个过程叫做serialize),然后将文本流存入到文件中。

由于Python在创建对象时,要参考对象的类定义,所以当我们从文本中读取对象时,必须在手边要有该对象的类定义,才能懂得如何去重建这一对象。

从文件读取时,对于Python的内建(built-in)对象 (比如说整数、词典、表等等),由于其类定义已经载入内存,所以不需要我们再在程序中定义类。

但对于用户自行定义的对象,就必须要先定义类,然后才能从文件中载入对象。

一 pickle包

对于上述过程,最常用的工具是Python中的pickle包。

1 将内存中的对象转换成为文本流:

import pickle

class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
summer = Bird()
pickleString = pickle.dumps(summer) # serialize object


使用pickle.dumps()方法可以将对象summer转换成了字符串 picklestring(也就是文本流)。

随后我们可以用普通文本的存储方法来将该字符串储存在文件(文本文件的输入输出)。

import pickle

class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
summer = Bird()
fileName = 'save.pkl'
with open(fileName, 'w') as f: # open file with write-mode
    pickleString = pickle.dump(summer, f) # serialize and save object
对象summer存储在文件save.pkl

2 重建对象

首先,我们要从文本中读出文本,存储到字符串 (文本文件的输入输出)。

然后使用pickle.loads(str)的方法,将字符串转换成为对象。

要记得,此时我们的程序中必须已经有了该对象的类定义。

import pickle
 
# define the class before unpickle
class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
fileName = 'save.pkl'
with open(fileName, 'r') as f:
    summer = pickle.load(f) # read file and build object


二 cPickle包

cPickle包的功能和用法与pickle包几乎完全相同,其存在差别的地方实际上很少用到;

不同在于cPickle是基于c语言编写的,速度是pickle包的1000倍。

对于上面的例子,如果想使用cPickle包,我们都可以将import语句改为:

import cPickle as pickle
就不需要再做任何改动了。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: