Python中list的实现
2016-01-19 11:04
736 查看
这篇文章介绍了Python中list是如何实现的。
在Python中list特别有用。让我们来看下list的内部是如何实现的。
来看下面简单的程序,在list中添加一些整数并将他们打印出来。
>>>L=[] >>>L.append(1) >>>L.append(2) >>>L.append(3) >>>L [1,2,3] >>>foreinL: ...printe ... 1 2 3
正如你所看到的,list是可以迭代的。
List对象的C结构
Python中list是用下边的C语言的结构来表示的。ob_item是用来保存元素的指针数组,allocated是
ob_item预先分配的内存总容量
typedefstruct{ PyObject_VAR_HEAD PyObject**ob_item; Py_ssize_tallocated; }PyListObject;
List的初始化
让我们来看下当初始化一个空list的时候发生了什么L=[]arguments:sizeofthelist=0 returns:listobject=[] PyListNew: nbytes=size*sizeofglobalPythonobject=0 allocatenewlistobject allocatelistofpointers(ob_item)ofsizenbytes=0 clearob_item setlist'sallocatedvarto0=0slots returnlistobject
非常重要的是知道list申请内存空间的大小(后文用allocated代替)的大小和list实际存储元素所占空间的大小(
ob_size)之间的关系,
ob_size的大小和
len(L)是一样的,而allocated的大小是在内存中已经申请空间大小。通常你会看到allocated的值要比
ob_size的值要大。这是为了避免每次有新元素加入list时都要调用realloc进行内存分配。接下来我们会看到更多关于这些的内容。
Append
我们在list中追加一个整数:L.append(1)。发生了什么?调用了内部的C函数app1()arguments:listobject,newelement returns:0ifOK,-1ifnot app1: n=sizeoflist calllist_resize()toresizethelisttosizen+1=0+1=1 list =list[0]=newelement return0
来让我们看下
list_resize(),
list_resize()会申请多余的空间以避免调用多次
list_resize()函数,list增长的模型是:0,4,8,16,25,35,46,58,72,88,…
arguments:listobject,newsize returns:0ifOK,-1ifnot list_resize: new_allocated=(newsize>>3)+(newsize<9?3:6)=3 new_allocated+=newsize=3+1=4 resizeob_item(listofpointers)tosizenew_allocated return0
开辟了四个内存空间来存放list中的元素,存放的第一个元素是1。你可以从下图中看到L[0]指向了我们刚刚加进去的元素。虚线的框代表了申请了但是还没有使用(存储元素)的内存空间
我们继续加入一个元素:L.append(2)。调用
list_resize,同时n+1=2。但是因为allocated(译者注:已经申请的空间大小)是4。所以没有必要去申请新的内存空间。相同的事情发生在再次在list中添加两个元素的时候:L.append(3),L.append(4)。下图展示了到目前为止我们做了什么。
Insert
现在我们在列表的第一个位置插入一个整数5:L.insert(1,5),看看内部发生了什么。调用了ins1()arguments:listobject,where,newelement returns:0ifOK,-1ifnot ins1: resizelisttosizen+1=5->4moreslotswillbeallocated startingatthelastelementuptotheoffsetwhere,rightshifteachelement setnewelementatoffsetwhere return0
虚线框表示已经申请但是没有使用的内存。申请了8个内存空间但是list实际用来存储元素只使用了其中5个内存空间
insert的时间复杂度是O(n)
Pop
当你弹出list的最后一个元素:L.pop()。调用listpop(),list_resize在函数listpop()内部被调用,如果这时
ob_size(译者注:弹出元素后)小于allocated(译者注:已经申请的内存空间)的一半。这时申请的内存空间将会缩小。
arguments:listobject returns:elementpopped listpop: iflistempty: returnnull resizelistwithsize5-1=4.4isnotlessthan8/2sonoshrinkage setlistobjectsizeto4 returnlastelement
Pop的时间复杂度是O(1)
你可以发现4号内存空间指向还指向那个数值(译者注:弹出去的那个数值),但是很重要的是
ob_size现在却成了4.
让我们再弹出一个元素。在
list_resize内部,size–1=4–1=3比allocated(已经申请的空间)的一半还要小。所以list的申请空间缩小到
6个,list的实际使用空间现在是3个(译者注:根据(newsize>>3)+(newsize<9?3:6)=3在文章最后有详述)
你可以发现(下图)3号和4号内存空间还存储着一些整数,但是list的实际使用(存储元素)空间却只有3个了。
Remove
Pythonlist对象有一个方法可以移除一个指定的元素。调用listremove()。arguments:listobject,elementtoremove returnsnoneifOK,nullifnot listremove: loopthrougheachlistelement: ifcorrectelement: slicelistbetweenelement'sslotandelement'sslot+1 returnnone returnnull
切开list和删除元素,调用了
list_ass_slice()(译者注:在上文slicelistbetweenelement'sslotandelement'sslot+1被调用),来看下
list_ass_slice()是如何工作的。在这里,低位为1高位为2(译者注:传入的参数),我们移除在1号内存空间存储的数据5
arguments:listobject,lowoffset,highoffset returns:0ifOK list_ass_slice: copyinteger5torecyclelisttodereferenceit shiftelementsfromslot2toslot1 resizelistto5slots return0
Remove的时间复杂度为O(n)
译者注:
文中list的sort部分没有进行翻译核心部分
我们能看到Python设计者的苦心。在需要的时候扩容,但又不允许过度的浪费,适当的内存回收是非常必要的。 这个确定调整后的空间大小算法很有意思。 调整后大小(new_allocated)=新元素数量(newsize)+预留空间(new_allocated) 调整后的空间肯定能存储newsize个元素。要关注的是预留空间的增长状况。 将预留算法改成Python版就更清楚了:(newsize//8)+(newsize<9and3or6)。 当newsize>=allocated,自然按照这个新的长度"扩容"内存。 而如果newsize<allocated,且利用率低于一半呢? allocatednewsizenew_size+new_allocated 1044+3 2099+7 很显然,这个新长度小于原来的已分配空间长度,自然会导致realloc收缩内存。(不容易啊)
引自《深入Python编程》
相关文章推荐
- python操作mysql总结
- python字符串/元组/列表/字典互转
- [python] - profilers性能分析器
- python的学习资源
- python浅拷贝与深拷贝
- Python算法题----求出和为S的所有连续正整数数列
- Python学习——struct模块的pack、unpack示例
- 配置caffe的python接口及其易错点
- 数学之路-python计算实战(2)-初遇pypy
- Python 5.2 使用@property
- python 内建类型
- python结合API实现即时天气信息
- 3.5!——阶乘的插值(python)
- python matplotlib中文显示问题
- python-整理-面向对象
- python3 crontab 下运行python输出中文失败
- Python中的module,library,package之间的区别
- python结合API实现即时天气信息
- 举例讲解Python面相对象编程中对象的属性与类的方法
- Python学习笔记一