您的位置：首页 > 编程语言 > Python开发

Python基础：函数式编程

2013-09-11 22:31 483 查看

Python基础：函数式编程

一、概述

Python是一门多范式的编程语言，它同时支持过程式、面向对象和函数式的编程范式。因此，在Python中提供了很多符合 函数式编程 风格的特性和工具。

以下是对 Python中的函数式编程的简要总结，关于这一主题更全面的讨论可以参考 Functional Programming HOWTO。

二、lambda表达式（匿名函数）

除了 Python基础：函数中介绍的 def语句，Python还提供了另外一种定义函数的方法： lambda表达式。

lambda表达式的语法如下：

lambda [arguments]: expression

与def语句类似，lambda表达式创建的函数：

也是可调用对象（接受0个或多个参数，返回一个值）

也是一等公民（first-class)

具有同样的参数风格和作用域规则

也支持嵌套定义（def中的lambda，或lambda中的lambda）

但是lambda表达式与def语句之间，也存在很多显著的差异：


差异点	函数（lambda表达式）	函数（def语句）
函数体	只能是单行表达式（expression）	可以是任意复杂的语句（statement）
函数返回值	返回值就是函数体中的表达式的求值结果	由函数体中的return语句指定返回值
函数名	定义后直接返回函数对象（匿名函数）	定义后自动为函数对象绑定函数名
函数定义位置	可以在任何允许函数对象出现的位置定义（支持即时定义，即时调用）	只能在允许语句出现的位置定义（先定义，后调用）
用途	多用于一次性使用的简单函数	适用于一切函数和类方法

以下是lambda表达式的简单示例：

# def语句
>>> def func(x, y): return x + y # 自动绑定函数名为func
...
>>> func
<function func at 0xb76eff7c>
>>> func(1, 2) # 先定义，后调用
3

# lambda表达式
>>> lambda x, y: x + y # 匿名函数（直接返回函数对象）
<function <lambda> at 0xb76ef0d4>
>>> (lambda x, y: x + y)(1, 2) # 即时定义，即时调用
3
>>> f = lambda x, y: x + y # 手动绑定函数名
>>> f(1, 2) # 也可以先定义，后调用
3
>>>
>>> ((lambda x: (lambda y: x + y))(1))(2) # 嵌套定义的lambda（较复杂，尽量避免）
3

三、内建函数filter()、map()、reduce()

1、filter()

函数原型：filter(function, iterable)

说明：返回一个由iterable中的某些元素组成的列表，这些元素使得function返回True。若iterable为字符串（或元组），则返回字符串（或元组）；否则，总是返回列表。如果function为None，则默认为恒等函数（identity function，类似 f(x) = x）。

示例：

# for循环版本
>>> res = []
>>> for x in 'a1b2c3d4e5f6':
...     if x.isalpha():
...         res.append(x)
...
>>> res
['a', 'b', 'c', 'd', 'e', 'f']

# filter版本
s = 'a1b2c3d4e5f6'
>>> filter((lambda x: x.isalpha()), s) # iterable为字符串，则返回字符串
'abcdef'
>>> filter((lambda x: x.isalpha()), tuple(s)) # iterable为元组，则返回元组
('a', 'b', 'c', 'd', 'e', 'f')
>>> filter((lambda x: x.isalpha()), list(s)) # iterable为其他迭代对象，则返回列表
['a', 'b', 'c', 'd', 'e', 'f']
>>> filter(None, list(s)) # function为None，则默认为恒等函数
['a', '1', 'b', '2', 'c', '3', 'd', '4', 'e', '5', 'f', '6']

2、map()

函数原型：map(function, iterable, ...)

说明：逐个以iterable中的元素为参数调用function，并返回结果的列表。如果存在多个iterable，则以最长的为准（其他不足的补None），逐个并行取出元素作为参数调用function（如map(function, iter1, iter2)会返回列表[function(iter1[0], iter2[0]), function(iter1[1], iter2[1]), ...]）。如果function为None，则默认为恒等函数。

示例：

# for循环版本
>>> res = []
>>> for x in [1, 2, 3, 4, 5]:
...     res.append(x ** 2)
...
>>> res
[1, 4, 9, 16, 25]

# map版本
>>> map((lambda x: x ** 2), [1, 2, 3, 4, 5])
[1, 4, 9, 16, 25]
>>> map(None, [1, 2, 3, 4, 5]) # function为None，则默认为恒等函数
[1, 2, 3, 4, 5]
>>> map((lambda x, y: x + y), [1, 2, 3], [4, 5, 6]) # 存在多个iterable，则返回[1+4, 2+5, 3+6]
[5, 7, 9]
>>> map(None, [1, 2, 3], [4, 5]) # 以最长的iterable为准，其他不足的补None
[(1, 4), (2, 5), (3, None)]

3、reduce()

函数原型：reduce(function, iterable[, initializer])

说明：以累加方式逐个取出iterable中的元素作为参数调用（具有双参数的）function，从而最终将iterable简化为一个值（如reduce(function, [1, 2, 3])会返回function(function(1, 2), 3)）。如果存在initializer，则在累加调用中，以它作为初始的第一个参数。function必须是可调用对象（不能为None）。

示例：

# for循环版本
>>> total = 0
>>> for x in [1, 2, 3, 4, 5]:
...     total += x
...
>>> total
15

# reduce版本
>>> reduce((lambda x, y: x + y), [1, 2, 3, 4, 5]) # 相当于((((1+2)+3)+4)+5)
15
>>> reduce((lambda x, y: x + y), [1, 2, 3, 4, 5], 10) # 带有initializer的reduce，相当于(((((10+1)+2)+3)+4)+5)
25
>>> sum([1, 2, 3, 4, 5], 10) # 等效于上面的reduce
25

四、闭包

闭包（closure）是一个内嵌函数，它能够记住其外围作用域中的所有名字，即使这个作用域看起来已经不在外围。

在以下示例中，内嵌函数action就是一个闭包：

>>> def maker(N):
...     def action(x):
...         return x * N
...     return action
...
>>> mul10 = maker(10)
>>> mul10(3)
30
>>> mul10(5)
50

尽管函数调用

mul10 = maker(10)

已经返回并退出了，但后续的mul10却能够记住整数10，从而计算入参的10倍数。

实际上，外围作用域（如函数maker对应的代码范围）中的所有名字（如参数N）都作为环境信息被绑定到了action函数上，因此每次调用action时都可以访问这些环境信息。特别地，可以通过特殊属性

func_closure

来获取一个函数的自由变量绑定：

>>> def maker(N):
...     def action(x):
...         return x * N
...     print(action.func_closure) # 打印出action函数的func_closure属性值
...     return action
...
>>> N = 10
>>> print('int N: id = %#0x, val = %d' % (id(N), N)) # N的值为10（整数10的地址是0x8e82044）
int N: id = 0x8e82044, val = 10
>>> mul10 = maker(N) # action.func_closure中含有整数10（即自由变量N）
(<cell at 0x90e96bc: int object at 0x8e82044>,)

闭包的这种能够记住环境状态的特性非常有用，Python中有一些其他特性就是借助闭包来实现的，比如装饰器。

五、偏函数应用

1、基本用法

偏函数应用（Partial Function Application）是一种简化函数调用的方式，主要表现为对函数的部分参数进行固化。

Python中的偏函数应用是借助 functools.partial 来完成的。例如有一个专用于生成文章标题的函数title：

>>> def title(topic, part):
...     return topic + u'：' + part
...

如果要为『Python基础』系列的多篇文章生成标题，可以有以下两种方式：

# 普通版本
>>> print title(u'Python基础', u'开篇')
Python基础：开篇
>>> print title(u'Python基础', u'函数')
Python基础：函数
>>> print title(u'Python基础', u'函数式编程')
Python基础：函数式编程

# 偏函数版本
>>> from functools import partial
>>> pybasic_title = partial(title, u'Python基础')
>>> print pybasic_title(u'开篇')
Python基础：开篇
>>> print pybasic_title(u'函数')
Python基础：函数
>>> print pybasic_title(u'函数式编程')
Python基础：函数式编程

从上面的示例可以看出，如果在编码过程中遇到了“多次用相同的参数调用一个函数”的场景，就可以考虑使用偏函数来固化这些相同的参数，进而简化函数调用。

2、等效实现

1）默认参数

在上述示例中，如果将函数title的定义改为

def title(part, topic=u'Python基础')

也可以达到相同的效果。但是这种方式的不足之处也很明显：

需要修改已有函数title的定义

默认参数只能有一个固定值，定义后即不能更改

相比之下，偏函数具有很好的灵活性：既不用修改已有函数的定义，又可以为函数的参数固化不同的值。

2）lambda表达式

使用 lambda表达式也可以实现类似偏函数的功能，并且与默认参数不同的是，可以针对不同的参数值定义不同的lambda表达式（因为lambda表达式通常是一次性使用的）。例如上述示例中的pybasic_title也可以实现为：

>>> pybasic_title = (lambda part: u'Python基础：' + part)
>>> print pybasic_title(u'开篇')
Python基础：开篇
>>> print pybasic_title(u'函数')
Python基础：函数
>>> print pybasic_title(u'函数式编程')
Python基础：函数式编程

但是，由于lambda表达式本身的限制（参考『lambda表达式』一节），在具有复杂函数的场景中，还得使用偏函数。

3）闭包

最后，使用闭包同样可以等效地实现偏函数的功能，并且与lambda表达式不同的是，它没有任何限制场景。还是上面的例子：

>>> def title(topic):
...     def topic_title(part):
...         return topic + u'：' + part
...     return topic_title
...
>>> pybasic_title = title(u'Python基础')
>>> print pybasic_title(u'开篇')
Python基础：开篇
>>> print pybasic_title(u'函数')
Python基础：函数
>>> print pybasic_title(u'函数式编程')
Python基础：函数式编程

可以看出，这个闭包版本的唯一缺点是它需要对函数title进行重新定义（与默认参数的情况有些类似）。

总而言之，如果需要对已有函数进行参数固化，偏函数是最佳选择。

六、列表解析

关于 列表解析（List Comprehensions），在 Python基础：序列（列表、元组）中有过简单介绍。

这里主要强调两点：

列表解析可以用来代替上面提到的一些函数式编程方法

列表解析还有一个生成器版本的近亲：生成器表达式

1、用列表解析代替filter()和map()

1）filter()

列表解析可以完全代替filter()：

function不为None时：

[item for item in iterable if function(item)]

等价于

filter(function, iterable)

function等于None时：

[item for item in iterable if item]

等价于

filter(None, iterable)

2）map()

在以下情况中，列表解析可以代替map()：

只有一个iterable时

function不为None：

[function(item) for item in iterable]

等价于

map(function, iterable)

function等于None：

[item for item in iterable]

等价于

map(None, iterable)

多个iterable长度相同时

function不为None：

[function(*args) for args in zip(iter1, iter2, ...)]

等价于

map(function, iter1, iter2, ...)

function等于None：

zip(iter1, iter2, ...)

等价于

map(None, iter1, iter2, ...)

如果多个iterable具有不同的长度，那么列表解析就无法代替map()了。

2、生成器表达式

生成器表达式（Generator Expressions）与列表解析在语法和功能方面都非常相似。二者的根本差异是：生成器表达式返回一个生成器，而列表解析返回一个列表。如下所示：


差异点	生成器表达式	列表解析
表示方法	(expr for item in iterable if cond_expr)	[expr for item in iterable if cond_expr]
返回值	一个生成器	一个列表

与列表解析相比，生成器表达式具有延迟计算（lazy evaluation）的特点，因此在使用内存上更有效。关于生成器表达式的实际案例，可以参考 Python核心编程（第二版）中的『8.13』一节：『生成器表达式』。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航