聊一聊 Python 中的闭包

来自:  cicaday     

https://segmentfault.com/a/1190000007321972

Python中的闭包不是一个一说就能明白的概念,但是随着你往学习的深入,无论如何你都需要去了解这么一个东西。

闭包的概念

我们尝试从概念上去理解一下闭包。

在一些语言中,在函数中可以(嵌套)定义另一个函数时,如果内部的函数引用了外部的函数的变量,则可能产生闭包。闭包可以用来在一个函数与一组“私有”变量之间创建关联关系。在给定函数被多次调用的过程中,这些私有变量能够保持其持久性。

用比较容易懂的人话说,就是当某个 函数 被当成对象返回时, 夹带了外部变量 ,就形成了一个闭包。看例子。

def make_printer ( msg ) :

     def printer () :

         print msg    # 夹带私货(外部变量)

     return printer    # 返回的是函数,带私货的函数

printer = make_printer ( Foo! )

printer ()

支持将函数当成对象使用的编程语言,一般都支持闭包。比如Python, JavaScript。

如何理解闭包

闭包存在有什么意义呢?为什么需要闭包?

我个人认为,闭包存在的意义就是它夹带了外部变量(私货),如果它不夹带私货,它和普通的函数就没有任何区别。 同一个的函数 夹带了 不同的私货 ,就实现了不同的功能。其实你也可以这么理解,闭包和面向接口编程的概念很像,可以把闭包理解成轻量级的接口封装。

接口定义了一套对方法签名的约束规则。

def tag ( tag_name ) :

     def add_tag ( content ) :

         return “<{0}>{1} . format ( tag_name , content )

     return add_tag

content = Hello

add_tag = tag ( a )

printadd_tag ( content )

# Hello

add_tag = tag ( b )

printadd_tag ( content )

# Hello

在这个例子里,我们想要一个给 contenttag 的功能,但是具体的 tag_name 是什么样子的要根据实际需求来定,对外部调用的接口已经确定,就是 add_tag(content) 。如果按照面向接口方式实现,我们会先把 add_tag 写成接口,指定其参数和返回类型,然后分别去实现a和b的 add_tag

但是在闭包的概念中, add_tag 就是一个函数,它需要 tag_namecontent 两个参数,只不过 tag_name 这个参数是打包带走的。所以一开始时就可以告诉我怎么打包,然后带走就行。

上面的例子不太生动,其实在我们生活和工作中,闭包的概念也很常见。比如说手机拨号,你只关心电话打给谁,而不会去纠结每个品牌的手机是怎么实现的,用到了哪些模块。再比如去餐馆吃饭,你只要付钱就可以享受到服务,你并不知道那桌饭菜用了多少地沟油。这些都可以看成闭包,返回来的是一些功能或者服务(打电话,用餐),但是这些功能使用了外部变量(天线,地沟油等等)。

你也可以把一个类实例看成闭包,当你在构造这个类时,使用了不同的参数,这些参数就是闭包里的包,这个类对外提供的方法就是闭包的功能。但是类远远大于闭包,因为闭包只是一个可以执行的函数,但是类实例则有可能提供很多方法。

何时使用闭包

其实闭包在Python中很常见,只不过你没特别注意这就是一个闭包。比如Python中的装饰器Decorator,假如你需要写一个带参数的装饰器,那么一般都会生成闭包。

为什么?因为Python的装饰器是一个固定的函数接口形式。它要求你的装饰器函数(或装饰器类)必须接受一个函数并返回一个函数:

# how to define

def wrapper ( func1 ) :   # 接受一个callable对象

     return func2    # 返回一个对象,一般为函数

# how to use

def target_func ( args ) : # 目标函数

     pass

# 调用方式一,直接包裹

result = wrapper ( target_func )( args )

# 调用方式二,使用@语法,等同于方式一

@ wrapper

def target_func ( args ) :

     pass

result = target_func ()

那么如果你的装饰器如果带参数呢?那么你就需要在原来的装饰器上再包一层,用于接收这些参数。这些参数(私货)传递到内层的装饰器里后,闭包就形成了。所以说当你的装饰器需要自定义参数时,一般都会形成闭包。(类装饰器例外)

def html_tags ( tag_name ) :

     def wrapper_ ( func ) :

         def wrapper ( * args , ** kwargs ) :

             content = func ( * args , ** kwargs )

             return “<{tag}>{content} . format ( tag = tag_name , content = content )

         return wrapper

     return wrapper _

@ html_tags ( b )

def hello ( name = Toby ) :

     return Hello {}! . format ( name )

# 不用@的写法如下

# hello = html_tag( b )(hello)

# html_tag( b ) 是一个闭包,它接受一个函数,并返回一个函数

printhello ()    # Hello Toby!

printhello ( world )    # Hello world!

关于装饰器的更深入剖析,可以看我写的另外一篇博客。

再深入一点

其实也不必太深入,理解这上面的概念,很多看起来头疼的代码也不过如此。

下面让我们来了解一下闭包的包到底长什么样子。其实闭包函数相对与普通函数会多出一个 __closure__ 的属性,里面定义了一个元组用于存放所有的 cell 对象,每个 cell 对象一一保存了这个闭包中所有的外部变量。

>>> def make_printer ( msg1 , msg2 ) :

     def printer () :

         print msg1 , msg2

     return printer

>>> printer = make_printer ( Foo , Bar )    # 形成闭包

>>> printer . __closure__    # 返回cell元组

( < cell at 0x03A10930 : strobject at 0x039DA218 > , < cell at 0x03A10910 : strobject at 0x039DA488 > )

>>> printer . __closure__ [ 0 ]. cell_contents    # 第一个外部变量

Foo

>>> printer . __closure__ [ 1 ]. cell_contents    # 第二个外部变量

Bar

原理就是这么简单。

往期阅读

分享20个机器学习项目实战,0基础上手

推荐一位大佬,在腾讯工作十年