您的位置：首页 > 编程语言 > C语言/C++

C++中lambda表达式详解与原理分析

2018-03-20 23:54 351 查看

lambda表达式的本质就是重载了()运算符的类，这种类通常被称为functor，即行为像函数的类。因此lambda表达式对象其实就是一个匿名的functor。

C++中lambda表达式的构成

一个标准的lambda表达式包括：捕获列表、参数列表、mutable指示符、尾置返回类型（->返回类型）和函数体：

[capture list] (params list) mutable exception-> return type { function body }

各项具体含义如下

capture list：捕获外部变量列表

params list：形参列表

mutable指示符：用来说用是否可以修改捕获的变量

exception：异常设定

return type：返回类型

function body：函数体

此外，我们还可以省略其中的某些成分来声明“不完整”的lambda表达式，常见的有以下几种：


序号	格式
1	[capture list] (params list) -> return type {function body}
2	[capture list] (params list) {function body}
3	[capture list] {function body}

其中：

格式1声明了const类型的表达式，这种类型的表达式不能修改捕获列表中的值。

格式2省略了返回值类型，但编译器可以根据以下规则推断出Lambda表达式的返回类型：

如果function body中存在return语句，则该Lambda表达式的返回类型由return语句的返回类型确定

如果function body中没有return语句，则返回值为void类型。

格式3中省略了参数列表，类似普通函数中的无参函数。

简单lambda表达式及其原理分析

在VS2017中构造一个简单的lambda表达式如下：

auto f = [] (int a, int b) -> int
{
return a + b + 42;
};
003A3BC0 6A 03                push        3
003A3BC2 6A 04                push        4
003A3BC4 8D 4D EB             lea         ecx,[f]
003A3BC7 E8 04 E4 FF FF       call        <lambda_f2fe7ac06244f603e089b2eaef4ffd5c>::operator() (03A1FD0h)
cout << f(4, 3) << endl;

可以看到，调用该functor时，call到的是一个lambda对象的operator()位置，该位置反汇编代码如下：

00BA1FD0 55                   push        ebp
00BA1FD1 8B EC                mov         ebp,esp
00BA1FD3 81 EC CC 00 00 00    sub         esp,0CCh
; 省略一堆东西
00BA1FF0 89 4D F8             mov         dword ptr [this],ecx
49:         return a + b + 42;
00BA1FF3 8B 45 0C             mov         eax,dword ptr [b]
00BA1FF6 8B 4D 08             mov         ecx,dword ptr [a]
00BA1FF9 8D 44 01 2A          lea         eax,[ecx+eax+2Ah]
50:     };
; 省略一堆东西
00BA2000 8B E5                mov         esp,ebp
00BA2002 5D                   pop         ebp
00BA2003 C2 08 00             ret         8

注意：

如果在lambda表达式中忽略括号和形参列表，则相当于指定的函数没有入参。

lambda表达式中不能指定参数的默认值。

如果忽略返回值类型，则由编译器做自动类型推断，详细规则如第一部分所示。

捕获列表

由于lambda表达式是在某函数内定义的，因此我们可能希望其能使用函数内的局部变量，这时则可以使用所谓捕获列表。总体说来，一共有三种捕获方式：值捕获、引用捕获和外部捕获。

值捕获

值捕获和参数传递中的值传递类似，被捕获的变量的值在Lambda表达式创建时通过值拷贝的方式传入，因此随后对该变量的修改不会影响影响Lambda表达式中的值。在VS2017中创建如下代码并加以分析：

int testFunc1()
{
int nTest1 = 23;

auto f = [nTest1] (int a, int b) -> int
{
return a + b + 42 + nTest1;
//nTest1 = 333;              不能在lambda表达式中修改捕获变量的值
};

cout << f(4, 3) << "&nTest1=" << nTest1 << endl;
}

需要注意的是，不能在lambda表达式中修改捕获变量的值。其实根据上面的反汇编分析，我们已经知道，lambda表达式中的代码是在一个单独的函数中执行的，这个函数在调用时创建了自己的栈帧，而其使用的nTest1局部变量在testFunc1的栈帧中，虽然通过ebp可以进行栈帧回溯，但显然这是一种不合情理的做法。因此可以断定，捕获列表中出现的局部变量一定会通过某种方式传递给lambda匿名类。到底采用的是哪种方式呢？我们来揭晓答案：

49:     auto f = [nTest1] (int a, int b) -> int
50:     {
51:         return a + b + 42 + nTest1;
52:     };
01183C08 8D 45 E8             lea         eax,[nTest1]
01183C0B 50                   push        eax
01183C0C 8D 4D DC             lea         ecx,[f]
01183C0F E8 0C E3 FF FF       call        <lambda_ed51e51ff76776313a28b716c94bbc2d>::<lambda_ed51e51ff76776313a28b716c94bbc2d> (01181F20h)
; 省略无关代码
54:     cout << f(4, 3) << "&nTest1=" << nTest1 << endl;
01183C1D 8B 45 E8             mov         eax,dword ptr [nTest1]
01183C20 50                   push        eax
01183C21 68 40 BE 18 01       push        offset string "&nTest1=" (0118BE40h)
01183C26 6A 03                push        3
01183C28 6A 04                push        4
01183C2A 8D 4D DC             lea         ecx,[f]
01183C2D E8 4E F7 FF FF       call        <lambda_ed51e51ff76776313a28b716c94bbc2d>::operator() (01183380h)

基本可以断定，nTest是在lambda匿名类构造时传入的。并且传入的是nTest1的引用（由于C++的引用本身就是语法糖，反汇编层面看到的是指针，但是结合源码分析不难得出这里应该是引用）。下面跟踪进其构造函数一探究竟：

01181F20 55                   push        ebp
01181F21 8B EC                mov         ebp,esp
01181F23 81 EC CC 00 00 00    sub         esp,0CCh
; 省略部分现场保护和堆栈填充int 3的代码
01181F40 89 4D F8             mov         dword ptr [this],ecx
; 01181F40 89 4D F8             mov         dword ptr [ebp-8],ecx
01181F43 8B 45 F8             mov         eax,dword ptr [this]
; 01181F43 8B 45 F8             mov         eax,dword ptr [ebp-8]
01181F46 8B 4D 08             mov         ecx,dword ptr [<nTest1>]
; 01181F46 8B 4D 08             mov         ecx,dword ptr [ebp+8]
01181F49 8B 11                mov         edx,dword ptr [ecx]
01181F4B 89 10                mov         dword ptr [eax],edx
01181F4D 8B 45 F8             mov         eax,dword ptr [this]
; 01181F4D 8B 45 F8             mov         eax,dword ptr [ebp-8]
; 省略部分现场恢复代码
01181F53 8B E5                mov         esp,ebp
01181F55 5D                   pop         ebp
01181F56 C2 04 00             ret         4

由此可以确定，lambda匿名类会将捕获参数中的变量添加到其成员变量中，并设置一个带有该参数引用类型的构造函数。最后再来看看在其operator()函数中是怎样使用捕获变量的：

49:     auto f = [nTest1] (int a, int b) -> int
50:     {
01183380 55                   push        ebp
01183381 8B EC                mov         ebp,esp
01183383 81 EC CC 00 00 00    sub         esp,0CCh
; 省略部分现场保护和堆栈填充int 3的代码
011833A0 89 4D F8             mov         dword ptr [this],ecx
51:         return a + b + 42 + nTest1;
011833A3 8B 45 08             mov         eax,dword ptr [a]
011833A6 03 45 0C             add         eax,dword ptr [b]
011833A9 8B 4D F8             mov         ecx,dword ptr [this]
011833AC 8B 11                mov         edx,dword ptr [ecx]
011833AE 8D 44 10 2A          lea         eax,[eax+edx+2Ah]
52:     };
; 省略部分现场恢复代码
011833B5 8B E5                mov         esp,ebp
011833B7 5D                   pop         ebp
011833B8 C2 08 00             ret         8

真相大白了，值捕获时，C++编译器在构建lambda表达式的匿名类时将局部变量的引用传入，并在构造函数中完成对相应成员变量的赋值。在调用其operator()函数时，如果用到了捕获列表中的局部变量，则从给匿名类对象的成员变量中取出。

引用捕获

使用引用捕获一个外部变量，需在捕获列表变量前面加上一个引用说明符&。如下：

void fnTest()
{
int nTest1 = 23;

auto f = [&nTest1] (int a, int b) -> int
{
cout << "In functor before change nTest=" << nTest1 << endl;    //nTest1=23333
nTest1 = 131;
cout << "In functor after change nTest=" << nTest1 << endl;     // nTest1 = 131
return a + b + 42 + nTest1;
};

nTest1 = 23333;

cout << f(4, 3) << "&nTest1=" << nTest1 << endl;        //nTest1 = 23333
}

这个结果有点诡异，按说传递引用并进行修改以后，结果应该会对外部的局部变量产生影响，但这里并没有。反汇编看看什么情况：

00C23C01 C7 45 E8 17 00 00 00 mov         dword ptr [nTest1],17h
48:
49:     auto f = [&nTest1] (int a, int b) -> int
50:     {
51:         cout << "In functor before change nTest=" << nTest1 << endl;    //nTest1=23333
52:         nTest1 = 131;
53:         cout << "In functor after change nTest=" << nTest1 << endl;     // nTest1 = 131
54:         return a + b + 42 + nTest1;
55:     };
00C23C08 8D 45 E8             lea         eax,[nTest1]
00C23C0B 50                   push        eax
00C23C0C 8D 4D DC             lea         ecx,[f]
00C23C0F E8 0C E3 FF FF       call        <lambda_856c2229edde1846e85c005aaea059db>::<lambda_856c2229edde1846e85c005aaea059db> (0C21F20h)
56:
57:     nTest1 = 23333;
00C23C14 C7 45 E8 25 5B 00 00 mov         dword ptr [nTest1],5B25h
58:
59:     cout << f(4, 3) << "&nTest1=" << nTest1 << endl;        //nTest1 = 23333
00C23C1B 8B F4                mov         esi,esp
00C23C1D 68 DC 10 C2 00       push        offset std::endl<char,std::char_traits<char> > (0C210DCh)
58:
59:     cout << f(4, 3) << "&nTest1=" << nTest1 << endl;        //nTest1 = 23333
00C23C22 8B FC                mov         edi,esp
00C23C24 8B 45 E8             mov         eax,dword ptr [nTest1]
00C23C27 50                   push        eax
00C23C28 68 90 BB C2 00       push        offset string "&nTest1=" (0C2BB90h)
00C23C2D 6A 03                push        3
00C23C2F 6A 04                push        4
00C23C31 8D 4D DC             lea         ecx,[f]
00C23C34 E8 B7 02 00 00       call        <lambda_856c2229edde1846e85c005aaea059db>::operator() (0C23EF0h)

可以看到，lambda表达式匿名对象在构造函数中依然传入了nTest的地址（引用），下面看看构造函数：

; 省略一大堆现场保护代码
00C21F40 89 4D F8             mov         dword ptr [this],ecx
00C21F43 8B 45 F8             mov         eax,dword ptr [this]
00C21F46 8B 4D 08             mov         ecx,dword ptr [<nTest1>]
00C21F49 89 08                mov         dword ptr [eax],ecx
00C21F4B 8B 45 F8             mov         eax,dword ptr [this]
; 省略一大堆现场恢复代码

哈哈，注意这句 mov dword ptr [eax],ecx ，由于构造函数调用时，传入的是nTest1的地址，这里渠道地址后，直接存到了成员对象中。而在其operator()函数中，取出nTest1值的代码如下：

00C23F1A 8B 45 F8             mov         eax,dword ptr [this]
00C23F1D 8B 08                mov         ecx,dword ptr [eax]
00C23F1F 8B FC                mov         edi,esp
00C23F21 8B 11                mov         edx,dword ptr [ecx]

可以看到，是通过成员变量中的指针完成的。此外再看看对其赋值的操作：

52:         nTest1 = 131;
00C23F55 8B 45 F8             mov         eax,dword ptr [this]
00C23F58 8B 08                mov         ecx,dword ptr [eax]
00C23F5A C7 01 83 00 00 00    mov         dword ptr [ecx],83h

也是用指针完成的。其实这时nTest1的值已经被修改了。但是为什么cout打印出来还是2333呢？这其实是由于cout时从由向左压入参数的结果，再仔细看看：

00C23C24 8B 45 E8             mov         eax,dword ptr [nTest1]
00C23C27 50                   push        eax                   ; eax=2333
00C23C28 68 90 BB C2 00       push        offset string "&nTest1=" (0C2BB90h)
00C23C2D 6A 03                push        3
00C23C2F 6A 04                push        4

注意前两句，已将调用lambda对象前的值压栈了，则传入的值当然是2333。但在cout语句执行后查看nTest1的值，其实已经被修改为131了。

隐式捕获

上面的值捕获和引用捕获都需要我们在捕获列表中显示列出Lambda表达式中使用的外部变量。除此之外，我们还可以让编译器根据函数体中的代码来推断需要捕获哪些变量，这种方式称之为隐式捕获。隐式捕获有两种方式，分别是[=]和[&]。[=]表示以值捕获的方式捕获外部变量，[&]表示以引用捕获的方式捕获外部变量。

下面将所有捕获方式总结如下：


捕获形式	说明
[]	不捕获任何外部变量
[变量名, …]	默认以值得形式捕获指定的多个外部变量（用逗号分隔），如果引用捕获，需要显示声明（使用&说明符）
[this]	以值的形式捕获this指针
[=]	以值的形式捕获所有外部变量
[&]	以引用形式捕获所有外部变量
[=, &x]	变量x以引用形式捕获，其余变量以传值形式捕获
[&, x]	变量x以值的形式捕获，其余变量以引用形式捕获

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： lambda c++ c++11 lambda原理反汇编分析

相关文章推荐

新的分享

章节导航