“为什么引用跟指针如此相像?它们的区别是什么?”
01
提出问题
学习编程时,最伤脑的活是什么?答案很可能是背诵语法规则,尤其在不了解底层工作原理的情况下,似乎只有不断的强化记忆,才能让自己接受这些半人半神的语法规则。
那你有没有发现有些语法规则,它们的作用看上去非常相似,但在编写起来又大相径庭的情况呢?其中最典型的例子,或许就是:引用和指针了。引用和指针到底有什么差异?这可能是一个在语法层面,颇难解释清楚的问题,但在CPU眼里,却根本就不是一个问题,因为它们几乎没有任何区别。
02
代码分析
话不多说,打开Compiler Explorer,让我们编写一个简单的函数func1,定义一个指针变量p,用来改变变量a的值;然后我们再编写一个相似的引用版本的函数func2,如图所示。
老规矩,不要理会每条CPU指令的具体含义,我们只比较两个函数对应的CPU指令差异,如你所见,它们完全相同!
我们定义的引用变量r,实际上是在定义一个指向变量a的指针p;我们对引用变量r的读、写操作,实际上是指针变量p的*读、*写操作。
或许,你还不能接受这个现实,没有关系。让我们再写一个简单的传指针的函数func3;再写一个传引用的函数func4;最后作一个call函数的调用,如图所示。
如你所见,不仅两个函数func3、func4的函数体,而且它们的调用部分,对应的CPU指令都完全相同!
所以,跟有指针参数的函数func3一样,在函数体func4里面,改变变量r的值,一样会影响到函数外变量a的值。至于指针参数,是如何改变函数外变量a的值?可以参看“CPU眼里的参数传递”。
至此,结论已经非常明显了,在CPU眼里,指针和我们常见的“左值引用”几乎没有任何区别。“左值引用”可以做到的事情,用指针都可以做到。如果非要说说它们的区别的话,我想主要集中在下面这些语法规则的层面:
1. 引用显得更加简洁,特别是在读、写的时候,不需要像指针那样,加上*号操作。
2. 指针可以被赋值成NULL:int*p = NULL,但引用不行:int &r = NULL。
3. 指针可以随时改变它所指向的变量;而引用不能随意改变它所引用的变量,否则,会被视为重新定义了一个已经存在的引用变量。
4. 指针存在“指针的指针”;而引用则不存在“引用的引用”。
03
总结
1. “引用变量”也是变量,在底层实现上面,跟“指针变量”完全相同。
2. “引用变量”也被称为某个变量的别名,这非常形象。但似乎很难解释为什么在函数func4中改变r的值,会同时改变外部变量a的值。但如果你把“引用”当作“指针”看待的话,这个问题就迎刃而解了。
04
热点问题
Q1:C语言也支持:“引用”这个语法规则吗?
A1:不支持的,引用这个语法规则,是在C++才被支持的。但如你所见,所有的引用,都可以通过指针来达到相同的效果;但引用在使用起来,会简洁不少,更像是一个语法糖。
Q2:引用的本质是“指针常量”吗?例如:int* const p = &a
A2:非常精彩的总结!我相信这是引用语法的真实意图。
Q3:C++里面还有“右值引用”、“万能引用”、“引用折叠”,它们也能用指针来解释吗?
A3:非常好的问题!用本书提供的方法,你会发现“右值引用”,在底层实现上,跟“左值引用”和指针,也非常相似。同样的方法,你也可以分析出:“万能引用”、“引用折叠”的底层实现。
当然,穷举所有的C++语法规则,并不是本书的特点。除杂去冗,化繁为简,才是本书的意义所在。
C++的语法规则复杂、繁琐,而且还在不断变化、扩展;但底层实现,则相对简单、统一。就像全球有上亿个不同功能的网站,但后台可能都在做一类事情:增、删、改、查。
今天在LLVM的支持下,我们很容易创造出一种新的编程语言或语法规则,但底层的机器汇编部分,可能完全不用调整。
我相信未来还会有更多的语言诞生、C++还会涌现更多的语法规则,但只要我们理解底层的实现逻辑,“眼中有代码,心中有指令”,就能快速领悟语法精髓,以不变应万变。
05
更多知识
基础不牢,地动山摇!如果喜欢阿布这种解读方式,希望更加系统学习这些编程知识的话,也可以考虑看看由阿布亲自编写,并有多位微软大佬联袂推荐的新书《CPU眼里的C/C++》
<script type="text/javascript" src="//mp.toutiao.com/mp/agw/mass_profit/pc_product_promotions_js?item_id=7334608284530098703"></script>