CPP-Week1

(This picture comes from: VTuberized Logos)

参考教程：01 程序的内存模型 - 内存四区 - 代码区 - 哔哩哔哩 bilibili（黑马程序员）

Tip

[3] 想写出好程序，不必对 C++ 掌握到巨细靡遗。
[4] 把力气用在编程技术上，别死磕语言特性。

——1 基础知识・C++ 导览第二版简体中文版

Lesson1 内存分区

1.1 C++ 内存分区简介

C 语言的内存分配参见对应笔记 Lesson20 4.2 和 10

C++ 的内存分区与 C 语言的大体相同，只是一些分区有所调整：

代码区 (Code Segment)

存放函数体的二进制代码。内存由操作系统进行管理。

全局/静态区 (Global/Static Storage)

存放全局变量、静态变量以及常量，C 语言中常量区、data 段和 bss 段的综合

栈区 (Stack)

存放函数的参数值、局部变量等。内存由编译器自动分配与释放。

堆区 (Heap)
内存由程序员分配与释放。若程序员没有释放，程序结束时由操作系统自动回收。

不同区域存放的数据具有不同的生命周期和处理方式，有助于提高编程的灵活性。同时减少读取时的操作开销，提高效率。

为什么需要内存分区

程序需要以不同方式对待它的不同内存块。例如，有些进程应当执行它的代码，而不是执行它的数据；有些进程应当写入数据，而不是修改它的代码；有些进程需要和其他进程共享一部分内存，但不是全部内存；有些内存是只读的，但有些内存可读可写。

——Operating Systems Lecture Notes Lecture 15 Segments

语言标准还是具体实现

有的人^[1] 依照 C++ 标准认为 C/C++ 中的内存分区没有堆和栈，数据是在内存的任意位置中存储的，变量只有自动/动态存储期^[2] 之分。我们在内存分区中常用的堆和栈概念是由特定的操作系统（具体地说，是 Linux 系统）实现的，而其他平台可能使用的是其他模式。

如果不和编译器或者硬件驱动打交道，我们不必关心这些问题。大部分操作系统都使用相似的内存分区方案。特别对于二进制逆向，我们在 IDA 中看到的可不是所谓 “自动存储期” 之类，而是 .text 等实际的内存分区。

这个问题还有一个更现实的回答：在教学与工作中，人们已经接受了内存分区的说法。“基于语言标准的理论” 可能无法被接受，因为其对一般开发带来了不必要的负担。

Stroustrup 的 Programing Principles and Practice Using C++ 中有提到可以将 “自动内存” 称为 “栈内存”，而 “动态内存” 可称为 “堆内存” 或 “动态内存”。另外，在该书中提出的内存分区是（这就偏向语言规则而不是具体实现了）：

（据 Programing Principles and Practice Using C++, 3rd Edition 重绘）

new运算符在一块叫自由存储（free store，也叫动态内存）或堆的区域里分配内存。分配在自由存储上的对象，与其被创建的作用域无关，而是会一直 “存活” 下去，直到用delete运算符把它销毁。

定义在<array>中的array是个给定类型的定长序列，其中的元素数量要在编译期指定。因此，array的元素可以分配在栈上，在对象里或者在静态存储区。

——2 用户定义类型・C++ 导览第二版简体中文版 & 13 实用功能・C++ 导览第二版简体中文版

C 不指定任何特定的内存布局，因此需要你提出一个特定的 C 语言实现

——Is this the layout of memory in C? - Stack Overflow

通常来讲这些问题的答案和一般 C++ 程序员没什么关系，除非是编译器 / 驱动作者。

C++ 的内存布局并没有被明确定义。但是，大部分现代操作系统在一定程度上使用相似的（内存）系统，基于权限划分内存段。

——How is the memory layout of a C/C++ program? - Stack Overflow

如果你是指字面上的 “堆栈”，事实是全文检索 C 标准文档根本没有 stack 和 heap 这两个词。

如果你是想讨论是否有这个层次的抽象，那大多数语言都已经抽象掉了这两个概念，包括 C。

如果你在讨论是否存在这一层次的底层实现，基本没有什么主流操作系统跑得掉。

—— 在语言中比如 c 为什么要设计堆栈呢？解决了什么问题？ - 知乎

任何语言除了汇编是不会有内存分区的概念的，内存本身就是物理层面的东西，所以 C++ 中才会有生命周期的抽象概念。堆栈的内存分区实际是系统层面的，体现了系统在程序运行时如何调用运行等等过程，和实际的程序运行分不开，作为写 C / C++ 的人来说了解这些肯定是有利的，便于准确定位一些 bug 的位置。

——【辟谣】C++ 根本没有堆和栈！的评论区

1.2 程序运行前的内存分区

代码编译后生成了 .exe 可执行文件。在执行前，该程序的内存分为两个区域：

代码区
- 存放 CPU 执行的机器指令
- 代码区的内存是共享的。一个体现是对于频繁被执行的程序，在内存中只需要存一份代码。
  
  Note
  
  程序需要有限度地共享数据。比如：所有进程应使用同一个编译器；两个进程间可能想要共享一些数据。
  
  ——Operating Systems Lecture Notes Lecture 15 Segments
- 代码区的数据是只读的，以防止程序意外修改了自己的指令。
全局区
- 存放全局变量和静态变量
  
  Note
  
  全局变量在所有函数（包括 main 函数）之外声明，通常在代码的开始处。它们在整个程序的执行期间都存在，并且在程序的任何地方都可以被访问和修改。
  
  ——【新手解答 4】深入探索 C 语言：全局变量声明、全局函数声明 + 宏定义 - 阿里云开发者社区）
  
  静态变量使用static关键字修饰，在程序刚开始运行时就完成初始化，也是唯一的一次初始化。
  
  ——c++ 静态变量（static） - USTC 丶 ZCC - 博客园
  
  C 语言中的静态变量在函数多次调用时仍能保留它的值。它保留了上一次函数执行时的值，这个值在下一次函数执行时不会被初始化掉。
  
  ——Static Variables in C - GeeksforGeeks
  
  静态变量和全局变量的不同之处在于，静态变量仅限于当前库文件访问，而全局变量是可以被其他库文件访问的（在其他库文件中添加 extern 关键字）。
- 还包含常量区，存放字符串常量和其他常量（如全局常量）
- 该区域的内存在程序结束后由操作系统释放

演示：

#include <cstdio>

int a_g = 10;
const int b_g = 10;
static int c_g = 10;

int main(void) {
	int a_l = 10;
	const int b_l = 10;
	static int c_l = 10;
	printf("全局变量a_g的地址是：%p\n", & a_g);
	printf("全局常量b_g的地址是：%p\n", & b_g);
	printf("全局静态变量c_g的地址是：%p\n", & c_g);
	printf("字符串常量'Hello'的地址是：%p\n", & "Hello");
	printf("局部变量a_l的地址是：%p\n", & a_l);
	printf("局部常量b_l的地址是：%p\n", & b_l);
	printf("局部静态变量c_l的地址是：%p\n", & c_l);
}

全局变量a_g的地址是：00007FF6C32BD000
全局常量b_g的地址是：00007FF6C32BABB0
全局静态变量c_g的地址是：00007FF6C32BD004
字符串常量'Hello'的地址是：00007FF6C32BAD4C
局部变量a_l的地址是：000000A11A51F644
局部常量b_l的地址是：000000A11A51F664
局部静态变量c_l的地址是：00007FF6C32BD008

由该演示可知，全局变/常量、静态变量和字符串常量存储在同一个内存段，而局部变/常量存储在另一个内存段。

1.3 程序运行时的内存分区

执行时，程序还有以下两个内存分区：

栈区
- 存放函数的参数值、局部变量等。
- 内存由编译器自动分配释放。
利用指针访问存储在栈区的变量时，需要注意变量的作用域。比如：
1
2
3
4
5
6
7
8
9
10
11
12
#include <cstdio>

int* func(void) {
int a = 10;
return &a;
}

int main(void) {
int* p = func();
printf("%d\n", *p);
printf("%d\n", *p);
}
1
2
3
10
-858993460
func所占用的内存在函数执行完毕后即被释放，也就是说，赋值时func返回的地址指向的内存位置上不是10，而是一个随机数了，因此第二个printf输出了一个非常奇怪的数。

在 VS2022 上，编译器会提示warning：
1
警告 C4172 返回局部变量的地址或临时 : a
“临时” 是什么东西

临时变量是在程序执行过程中临时存储数据的变量。它们在程序中被创建并用于存储临时的数据，一旦不再需要，它们就会被销毁。临时变量通常用于在程序中进行一些计算、操作或存储中间结果。（C++ 中产生临时变量的常见场景总结与建议 - CSDN 博客）

临时变量大多数情况下是算数表达式的结果。（C++ 临时变量）

那第一个printf确实输出了正确的数值，为什么？这其实是编译器的功劳。编译器认为你可能误用了局部变量，所以会为你保留一次a的初始值。

另外，函数的形参也存储在栈区。

堆区

内存由程序员分配释放。若程序员不释放，程序结束时由操作系统回收。
C++ 使用new操作符在堆区开辟动态内存。开辟的内存需要用指针接收并访问。

演示：

#include <cstdio>

int* func() {
	int* p = new int(10);
	return p;
}

int main(void) {
	int* p = func();
	int a = 20;
	printf("%p\n", &a);
	printf("%d %p %p\n", *p, p, &p);
	printf("%d %p %p\n", *p, p, &p);
	printf("%d\n", *p);
}

00000070928FF604
10 0000026005F44A00 00000070928FF5E8
10 0000026005F44A00 00000070928FF5E8
10

我们使用new申请了一块大小为int宽度的内存，并将其初始化为 10。如果这部分内存放在栈上，那我们第二次通过指针访问这个值时应该不会输出 10，但是它输出了 10，说明操作系统是不会动这块内存的。

另外，指针接收到的地址是存储在栈区的。

1.3.SP 对象

什么是对象 (Object)？

以下是一些关于对象的表述：

Quote

对象是一个在内存中占据了一定空间的有类型的东西。因而，它必然是与计算机内存这个物理上具体存在的设备关联在一起的一个事物。

——3. 值与对象 — Understanding Modern C++ 1 文档

对象代表了一段可以存储值的内存区域。变量的本质就是有名字（识别符）的对象。

宽泛地讲，对象是任何一个未命名的实例，比如变量和函数。但在 C++ 中，函数不属于对象。

——1.3 — Introduction to objects and variables – Learn C++

总的来讲，对象就是一块可以存储值的内存区域。

对于一个对象，我们主要看它的四个要素：

类型

类型决定了对象在内存中存储的字节大小与二进制的判读方式
标识符

标识符是数字、下划线、大小写拉丁字母（和以\u及\U转义字符）指定的。

程序员通过标识符访问标识符代表的内存对象。

在 C++ 中，直接访问内存是很难受的，所以我们需要通过对象来间接访问内存。我们只需要专注于怎么存储并检索对象，而不需要关心这些对象放在内存的哪个具体位置，因为编译器代劳了。

虽然 C++ 中的对象可以没有名字，但我们大多仍会使用标识符来命名对象。有名字的对象叫作变量。为对象命名可以让我们再次使用它们。

——1.3 — Introduction to objects and variables – Learn C++
地址

对象按照语言标准和 ABI (Application Binary Interface) 存储在内存中，我们可以通过&运算符来获取对象的内存存储地址。
值

值用来初始化对象。

值的本质

单位块的数据称为一个值，例如字母、数据和文本。

——1.3 — Introduction to objects and variables – Learn C++

简单说，值是一个纯粹的数学抽象概念，比如数字 10 ，或者字符 'a' , 或者布尔值 false ，等等。它们完全不需要依赖于计算机或者内存而存在，就只是一个纯粹的值：不需要存储到内存，当然也就不可修改。

那么 1+2 呢？这是一个表达式，但这个表达式的求值结果也是一个值。因而，这是一个值类别的表达式。而数字 10 同样是一个表达式，其求值的结果毫无疑问也是一个值 —— 它自身。因而，在这个角度， 1+2 和数字 10 ，从性质上没有任何区别，都是值类别的表达式。

——3. 值与对象 — Understanding Modern C++ 1 文档

CPP Reference 对对象的描述

An object, in C++, has

size (can be determined with sizeof); 内存大小
alignment requirement (can be determined with alignof); 对齐要求
storage duration (automatic, static, dynamic, thread-local); 存储期
lifetime (bounded by storage duration or temporary); 生存期
type; 类型
value (which may be indeterminate, e.g. for default-initialized non-class types); 值
optionally, a name. 名字（可选）

The following entities are not objects: value, reference, function, enumerator, type, non-static class member, template, class or function template specialization, namespace, parameter pack, and this.

这些不是对象：值、引用、函数，等等。

——Object - cppreference.com

1.4 `new`操作符和`delete`操作符

new操作符用于在堆上动态分配内存。

new操作符在<new>头文件中定义，不过，通常情况下，标准库已经包含了这个头文件，所以你不需要显式地包含它。但是，为了确保代码的可读性和规范性，建议显式地包含<new>头文件。

new操作符的语法为：

1	new type[size](initializer)

这里的一些参数是可选的。下面介绍分情况下new操作符的用法：

只分配一个对象的内存：
1
type* pointer = new type;
分配一个对象的内存，并将其初始化为initializer：
1
type* pointer = new type(initializer);
分配包含size个对象的数组的内存：
1
type* pointer = new type[size];

参考：new 运算符 (C++) | Microsoft Learn；

C++ 内存管理库 | 菜鸟教程

动态分配的内存会一直保持分配状态，直到它被显式释放或直到程序结束。

delete 操作符用于释放之前使用 new 分配的内存。

delete和new一样在<new>头文件中定义，也包含在标准库中，不需要再引用<new>。

接下来介绍delete的用法：

释放单个对象的内存：
1
delete pointer;
释放数组的内存：
1
delete pointer[];

动态内存释放完后，就不能再访问，否则程序无法正常退出：

#include <cstdio>

int* func() {
	int* p = new int(10);
	return p;
}


int main(void) {
	int* p = func();
	printf("%d\n", *p);
	delete p;
	printf("%d\n", *p);
}

1	警告 C6001 使用未初始化的内存“p”。行13

1
2
3

10

(进程 28332)已退出，代码为 -1073741819 (0xc0000005)。

Tip

你可能更熟悉 C 语言中的malloc()和free()。但在 C++ 中，我们最好入乡随俗，用new和delete作为替代。

[5] 不要使用malloc()。new操作符可谓青出于蓝而胜于蓝。别仅仅用 “裸” 的new和delete替换malloc()和free()。

在 C 里，void*(在malloc()的声明中出现) 可在赋值操作中作为右值操作数，或者用在任何指针类型变量的初始化中；这种做法在 C++ 里行不通。在两种语言里，都要把malloc()的结果转化到正确的类型。如果你只用 C++ ，请避免使用malloc()。

——16 历史及兼容性・C++ 导览第二版简体中文版

Lesson2 引用

2.1 引用的定义

引用变量 (Reference) 是一个别名 (Alias, or alternate name)，它是某个已存在变量的另一个名字。一旦把引用初始化为某个变量，就可以使用该引用名称或变量名称来指向变量。

你可以把别名看作一个人的绰号。只要人们接受了这个绰号，那么你就可以用这个绰号指代对应的那个人了。

引用变量的声明：

1
2
3

type& ref = var_name;
//或
type &ref = var_name;

Tip

在声明引用时，现代 C++ 程序员更倾向于将&放在类型旁边（而不是引用变量名称旁边），因为这样程序员可以更清楚地认识到自己声明的是一个引用定义，而不是一个含有 "&" 字符的某类型变量。

——12.3 — Lvalue references – Learn C++

Note

在Reference declaration - cppreference.com 中提到，该声明对应的是左值引用 (Lvalue Reference)，而 C++11 标准还引入了右值引用 (Rvalue Reference)，用的是&&。

Warning

這裡type&的&不要用「取址」的概念去解釋，雖然看起來有點關係，但觀念真的很容易亂掉。宣告時的&，在觀念不熟的情況下，請先當作另外一回事。

——【C++ 觀念理解 #1】C++ call by value, call by address (pointer), call by reference 總和比較整理，不想要再搞不懂了!!! (updated: 2022/8/19) - 嗡嗡的隨手筆記

我们可以通过引用来访问并修改变量的内容：

#include <cstdio>

int main (void)
{
   // 声明简单的变量
   int i;
   double d;

   // 声明引用变量
   int& r = i;
   double& s = d;

   i = 5;
   printf("Value of i : %d", i);
   printf("Value of i reference : %d", r);
   printf("Value of i reference plus 1 : %d", r + 1);

   d = 11.7;
   printf("Value of d : %f", d);
   printf("Value of d reference : %f", s);
   printf("Value of d reference plus 1 : %d", s + 1);

   return 0;
}

Value of i : 5
Value of i reference : 5
Value of i reference plus 1 : 6
Value of d : 11.700000
Value of d reference : 11.700000
Value of d reference plus 1 : 12.700000

2.2 引用声明的注意事项

引用必须被初始化为指向一个合法的对象或函数。

Note

因为引用具有对象别名的语义，因而没有绑定到任何对象的引用，从语义上就不成立。

由于必须通过初始化将引用绑定到某一个对象，因而从语义上，不存在空引用的概念。

——1. 引用 — Understanding Modern C++ 1 文档
一旦创建了一个引用，就不能再让它引用另一个对象。

Note

你无法将引用者和被引用者分离开来。

和指针不同，一旦引用被绑定到一个对象上，它就无法被 “重定向” 到另外一个对象上。引用不是一个独立的对象，它没有这样的身份。获取一个引用的地址，会返回给你被引用者的地址。记住：引用者就是被引用者，所以改变引用者也会改变被引用者的状态。

——References, C++ FAQ
Warning
注意不要将赋值误认为是更改引用，比如：
1
2
3
4
int a = 10;
int& b = a;
int c = 20;
b = c; // 这是赋值
a = c和b = c是等效的。好比给舍友带饭，不论叫绰号还是叫全名都可以把饭交给对方。
1
&b = c; // 这是更改引用
VS2022 的 IntelliSense 会告诉你：
1
错误(活动) E0137 表达式必须是可修改的左值
这段代码也不能通过编译。
在大多数情况下，引用只会绑定到与引用类型匹配的对象。如果你将引用绑定到与其引用类型不匹配的对象，编译器将尝试隐式地将对象转换为引用类型，然后将引用绑定到该对象。
引用必须指向一个合法的内存（在栈区和堆区的内存）。指向一个不再存在的对象的引用被称为悬空引用 (Dangling Reference)。访问悬空引用会导致未定义的行为。

引用本身不是对象，因此引用本身一般不占存储单元。

Warning

引用不是对象。引用不占用内存，除非编译器认为有必要，例如非静态的引用类型数据成员会增加类的大小，因为类要存储地址。

由于引用不是对象，所以没有引用数组、引用指针和引用的引用：

1
2
3

int& a[3]; // error
int&* p;   // error
int& &r;   // error

——Reference declaration - cppreference.com

不能建立引用数组（数组中的元素不能是引用），但是可以建立数组的引用和数组元素的引用：

int& arr[3] = {2,3,4};//声明"引用数组"是错误的，arr并没有自己的空间来存放后面的值
//--------------------------------
int arr[3] = {2,3,4};//arr是数组变量名，int[3]是类型
int (&ref)[3] = arr;//正确，&ref是引用名，int[3]是类型
int& p = arr[3];//可行

—— 不能建立引用数组，数组中的元素不能是引用

2.3 引用作为函数参数

在 C 语言中，我们介绍了按值传递和按地址传递两种传参方式。下面我们介绍 C++ 提供的第三种传参方式：按引用传递 (Pass by Reference, or Call by Reference)。

「call by reference」是 C++ 才有的「更方便」的東西，但也因為這個「方便」，導致觀念如果不穩，就會像我一樣把這個「方便」的功能，變成「符號意義大混亂」。因此，如果這三個你現在很混亂，建議先從「call by value, call by address (pointer)」搞清楚再說!!!

——【C++ 觀念理解 #1】C++ call by value, call by address (pointer), call by reference 總和比較整理，不想要再搞不懂了!!! (updated: 2022/8/19) - 嗡嗡的隨手筆記

在按引用传递方法中，实际参数的内存地址（引用）被传递给函数，允许直接访问和修改原始值。实际参数和形式参数指向相同的内存地址。在函数中对参数所做的任何更改都会直接反映在函数外的原始值中。这和按地址传递的作用相似，但相比指针作为参数，引用作为参数要更加 “自然”。

#include <cstdio>

void swap(int& a, int& b);

int main(void){
    int a, b;
    scanf("%d %d", &a, &b);
    swap(a, b); // 引用作为函数参数
    printf("%d %d", a, b);
}

void swap(int& a, int& b){
    int t = a;
    a = b;
    b = t;
}

input:

2 3

output:

3 2

2.4 引用作为函数返回值

C++ 的函数可以返回一个引用，方式与返回一个指针类似。

#include <cstdio>

int& test() {
    static int a = 10; // 静态变量
    return a;
}

int main(void) {
    int& q = test();
    printf("%d\n", q);
    printf("%d\n", q);
}

1
2
3

10
10

这里有几个注意事项：

不要返回局部变量的引用，或者说，不要返回一个内存已被释放的变量的引用。

#include <cstdio>

int& test() {
    int a = 10; // 局部变量
    return a;
}

int main(void) {
    int& q = test();
    printf("%d\n", q); // 第一次读取，编译器进行保留
    printf("%d\n", q); // 第二次读取，保留失效，程序试图读取引用指向的内存区域
}

1
2
3

10
-858993460

这和我们之前讲的错误原因是一样的，引用指向了一个本不存在的、混沌的内存位置。

本节开头的示例使用 static 修饰局部变量，扩大了变量的作用域，使得变量的内存不会在函数执行完成后被释放。

Warning

请记住一个引用仅仅是一个名字，一个实际存在的对象的名字。无论何时只要你看到一个引用的声明，你应该立刻问自己它是什么东西的另一个名字，因为它必定是某物的另一个名字。

——Item 21: 当你必须返回一个对象时不要试图返回一个引用 | Effective C++

绝不要返回指向栈中的局部对象的指针或引用，或返回指向堆中对象的引用 ^[3]，或返回指向静态局部变量对象的指针或引用

—— 笔记 - 关于《Effective C++》中的 55 个做法 | GuKaifeng’s Blog

使用引用返回的对象，其生存期必须大于函数的作用域，否则会造成垂悬引用。永远不要使用引用返回非静态的本地变量或者临时变量。

——12.12 — Return by reference and return by address – Learn C++

若函数返回引用，则函数的调用可以作为左值，进行赋值操作。
1
2
3
4
5
6
7
8
9
10
11
12
13
#include <cstdio>

int& test() {
static int a = 10; // 静态变量
return a;
}

int main(void) {
int& q = test();
printf("%d\n", q);
test() = 20;
printf("%d\n", q);
}
1
2
3
10
20
函数test实际上是返回了a本身，我们是对变量原名进行操作。

Tip

若函数返回了一个非静态的引用，调用者可以通过引用修改返回值。

——12.12 — Return by reference and return by address – Learn C++

2.5 引用的本质

应用层面，引用不是指针

引用 i 是 main 函数中 x 的别名。换句话说，i 就是 x—— 不是 x 的指针，不是 x 的副本，而是 x 本身。你对 i 的操作同样会反映到 x 上，反之亦然。这也包括取地址操作，&i 和 &x 的值是相同的。作为一名程序员，你就应该这么理解引用。

重要提醒：尽管引用经常在底层汇编中表示为地址，也请不要认为引用只是指针的一种奇怪模样。

——References, C++ FAQ

这一段描述是用来稳定认知的，因为从不同角度来看引用和指针的关系，得到的结论是矛盾的。

引用在 C++ 内部的实现就是一个指针常量。下面结合实例讲解：

#include <cstdio>

// 发现是引用，转换为int* const ref = &var
void func(int& ref) {
    ref = 100; // ref是引用，转换为*ref = 100
}

int main() {
    int a = 10;

    // 自动转换为int* const ref = &a; 指针常量的指向不可更改，所以引用也不可更改
    int& ref = a;
    ref = 20; // 发现是引用，自动转换为*ref = 20

    printf("a: %d\n", a);
    printf("ref: %d\n", ref);

    func(a);

    printf("a: %d\n", a);
    printf("ref: %d\n", ref);
}

a: 20
ref: 20
a: 100
ref: 100

Note

引用可以被视作一个可以自动间接访问的指针常量（不是常量指针！）。编译器会自动使用*间接访问。

——Pointers vs References in C++ - GeeksforGeeks

从底层来看，对象 x 的引用 i 通常等于 x 的机器地址。但当程序员写下 i++ 时，编译器会生成 x 的递增（x++），而 x 的地址信息没有变化。

一个 C 程序员会理解为 C 风格的传地址操作，只是语法变了，& 从调用者 i 换给了 x，而 * 被消灭了。

换句话说，C 程序员会认为引用 i 是 (*p) 的宏，其中 p 是指向 x 的指针。

——References, C++ FAQ

既然引用和指针在底层上是相同的，那我们是不是可以用引用来替代指针呢？答案是：很多情况下，可行！

以下的论述展示了引用与指针的差别。

	引用	指针
重指定	引用不能重新指定变量	指针可以重新指定变量
内存地址	与原始变量共享同一地址	有自己的不同的地址
工作方式	直接指向另一个变量	存储变量地址
Null 值	没有 null 值	可以赋值为 null 值
函数参数	按值传递方式	按引用传递方式

（来源：Pointers vs References in C++ - GeeksforGeeks）

引用	指针
声明时必须初始化	声明时可以不初始化
无法重新指定为另一个对象	可以重新指定为不同对象
不可以是 null	可以是 null
自动解引用	必须显性手动解引用

（来源：Reference vs Pointer in C++: 6 Key Differences to Know）

或者看看这个 Stack Overflow 问题：c++ - What are the differences between a pointer variable and a reference variable? - Stack Overflow 以及它的相关问题。

总的来讲，C++ 的引用比指针少了灵活性，多了安全性。写起来，引用也比指针更简洁。

ISO CPP 也倾向于使用引用：

能用引用就用引用，得用指针就用指针。

注：老派的 C 程序员有时不喜欢引用，因为引用语义在调用者代码中并不明显。但在拥有一些 C++ 经验后，他们会很快地意识到这是信息隐藏的一种形式，是一种技术资产而非负债。

——References, C++ FAQ

~~不喜欢写引用的程序员，你们好呀。ldx 什么时候爆金币？~~

内存安全

C++ 要比 C 更为 “安全”，因为 C 的指针可以不加检查地随意访问内存，而 C++ 引入的引用则限制了指针的随意访问行为。但 C++ 仍然不是一个严格内存安全 (Memory Safe) 的语言，例如我们依旧可以通过引用来访问非法的内存区域，以及数组仍然可以越界访问。

这并不代表 C++ 不重视内存安全，相反，经过多年演化，严格遵守标准和最佳实践的代码已经是足够安全的了，而近年来，社区内也存在要求引入严格安全检查机制的声音。

但 C++ 的设计理念决定了它难以成为严格安全的语言，因为它 “不试图强迫人做什么”（《C++ 语言的设计和演化》）。

…… 程序员总能找到某种方法，绕过他们觉得无法接受的规则和限制。语言应该支持范围较广泛的合法的设计和编程风格，而不应该强迫程序员采纳唯一的写法。……

……“可能的错误” 在 C++ 里并不是一个错误。例如，写一个能允许歧义使用的生命本身并不是错误，错误的是那些存在歧义性的使用，而不是这个错误的可能性。……

——《C++ 语言的设计和演化》

计算机中的引用

In computer programming, a reference is a value that enables a program to indirectly access a particular datum(数据), such as a variable’s value or a record, in the computer’s memory or in some other storage device. The reference is said to refer to the datum, and accessing the datum is called dereferencing the reference. A reference is distinct from the datum itself.

A reference is an abstract data type and may be implemented in many ways. Typically, a reference refers to data stored in memory on a given system, and its internal value is the memory address of the data, i.e. a reference is implemented as a pointer. For this reason a reference is often said to “point to” the data. Other implementations include an offset (difference) between the datum’s address and some fixed “base” address, an index, or identifier used in a lookup operation into an array or table, an operating system handle, a physical address on a storage device, or a network address such as a URL.

——Reference (computer science) - Wikipedia

2.6 常量引用

常量引用主要用于修饰形参，防止误操作。

#include <cstdio>

int main(void){
    //int& ref = 10; // 引用指向常数区，不是一块合法的内存
    const int& ref = 10; // 加上const，编译器将其转换为int temp = 10; const int& ref = temp;
    //ref = 20; // 加入const之后变为只读，不可修改
}

如果我们用const修饰一个引用变量，那么这个引用将能够绑定到其他种类的参数（例如左值和右值常量）。

大部分情况下，我们都不希望函数修改参数，因此优先按const引用传参而不是按 non-const 引用传参。

——12.6 — Pass by const lvalue reference – Learn C++

例如接下来的程序：

#include <cstdio>

// print data
void showValue(int& val){

    val = 1000; // assign a value by mistake
    printf("val = %d\n", val);
}
int main(void){
    int a;

    /*Some code...*/

    a = 100;
    showValue(a);
    printf("a = %d\n", a);
}

函数showValue的用途本来只是打印数据，但是有人粗心地给本地变量val指定了初始值。

如果我们不使用const修饰形参呢？

1
2
3

val = 1000
a = 1000

好嘛，原来的数据也被污染成函数中指定的初始值了。这可不行，我们不能让函数修改我们的数据。

为函数形参加上const试试：

void showValue(const int& val){

    //val = 1000; // cannot assign a value
    printf("val = %d\n", val);
}

1
2
3

val = 100
a = 100

很好！函数正确执行了我们的预期操作。

ISO CPP 给出了三种参数传递方式的选择建议：

如果你需要改变传进来的对象，那么按引用传递和按指针传递都是可以的。如果允许传入 “非对象”（如一个空指针），那么按指针传递更容易理解。

如果你不希望改变传进来的对象，并且这个对象很大，按常量引用传递。

其他情况，建议按值传递。

——References, C++ FAQ

Lesson3 函数进阶

3.1 函数的默认参数

在 C++ 中，函数的参数表中的形参是可以有默认值的。比如：

1	int func(int a, int b = 10);

在使用默认参数 (Default Argument) 时，我们需要注意以下几点：

调用函数时，任何明确提供的参数必须按参数表顺序（从左往右）输入（不能跳过具有默认值的参数）。对于有默认值的参数，用户调用时未提供数据则按默认值传入；有提供数据则按用户输入传入。

void print(int a = 20, double d = 10.0){
    printf("%d\n", a);
    printf("%f\n", b);
}

int main(void)
{
    print();        // okay: both arguments defaulted
    print(60); 		// okay: d defaults to 10.0
    print(10.0);    // error: does not match above function (cannot skip argument for a)

    return 0;
}

如果一个参数被赋予默认参数，那么所有后续的参数（右侧的）也必须是默认参数。因此，建议在函数末尾定义默认参数。
1
2
//void print(int x=10, int y); // not allowed
void print(int x = 10, int y = 10);// right

一旦声明，默认参数就不能在同一源文件中重新声明。这意味着对于同时具有声明和函数定义的函数，默认参数可以在声明或函数定义中声明，但不能同时声明。

#include <cstdio>

void print(int x, int y=4); // forward declaration

void print(int x, int y=4) // compile error: redefinition of default argument
{
    printf("%d\n", x);
    printf("%d\n", y);
}

默认参数必须在源文件中开头声明后才能使用：

#include <cstdio>

void print(int x, int y); // forward declaration, no default argument

int main()
{
    print(3); // compile error: default argument for y hasn't been defined yet

    return 0;
}

void print(int x, int y=4)
{
    printf("%d\n", x);
    printf("%d\n", y);
}

Tip

我们建议在函数声明而非定义时设置默认参数。

——11.5 — Default arguments – Learn C++

建议：如果有多个默认参数，则最左侧的参数应该是用户最可能明确设置的参数。

使用默认参数的好处

在函数调用中，有些参数并不常用，因此默认值可以满足要求。默认参数可以突出对于函数具有重大意义的参数。

——Default Arguments | Microsoft Learn

Default arguments are an excellent option when a function needs a value that has a reasonable default value, but for which you want to let the caller override (覆盖) if they wish.

——11.5 — Default arguments – Learn C++

需要时，用户也可以覆盖默认参数。

3.2 函数的占位参数

在 C++ 中，函数的参数列表可以有占位参数 (Placeholder Argument)，只使用类型名而不提供变量名，用以占位。比如：

1	int func(int a, int);//后一个参数就是占位参数

调用函数时，未指定数据的情况下，占位参数必须提供。一般情况下，在函数体内部无法使用占位参数，因为没有可以访问其位置的事物（变量名）。

#include <cstdio>

int print(int a, int){
    printf("%d", a);
    //printf("%d", ?); //WTF?
}

int main(void){
    //print(10); //Intellisense: 函数调用中的参数太少
    print(10, 10);
}

占位参数也有默认值。此时可按照默认参数规则，不提供占位参数：

int print(int a, int = 10){
    printf("%d", a);
    //printf("%d", ?); //WTF?
}

int main(void){
    print(10);// okay
}

占位参数常见的用途包括：

与旧代码兼容：当修改函数签名时，为了保持与旧代码的兼容性，可以保留不再使用的参数。
占位：为将来可能增加的参数预留位置。
匹配特定函数签名：在某些情况下，可能需要一个特定的函数签名，比如使用回调函数时。此时可以通过占位参数来满足签名的要求。

（C 函数占位参数介绍_c 占位参数 - CSDN 博客）

3.3 函数重载

3.3.1 函数重载的概念

11.1 — Introduction to function overloading – Learn C++

考虑这个函数：

1
2
3

int add(int x, int y){
    return x + y;
}

add这个函数用来计算两个整数的和。但如果我们需要计算两个浮点数的和呢？我们不可能直接使用add，因为参数表的类型根本不匹配！于是我们又写了一个函数：

1
2
3

double addDouble(double x, double y){
    return x + y;
}

挺好的，只要你能在写了成百上千行代码再放了几天假期后继续工作时还能记起来整数加法用add、浮点数加法用addDouble就行。

Note

然而，为了以防万一，你得确定一个连续的函数命名标准，定义参数类型不同的相似函数，记忆这些函数的名字，并且能够调用正确的那个。

那么三数加法呢？为每个函数命名很快会变得繁琐。

——11.1 — Introduction to function overloading – Learn C++

所以，既然都是加法，为什么还要分成整数加法和浮点数加法呢？能不能统一成一个加法函数呢？

C++ 提供了一种解决方法，我们称为函数重载 (Function Overloading)。函数重载允许我们创建多个名称相同的函数，只要每个同名函数具有不同的参数类型（或者函数可以通过其他方式区分）。在相同的作用域中共享名称的每个函数都称为重载函数（有时简称为重载）。

重载函数有如下条件：

同一作用域
函数名称相同
函数参数表不同：类型不同、数量不同、(类型) 顺序不同

Tip

函数可以重载，只要每个重载函数都可以被编译器区分。如果一个重载函数无法被区分，编译器会报错。

下列表格展示了什么样的重载函数可以被区分：

函数属性	能否用于区分	注释
参数格式	可以
参数类型	可以	`typedef`、类型别名和 `const` 修饰符除外，但包括省略号 `...`（作为通配符，接受任意变量）
返回类型	不可以

——11.1 — Introduction to function overloading – Learn C++&11.2 — Function overload differentiation – Learn C++

下面进行演示：

int add(int x, int y) // integer version
{
    return x + y;
}

/*
// not an overloading
int add(int a, int b)
{
	return a + b;
}
*/

double add(double x, double y) // floating point version
{
    return x + y;
}

double add(double x, int y)// hybrid version
{
	return x + y;
}

double add(int x, double y)// the overloading of hybrid version above
{
    return x + y;
}

Note

int operate (int a, int b)
{
  return (a*b);
}

double operate (double a, double b)
{
  return (a/b);
}

一般具有相同名称的函数应该具有相近的功能, 但这个例子说明完全可以不这么做。两个重载函数的定义完全不同，本质上是两个不同的函数，只是恰好有相同的名字罢了。

——Overloads and templates - cplusplus.com

，但 C++ 也允许定义功能不同的重载函数（毕竟返回值不作为确认重载的条件）。

为了编译一个重载函数的调用，编译器需要进行重载解析 (Overload resolution) 以确定调用的是哪个重载函数。简单来说，与调用时函数参数表最为接近的重载将被调用：

void f(long);
void f(float);

f(0L); // calls f(long)
f(0); // error: ambiguous overload. The complier cannot tell which is better

（Overload resolution - cppreference.com）

对于有多个参数的重载，编译器会选择与函数调用时提供的参数表匹配得最好的那个重载：

#include <cstdio>

void print(char, int)
{
	printf("a\n");
}

void print(char, double)
{
	printf("b\n");
}

void print(char, float)
{
	printf("c\n");
}

int main()
{
	print('x', 'a');
	return 0;
}

main函数中调用的print将匹配到void print(char, int)。因为函数调用时，第一个参数'x'均可以匹配到三个重载的第一个参数char；对于第二个参数'a'，由于字符类型是一个特殊的整数，所以它和int的匹配度是最好的，剩余两个需要转换。所以编译器选择调用匹配度相对最好的void print(char, int)

Tip

所选函数必须至少在一个参数上提供比所有其他候选函数更好的匹配，而在所有其他参数上则不能更差。

——11.3 — Function overload resolution and ambiguous matches – Learn C++

3.3.2 引用作为重载参数

使用引用作为参数的函数也可以重载，但有几个注意事项需要注意：

编译器无法区分变量及其引用。

int add(int a, int b){
    return a + b;
}

/*
// error: same argument list
int add(int& a, int& b){
return a + b;
}
*/

重载函数通过不同初始化方式的参数类型区分。因此，给定类型及其引用对于重载而言是相同的，因为它们的初始化相同。声明这样的两个函数会报错。

——Function Overloading | Microsoft Learn

编译器可以区分一般引用和由const修饰的引用。

int add(int& a, int& b){
    return a + b;
}

// okay: the two have different argument list
int add(const int& a, const int& b){
    return a + b;
}

3.3.3 默认参数能不能用于重载？

我们先不去调用函数：

#include <cstdio>

void print(int a, int = 10) {
	printf("%d\n", a);
}

void print(int a) {
	printf("%d\n", a);
}

int main(void) {
	//print(10);
	return 0;
}

编译通过！在编译器看来，这两个函数属于重载。

那么我们调用一下函数试试？

#include <cstdio>

void print(int a, int = 10) {
	printf("%d\n", a);
}

void print(int a) {
	printf("%d\n", a);
}

int main(void) {
	print(10);
	return 0;
}

好了，VS2022 的 Intellisense 很快啊，输出了一个错误信息：

1	错误(活动) E0308 有多个重载函数 "print" 实例与参数列表匹配 12

编译器也提示：

error C2668: “print”: 对重载函数的调用不明确
可能是“void print(int)”
或“void print(int,int)”
尝试匹配参数列表“(int)”时

当要重载的函数出现默认参数时，可能造成二义性，导致报错，需要避免。

Warning

调用时，默认参数不能作为区分重载的条件。仅有默认参数不同的两个函数将被认为是重复定义，而不是重载。

——Function Overloading | Microsoft Learn

如果有多个同优先级的匹配可能，编译器会停止匹配，并报告关于模糊匹配的错误。（如正文提供的编译器错误信息）

——11.3 — Function overload resolution and ambiguous matches – Learn C++

【辟谣】C++ 根本没有堆和栈！- 哔哩哔哩 - bilibili，注意煽动性标题和评论区中作者与观众间的割裂互动。一个比较好的观看建议是：“只能说初学者建议不管，研究底层的请记住这是操作系统的东西，而程序并不和操作系统绑定。” ↩︎
存储期 - 谷雨同学的 C++ 教程，如你需要了解存储期概念，请参考这篇文章。 ↩︎
虽然堆区不存在局部变量的被动销毁问题，但如果被返回的函数的引用只是作为一个临时变量出现，而没有将其赋值给一个实际的变量，那么就可能造成这个引用所指向的空间（由new分配）无法释放的情况（由于没有具体的变量名，故无法用delete手动释放该内存），从而造成内存泄漏。因此应当避免这种情况的发生（02 - 这一次得弄懂 C++ 中的引用 - 知乎） ↩︎

CPP-Week1

Lesson1 内存分区

1.1 C++ 内存分区简介

1.2 程序运行前的内存分区

1.3 程序运行时的内存分区

1.3.SP 对象

1.4 new操作符和delete操作符

Lesson2 引用

2.1 引用的定义

2.2 引用声明的注意事项

2.3 引用作为函数参数

2.4 引用作为函数返回值

2.5 引用的本质

2.6 常量引用

Lesson3 函数进阶

3.1 函数的默认参数

3.2 函数的占位参数

3.3 函数重载

3.3.1 函数重载的概念

3.3.2 引用作为重载参数

3.3.3 默认参数能不能用于重载？

1.4 `new`操作符和`delete`操作符