在国内数学教育体系中,集合 是继 数 之后,第一个具备 运算 和 关系 的抽象数学结构。
简单来说,我们将首次接触全新的数学对象——集合。
本章涉及的概念较多,但都比较基础,在其他板块会经常用到。
《人教版高中数学·必修一》:一般地,我们把研究对象统称为 元素(element),把一些元素组成的总体叫做 集合(set),简称为 集。
什么是集合?这是一个可以在网上提问并获得许多优质答案的问题。
我们无需深入研究,只需知道 集合 是 具有某种特定性质 的 事物的总体。
集合中的每个事物称为 元素。
这些都可以视为集合,集合的元素可以是各种不同的类型:
集合 | 元素类型 | 集合 | 元素类型 |
---|
小于 10 的正偶数 | 数 | 喜欢看书的学生 | 人 |
所有等腰三角形 | 图形 | 你人生中喝过的饮料种类 | 物品 |
一个集合所有的子集 | 集合 | 你在学校做过的事情 | 事件 |
一个集合可以包含 任意数量 的元素,可以是 0 个,也可以是无穷多个。
集合通常用 A,B,C 等大写字母表示,而集合中的元素通常用 a,b,c 等小写字母表示。
在数学中,通常研究的元素是 数,这样的集合称为 数集。
小学和初中阶段,我们学习了许多类型的数,这些相同类型的数可以组成一些数集:
数集 | 记号 | 示例 | 描述(所有……的集合) |
---|
自然数 | N | 0,1,2,3,10100 | 所有自然数的集合 |
整数 | Z | −3,−1,0,2,6 | 所有整数的集合 |
有理数 | Q | −2,0,9.16,21,−73 | 有理数(可以表示为分数的数) |
实数 | R | 0,91,2,π,e | 实数(包含有理数和无理数) |
复数 | C | 0,3,i,2−3i | 复数(包含实数和虚数) |
N⊆Z⊆Q⊆R⊆C

这些数集符号还可以添加角标,通过 + 和 − 来区分正负。
例如,R+ 表示正实数,R− 表示负实数,Z− 表示负整数。
而正整数通常表示为 N+ 或 N∗,也可以写作 N1、N>0、Z+ 等。
这些约定俗成的特殊数集,在电脑排版时通常使用黑板粗体(BB,Blackboard Bold)。
这种表示法最早起源于数学家在黑板上书写时,为了区分普通字母,会在字母上多加一笔。
普通的集合有 3 个常见性质:确定性、互异性 和 无序性。
确定性:集合中的所有元素都是明确的。
每个元素要么属于这个集合,要么不属于这个集合。
不允许出现“高个子的人”这样的模糊情况。
互异性:集合中任意两个元素互不相同。
因为集合代表事物的总体,而相同的元素即为同一事物。
无序性:集合中的元素没有顺序。
因为集合表示事物的总体,元素的顺序变化不会影响集合的性质。
如果 a 是集合 A 的元素,则称 a 属于 集合 A,记为:
a∈A
同样地,如果 a 不是集合 A 的元素,则称 a 不属于 集合 A,记为:
a∈/A
集合一般由花括号 {…} 包裹。
除了用 自然语言 描述集合,还有 2 种常见的表示方法:
列举集合中 所有或部分元素,用逗号(,)分隔。
- “小于 10 的正偶数”的集合可以表示为 {2,4,6,8}。
- 自然数集可以表示为 {0,1,2,3,…}。
- “地球上的四大洋”的集合可以表示为 {太平洋,大西洋,印度洋,北冰洋}。
当集合中的元素数量很多或无穷多时,列举法并不方便准确,因此需要更通用的方法。
列举集合中 元素满足的条件,用竖线(∣)、冒号(:)或分号(;)分隔。
- “大于等于 5 的实数”的集合可以表示为 {属于实数x∈R∣大于等于5x≥5}。
- “所有奇数”的集合可以表示为 {属于整数x∈Z∣是奇数x=2k+1,k∈Z}。
- “你人生中喝过的饮料种类”的集合可以表示为 {属于饮料种类x∈饮料种类∣是你喝过的你喝过 x}。
在不产生歧义的情况下,我们可以省略一些常见的条件:
{x∈R∣x≥5}⟺{x∣x≥5}
构成两个集合 A,B 的元素是一样的,我们就称这两个集合是 相等 的,记为:
A=B
如果集合 A 中任意一个元素都是集合 B 中的元素,即 A 包含于 B,则称 A 是 B 的 子集,记为:
A⊆B
也可以说 B 包含 A,则称 B 是 A 的 超集,记为:
B⊇A
符号 ⊇ 本身表示“超集符号”,但在高中阶段,很少涉及超集的概念。
因此,可以将其视为“子集符号”的反向表示。
任何集合 A 都同时是它自己的子集和超集,因为它的每个元素都属于它自己,符合定义:
A⊆A,A⊇A
如果 B 包含 A 且 A 包含 B,即互相包含,则 A 和 B 相等:
A⊆B,A⊇B⟺A=B
有时我们研究 B 的子集 A 时,不希望包含集合本身,即排除 A=B 的情况,因此定义了 真子集,记为:
A⫋B
同理,还可以定义 真超集,记为:
B⫋A
真子集符号 ⫋ 和真超集符号 ⫌ 也常写作 ⊊ 和 ⊋。
如果集合 A 是集合 B 的真子集,则 A 一定是 B 的子集,超集同理。
集合之间的关系可以类比为数之间的关系:
- 子集(⊆)对应小于等于(≤)
- 超集(⊇)对应大于等于(≥)
- 真子集(⫋)对应小于(<)
- 真超集(⫌)对应大于(>)
如果集合 A 不含任何元素,则称为 空集,记为:
A=∅
空集是任何集合的子集,因为空集内的每个元素(即没有元素)都属于任何集合,符合定义。
如果一个集合不是空集,则称为 非空集。
如果一个集合含有所研究问题中涉及的所有元素,则称为 全集,通常记为 U。
两个集合之间可以进行一些运算。
包含集合 A 和 B 中所有元素的集合 C 定义为 并集,记为:
A∪B=C={x∣x∈A或x∈B}

并集的英文是 "Union Set",因此并集符号 ∪ 类似于字母 U;而另一个 ∩ 就是交集符号。
集合 A 和 B 中共有元素的集合 C 定义为 交集,记为:
A∩B=C={x∣x∈A且x∈B}

对于全集 U,除集合 A 以外的其他元素的集合 B 定义为 补集,记为:
∁UA=B={x∣x∈/A}

补集符号 ∁UA 也常写作 A∁、A 或 U∖A。
在国内高中教材中,补集通常使用 ∁UA,因为这种写法比较明确。
相比之下,A∁ 和 A 没有 标明全集,容易产生歧义。
在数学中,更常用的写法是 U∖A,它表示 差集,即属于 U 但不属于 A 的元素。
已知三个集合:A={1,2,3},B={3,4,5},U={1,2,3,4,5,6}。
则 A∪B={1,2,3,4,5},A∩B={3},∁UA={4,5,6}。
在研究 函数 时常会用到 区间 的概念,区间就是表示一段 连续实数 集合的简洁形式。
我们要表示 a∼b(a<b)这段实数,包含 端点 a,b 的是 闭区间,用 中括号 表示;不包含的是 开区间,用 小括号 表示。
根据两个端点 a,b 的取值可以分为 2×2=4 种区间:
区间 | 等价集合 | 名称 |
---|
[a,b] | {x∣a≤x≤b} | 闭区间 |
(a,b) | {x∣a<x<b} | 开区间 |
[a,b) | {x∣a≤x<b} | 左闭右开区间 |
(a,b] | {x∣a<x≤b} | 左开右闭区间 |
如果区间的某个端点没有限制,可以用 无穷大 ∞ 表示,分为 正无穷大 +∞ 和 负无穷大 −∞。
用无穷大表示的端点都要表示为 开区间,因为任何数都不能等于无穷大。
区间 | 等价集合 | 区间 | 等价集合 |
---|
[a,+∞) | {x∣x≥a} | (a,+∞) | {x∣x>a} |
(−∞,b] | {x∣x≤b} | (−∞,b) | {x∣x<b} |
(−∞,+∞) | R | (−∞,c)∪(c,+∞) | {x∣x=c} |
详见 计数原理
一个集合 A 中的元素个数可以用 card(A) 表示,也可以用更简洁的符号 ∣A∣ 表示。
card(A)=∣A∣
这里的 "card" 并不是指“卡片”,而是单词 "cardinality"(基数)的缩写。
如果集合 A 的元素个数为 n≥2,即:
∣A∣=n
那么,集合 A 有多少个子集呢?
不难发现,集合 A 中的每个元素都有 2 种选择:选或不选。
对于这 n 个元素,每个都有 2 种选择,根据 乘法原理,总共有 2n 种可能。
因此,集合 A 有:
- 2n 个子集。
- 2n−1 个真子集(排除 集合本身)。
- 2n−1 个非空子集(排除 空集)。
- 2n−2 个非空真子集(排除 集合本身 和 空集)
对于任意两个集合 A,B,有:
∣A∪B∣=∣A∣+∣B∣−∣A∩B∣
要计算 A 和 B 并集的元素个数,通常情况下,我们会将 ∣A∣ 和 ∣B∣ 直接相加。
但由于交集 A∩B 中的元素被重复计算,因此需要减去 ∣A∩B∣。
在一个班级中,有 20 人喜欢语文,有 25 人喜欢数学,有 10 人同时喜欢语文和数学。
求至少喜欢一门(语文或数学)的人有多少?
设集合 A 表示喜欢语文的人,集合 B 表示喜欢数学的人,则:
∣A∣=20,∣B∣=25,∣A∩B∣=10根据容斥原理:
∣A∪B∣=∣A∣+∣B∣−∣A∩B∣=20+25−10=35因此至少喜欢一门的人有 25 个。
同理,也可以写出三个集合的容斥关系:
∣A∪B∪C∣=∣A∣+∣B∣+∣C∣−∣A∩B∣−∣A∩C∣−∣B∩C∣+∣A∩B∩C∣
