Skip to main content

集合

在国内数学教育体系中,集合 是继 之后,第一个具备 运算关系 的抽象数学结构。

简单来说,我们将首次接触全新的数学对象——集合。

本章涉及的概念较多,但都比较基础,在其他板块会经常用到。

参考资料

概念

定义

《人教版高中数学·必修一》:一般地,我们把研究对象统称为 元素(element),把一些元素组成的总体叫做 集合(set),简称为

理解

什么是集合?这是一个可以在网上提问并获得许多优质答案的问题。

我们无需深入研究,只需知道 集合具有某种特定性质事物的总体

集合中的每个事物称为 元素

这些都可以视为集合,集合的元素可以是各种不同的类型:

集合元素类型集合元素类型
小于 1010 的正偶数喜欢看书的学生
所有等腰三角形图形你人生中喝过的饮料种类物品
一个集合所有的子集集合你在学校做过的事情事件

一个集合可以包含 任意数量 的元素,可以是 00 个,也可以是无穷多个。

记号

集合通常用 A,B,CA,B,C 等大写字母表示,而集合中的元素通常用 a,b,ca,b,c 等小写字母表示。

数集

在数学中,通常研究的元素是 ,这样的集合称为 数集

小学和初中阶段,我们学习了许多类型的数,这些相同类型的数可以组成一些数集:

数集记号示例描述(所有……的集合)
自然数N\mathbb{N}0,1,2,3,101000,1,2,3,10^{100}所有自然数的集合
整数Z\mathbb{Z}3,1,0,2,6-3,-1,0,2,6所有整数的集合
有理数Q\mathbb{Q}2,0,9.16,12,37-2,0,9.16,\frac{1}{2},-\frac{3}{7}有理数(可以表示为分数的数)
实数R\mathbb{R}0,19,2,π,e0,\frac{1}{9},\sqrt{2},\pi,e实数(包含有理数和无理数)
复数C\mathbb{C}0,3,i,23i0,3,i,2-\sqrt{3}i复数(包含实数和虚数)
NZQRC\mathbb{N}\subseteq\mathbb{Z}\subseteq\mathbb{Q}\subseteq\mathbb{R}\subseteq\mathbb{C}

这些数集符号还可以添加角标,通过 ++- 来区分正负。

例如,R+\mathbb{R}^+ 表示正实数,R\mathbb{R}^- 表示负实数,Z\mathbb{Z}^- 表示负整数。

而正整数通常表示为 N+\mathbb{N}^+N\mathbb{N}^*,也可以写作 N1\mathbb{N}_1N>0\mathbb{N}_{>0}Z+\mathbb{Z}^+ 等。

tip

这些约定俗成的特殊数集,在电脑排版时通常使用黑板粗体(BB,Blackboard Bold)。

这种表示法最早起源于数学家在黑板上书写时,为了区分普通字母,会在字母上多加一笔。

性质

普通的集合有 33 个常见性质:确定性互异性无序性

确定性

确定性:集合中的所有元素都是明确的。

每个元素要么属于这个集合,要么不属于这个集合。

不允许出现“高个子的人”这样的模糊情况。

互异性

互异性:集合中任意两个元素互不相同。

因为集合代表事物的总体,而相同的元素即为同一事物。

无序性

无序性:集合中的元素没有顺序。

因为集合表示事物的总体,元素的顺序变化不会影响集合的性质。

表示

属于

如果 aa 是集合 AA 的元素,则称 aa 属于 集合 AA,记为:

aAa\in A

同样地,如果 aa 不是集合 AA 的元素,则称 aa 不属于 集合 AA,记为:

aAa\notin A

集合一般由花括号 {}\set{\dots} 包裹。

除了用 自然语言 描述集合,还有 22 种常见的表示方法:

列举法

列举集合中 所有或部分元素,用逗号(,,)分隔。

Example
  • “小于 1010 的正偶数”的集合可以表示为 {2,4,6,8}\set{2,4,6,8}
  • 自然数集可以表示为 {0,1,2,3,}\set{0,1,2,3,\dots}
  • “地球上的四大洋”的集合可以表示为 {太平洋,大西洋,印度洋,北冰洋}\set{\text{太平洋},\text{大西洋},\text{印度洋},\text{北冰洋}}

当集合中的元素数量很多或无穷多时,列举法并不方便准确,因此需要更通用的方法。

描述法

列举集合中 元素满足的条件,用竖线(|)、冒号(::)或分号(;;)分隔。

Example
  • “大于等于 55 的实数”的集合可以表示为 {xR属于实数x5大于等于5}\set{\underbrace{x\in\mathbb{R}}_{\text{属于实数}}|\underbrace{x\ge 5}_{\text{大于等于} 5}}
  • “所有奇数”的集合可以表示为 {xZ属于整数x=2k+1,kZ是奇数}\set{\underbrace{x\in\mathbb{Z}}_{\text{属于整数}}|\underbrace{x=2k+1,k\in\mathbb{Z}}_{\text{是奇数}}}
  • “你人生中喝过的饮料种类”的集合可以表示为 {x饮料种类属于饮料种类你喝过 x是你喝过的}\set{\underbrace{x\in\text{饮料种类}}_{\text{属于饮料种类}}|\underbrace{\text{你喝过 x}}_{\text{是你喝过的}}}

省略

在不产生歧义的情况下,我们可以省略一些常见的条件:

{xRx5}    {xx5}\set{x\in\mathbb{R}|x\ge 5}\iff\set{x|x\ge 5}

关系

相等

构成两个集合 A,BA,B 的元素是一样的,我们就称这两个集合是 相等 的,记为:

A=BA=B

子集 & 超集

如果集合 AA 中任意一个元素都是集合 BB 中的元素,即 AA 包含于 BB,则称 AABB子集,记为:

ABA\subseteq B

也可以说 BB 包含 AA,则称 BBAA超集,记为:

BAB\supseteq A
tip

符号 \supseteq 本身表示“超集符号”,但在高中阶段,很少涉及超集的概念。

因此,可以将其视为“子集符号”的反向表示。

推论

任何集合 AA 都同时是它自己的子集和超集,因为它的每个元素都属于它自己,符合定义:

AA,AAA\subseteq A,A\supseteq A

如果 BB 包含 AAAA 包含 BB,即互相包含,则 AABB 相等:

AB,AB    A=BA\subseteq B,A\supseteq B\iff A=B

真子集 & 真超集

有时我们研究 BB 的子集 AA 时,不希望包含集合本身,即排除 A=BA=B 的情况,因此定义了 真子集,记为:

ABA\subsetneqq B

同理,还可以定义 真超集,记为:

BAB\subsetneqq A

真子集符号 \subsetneqq 和真超集符号 \supsetneqq 也常写作 \subsetneq\supsetneq

如果集合 AA 是集合 BB 的真子集,则 AA 一定是 BB 的子集,超集同理。

tip

集合之间的关系可以类比为数之间的关系:

  • 子集(\subseteq)对应小于等于(\le
  • 超集(\supseteq)对应大于等于(\ge
  • 真子集(\subsetneqq)对应小于(<<
  • 真超集(\supsetneqq)对应大于(>>

空集 & 全集

如果集合 AA 不含任何元素,则称为 空集,记为:

A=A=\varnothing

空集是任何集合的子集,因为空集内的每个元素(即没有元素)都属于任何集合,符合定义。

如果一个集合不是空集,则称为 非空集

如果一个集合含有所研究问题中涉及的所有元素,则称为 全集,通常记为 UU

运算

两个集合之间可以进行一些运算。

并集

包含集合 AABB 中所有元素的集合 CC 定义为 并集,记为:

AB=C={xxAxB}A\cup B=C=\set{x|x\in A\text{或}x\in B}

tip

并集的英文是 "Union Set",因此并集符号 \cup 类似于字母 U;而另一个 \cap 就是交集符号。

交集

集合 AABB 中共有元素的集合 CC 定义为 交集,记为:

AB=C={xxAxB}A\cap B=C=\set{x|x\in A\text{且}x\in B}

补集

对于全集 UU,除集合 AA 以外的其他元素的集合 BB 定义为 补集,记为:

UA=B={xxA}\complement_U A=B=\set{x|x\notin A}

tip

补集符号 UA\complement_U A 也常写作 AA^{\complement}A\overline{A}UAU \setminus A

在国内高中教材中,补集通常使用 UA\complement_U A,因为这种写法比较明确。

相比之下,AA^{\complement}A\overline{A} 没有 标明全集,容易产生歧义。

在数学中,更常用的写法是 UAU\setminus A,它表示 差集,即属于 UU 但不属于 AA 的元素。

Example

已知三个集合:A={1,2,3}A=\set{1,2,3}B={3,4,5}B=\set{3,4,5}U={1,2,3,4,5,6}U=\set{1,2,3,4,5,6}

AB={1,2,3,4,5}A\cup B=\set{1,2,3,4,5}AB={3}A\cap B=\set{3}UA={4,5,6}\complement_U A=\set{4,5,6}

区间

在研究 函数 时常会用到 区间 的概念,区间就是表示一段 连续实数 集合的简洁形式。

我们要表示 aba\sim ba<ba<b)这段实数,包含 端点 a,ba,b 的是 闭区间,用 中括号 表示;不包含的是 开区间,用 小括号 表示。

根据两个端点 a,ba,b 的取值可以分为 2×2=42\times 2=4 种区间:

区间等价集合名称
[a,b][a,b]{xaxb}\set{x\mid a\le x\le b}闭区间
(a,b)(a,b){xa<x<b}\set{x\mid a<x<b}开区间
[a,b)[a,b){xax<b}\set{x\mid a\le x<b}左闭右开区间
(a,b](a,b]{xa<xb}\set{x\mid a<x\le b}左开右闭区间

如果区间的某个端点没有限制,可以用 无穷大 \infty 表示,分为 正无穷大 ++\infty负无穷大 -\infty

用无穷大表示的端点都要表示为 开区间,因为任何数都不能等于无穷大。

区间等价集合区间等价集合
[a,+)[a,+\infty){xxa}\set{x\mid x\ge a}(a,+)(a,+\infty){xx>a}\set{x\mid x>a}
(,b](-\infty,b]{xxb}\set{x\mid x\le b}(,b)(-\infty,b){xx<b}\set{x\mid x<b}
(,+)(-\infty,+\infty)R\mathbb{R}(,c)(c,+)(-\infty,c)\cup(c,+\infty){xxc}\set{x\mid x\ne c}

计数

详见 计数原理

元素个数

一个集合 AA 中的元素个数可以用 card(A)\operatorname{card}(A) 表示,也可以用更简洁的符号 A|A| 表示。

card(A)=A\operatorname{card}(A)=|A|
tip

这里的 "card" 并不是指“卡片”,而是单词 "cardinality"(基数)的缩写。

子集个数

如果集合 AA 的元素个数为 n2n\ge 2,即:

A=n|A|=n

那么,集合 AA 有多少个子集呢?

不难发现,集合 AA 中的每个元素都有 22 种选择:选或不选。

对于这 nn 个元素,每个都有 22 种选择,根据 乘法原理,总共有 2n2^n 种可能。

因此,集合 AA 有:

  • 2n2^n 个子集。
  • 2n12^n-1 个真子集(排除 集合本身)。
  • 2n12^n-1 个非空子集(排除 空集)。
  • 2n22^n-2 个非空真子集(排除 集合本身空集

容斥原理

对于任意两个集合 A,BA,B,有:

AB=A+BAB|A\cup B|=|A|+|B|-|A\cap B|

要计算 AABB 并集的元素个数,通常情况下,我们会将 A|A|B|B| 直接相加。

但由于交集 ABA\cap B 中的元素被重复计算,因此需要减去 AB|A\cap B|

Example

在一个班级中,有 2020 人喜欢语文,有 2525 人喜欢数学,有 1010 人同时喜欢语文和数学。

求至少喜欢一门(语文或数学)的人有多少?

设集合 AA 表示喜欢语文的人,集合 BB 表示喜欢数学的人,则:

A=20,B=25,AB=10|A|=20,|B|=25,|A\cap B|=10

根据容斥原理:

AB=A+BAB=20+2510=35|A\cup B|=|A|+|B|-|A\cap B|=20+25-10=35

因此至少喜欢一门的人有 2525 个。

同理,也可以写出三个集合的容斥关系:

ABC=A+B+CABACBC+ABC|A\cup B\cup C|=|A|+|B|+|C|-|A\cap B|-|A\cap C|-|B\cap C|+|A\cap B\cap C|