数据库设计

设计范式

设计数据库时，需要遵循的一些规矩.要遵循后边的范式要求，必须先遵循前边的所有范式要求

设计关系数据库时，遵循不同的规范要求，设计出合理的关系型数据库，这些不同的规范要求被称为不同的范式，各种范式呈递次规范，越高的范式数据厍冗余越小。

函数依赖：A-->B如果通过 A 属性（属性组）的值可以唯一确定 B 属性的值.则称 B 依赖于 A
例如：学号 --> 姓名
完全函数依赖：A-->B如果 A 是一个属性组，则 B 属性值得确定需要依赖 A 属性组中所有的属性值
例如：（学号，课程名称）--> 分数
部分函数依赖：A-->B如果 A 是一个属性组，则 B 属性值确定只需要依赖于 A 属性组中的某一些值即可
例如：（学号，课程名称）--> 姓名
传递函数依赖：A-->B, B-->C 通过 A 属性（属性组）的值，可以确定唯一 B 属性的值
例如：学号-->系名，系名-->系主任
如果在在一张表中，一个属性或属性组，被其他所有属性所完全依赖，则称这个属性（属性值）为该表的码
例如：表中码为：（学号，课程名称）
- 主属性：码(主码)属性组中的所有属性
- 非主属性：除了码(主码)属性组中的属性

候选码和主码都是关系型数据库中的概念，用于唯一标识表中的每条记录。它们之间的区别在于：

总之，候选码是必备条件，它能够唯一标识表中每条记录；而主码是在候选码基础上选择的最小候选码，它扮演了关系型数据库体系结构中重要的角色。

对于关系 $R(U)$ , U 为所有码的集合，如果 $W$ 是主码， $R$ 上存在 $X->Z$ ， $Z$ 不是主属性且 $X\subset W$ ，那么这明显不符合 2NF 🤓。

方法： 需要把 $R$ 分为 $R_1(U-Z)$ 和 $R_2(XZ)$ ，即把 $X->Z$ 作为新表 $R_2$ ，主码是X， $R_1$ 中去掉Z，主码仍然为W，X作为外键。那么仍然可以通过联表得到原来的数据（无损的）

重复操作直到所有的表不能再分。

对于每个非平凡 FD(函数依赖)，或者左边是超键，或者右边仅由主属性构成，那么它就是 3NF。

•᷄ࡇ•᷅ 白话就是所有非主属性都没有依赖于其他主属性(不传递依赖于主属性)

方法： 先求出最小依赖集(就是所有依赖的集合)，例： $F_m=\{B->E, DG->C, AG->B, B->D\}$

按左部相等的原则分组，再把左右部合并，例：
- $\{B->DE\} => R_1=\{B, D, E\}$
- $\{DG->C\} => R_2=\{D, G, C\}$
- $\{AG->B\} => R_3=\{A, G, B\}$
查看新分组中的关系集中有没有包含关系，如果有，合并
查看新分组的属性集中是否包含码，如果没有(说明该分解是有损的)，新建一个分组把主码放进去。

对于每个非平凡 FD(函数依赖)，左边是超键，那么它就是 BCNF。

todo |･ω･｀)