1、数据库结构设计的步骤
需求分析:全面了解产品设计的存储需求
逻辑设计:设计数据的逻辑存储结构
物理设计:根据所用的数据库特点进行表结构设计
关系型数据库:Oracle、SQLServer、MySQL、postgresSQL
非关系型数据库:mongo、Redis、Hadoop
存储引擎:Innodb
维护优化:根据实际情况对索引、存储结构等进行优化
2、数据库设计范式(设计出没有数据冗余和数据维护异常的数据库结构)
数据库设计第一范式:
1、数据库表中的所有字段都只具有单一属性
2、单一属性的列是由基本的数据类型所构成的
3、设计出来的表都是简单的二维表
数据库设计第二范式:
要求一个表中只具有一个业务主键,也就是说符合第二范式的表中不能存在非主键列对只对部分主键的依赖关系
数据库设计第三范式:
指每一个非主属性既不部分依赖于也不传递依赖于业务主键,也就是在第二范式的基础上消除了非主键属性对主键的传递依赖
3、需求分析及逻辑设计(重点)
4、需求分析及逻辑设计-反范式化设计
什么叫做反范式化设计?
反范式化是针对范式化而言的,在前面介绍了数据库设计的范式,所谓的反范式化就是为了性能和读取效率的考虑而适当的对数据库设计范式的要求进行违反,而允许存在少量的数据冗余,换句话来说,反范式化就是使用空间来换取时间。
注意:不能完全按照范式化的要求进行设计,考虑以后如何使用表
4、范式化设计和反范式化设计的优缺点
范式化设计的优点:
1、可以尽量减少数据冗余
2、范式化的更新操作比反范式化更快
3、范式化的表通常比反范式化更小
范式化设计的缺点:
1、对于查询需要对多个表进行关联
2、更难进行索引优化
反范式化设计的优点:
1、可以减少表的关联
2、可以更好的进行索引优化
反范式化设计的缺点:
1、存在数据冗余及数据维护异常
2、对数据的修改需要更多的成本
5、物理设计
根据所选择的关系型数据库的特点对逻辑模型进行存储结构设计
物理设计涉及的内容:
1、定义数据库、表及字段的命名规范
a、数据库、表及字段的命名要遵守可读性原则
b、数据库、表及字段的命名要遵守表意性原则
c、数据库、表及字段的命名要遵守长名原则
2、选择合适的存储引擎
3、为表中的字段选择合适的数据类型
4、建立数据库结构
6、物理设计-数据类型的选择
为表中的字段选择合适的数据类型:
当一个列可以选择多种数据类型时,应该优先考虑数字类型,其次是日期或二进制类型,最后是字符类型。对于相同级别的数据类型,应该优先选择占用空间小的数据类型。
如何选择正确的整数类型:
如何选择正确的实数类型:
如何选择varchar和char类型:
varchar类型的存储特点:
a、varchar用于存储变长字符串,只占用必要的存储空间。
b、列的最大长度小于255则只占用一个额外字节用于记录字符串长度
c、列的最大长度大于255则要占用两个额外字节用于记录字符串长度
varchar长度的选择问题:
a、使用最小的符合需求的长度
b、varchar(5)和varchar(200)存储MySQL字符串性能不同
varchar适用场景:
a、字符串列的最大长度比平均长度大很多
b、字符串列很少被更新
c、使用了多字节字符集存储字符串
char类型存储特点:
a、char类型是定长的
b、字符串存储在char类型的列中会自动删除末尾的空格
c、char类型的最大宽度为255
char类型适用的场景:
a、cahr类型适合存储长度近似的值
b、char类型适合存储短字符串
c、char类型适合存储经常更新的字符串列
如何存储日期类型:
timestamp可以自动更新:
date类型和time类型:
1、date类型的优点:
a、占用的字节数比使用字符串、datetime、int存储要少,使用date类型只需要3个字节。
b、使用date类型还可以利用日期时间函数进行日期之间的计算