电商数据库设计及架构优化1(数据库开发规范)
### 数据库规范 数据库命名规范 所有数据库对象名称必须使用**小写**并且用下划线分割 数据库名称禁止使用数据库关键字(关键字需要使用反向单引号区分) 数据库命名最好见名知意,最好不要超32字符 临时表以tmp为前缀,并以日期为后缀 备份表以bak为前缀,并以日期为后缀,方便识别 所有存储相同数据的列名和列类型必须一致 所有表最好使用Innodb存储引擎 支持事务,行级锁,更好的恢复性,高并发下性能好 数据库和表的字符集统一使用utf8 汉字占3字节,ascii码占1字节 所有表和字段都需要加注释 进行数据字典的维护 控制单表数据量大小,建议在500万行以内 可使用历史数据归档,分库分表进行 控制数据量大小 谨慎使用MySQL分区表 建议使用物理分表的方式管理大表 MySQL限制最多存储4096列 减少磁盘io 有效利用缓存,避免读入无用的冷数据 禁止在表中建立预留字段 预留字段难做到见名知意 预留字段的类型 禁止在数据库存储图片/文件等二进制数据 禁止在线上数据库进行压力测试 禁止从开发环境/测试环境直连生产环境数据库 ### 索引设计规范 1.限制每张表上索引的数量,建议每张表索引不超过5个 禁止给每一列都建立单独的索引 2.每个innodb表必须有一个主键 不使用UUID/md5/hash,字符串作为主键 主键是唯一非空的值 3.常见索引列的建议(在那些列上建立索引) 1.select/update/delete的where从句中的列建立 2.包含在order by / group by / distinct 中的字段 3.多表join的关联列 4.如何选择索引列的顺序 1.区分度最高的列放在联合索引的最左侧 2.尽量把字段长度小的列放在联合索引的最左侧 3.使用最频繁的列放在联合索引的最左侧 5.避免建立冗余索引和重复索引 6.对于频繁使用的查询优先考虑使用覆盖索引 例如:查询库存量 好处: 1.避免innodb表进行索引的二次查找 2.可以吧随机io变成顺序io,加快查询效率 7.尽量避免使用外键约束 ### 数据库字段设计规范 1.优先选择符合存储需要的最小的数据类型 1.1尽量把字符串转化为数字类存储 例: INET_ATON('255.255.255.255')=4294967195 INET_NTOA(4294967195)='255.255.255.255' 1.2对于非负型的数据,优先使用无符号整型 1.3varchar(N)中的n代表的是字符数,而不是字节数 使用utf8存储汉字varchar(255)=765字节,可存255个汉字 1.4避免使用text/blob数据类型 text/blob数据类型的只能使用前置索引,并且是没有默认值的 会进行二次查询 不在内存读取,而通过磁盘读取 1.5避免使用enum数据类型 修改enum值必须使用alter语句 enum类型的order by 操作效率低,需要额外的操作 禁止使用数值作为enum枚举值 1.6尽可能的把所有列定义为not null 1.7使用timestamp或datetime存储时间 timestamp 存储年月日时分秒(4字节)1970/01/01/00:00:01--2038/01/19/03:14:07 datetime 存储年月日时分秒(8字节) 几乎不受限制 1.8金额相关的,必须使用decimal ### 数据库的sql开发规范 1.建议使用预编译语句进行数据库的操作 减少sql注入风险 减少sql编译的时间 SELECT SQRT(POW(?,2)+POW(?,2)) AS hypotenuse; SET @a=3; SET @b=4; EXECUTE stmt1 USING @a,@b;//编译并绑定编译的对象 .......//释放语句 2.避免数据类型的隐式转换 隐式转换会进行索引的失效 SELECT *from use where id='111';(id字段数据类型为整型,这里输入的是字符串) 3.合理利用存在的索引,而不是增加索引 避免使用双%的查询条件 一个收sql只能利用到复合索引中的一列进行范围查询 使用left join 或not exists 来代替not in 操作(not in 也会造成索引失效) 4.程序连接不同数据库使用不同的账号,禁止跨库查询 优点: 1.为数据库迁移和分库留出余地 2.降低业务的耦合度 3.避免权限过大而产生的安全风险 5.禁止使用select * 全字段查询 缺点: 1. 消耗更多的cpu和io以及网络带宽资源 2. 无法使用覆盖索引的 优点:可减少表结构变更带来的影响 6.禁止使用不含字段列表的insert语句 insert into t values('a','b'); ❌ insert into t (c1,c2) values('a','b');✔️ 可减少数据表的变更对数据造成影响 7.避免使用子查询,可以把子查询优化为join查询 缺点: 1. 子查询的结果无法使用索引 2. 会产生临时表,如果数据量大则会影响效率 3. 消耗过多的CPU和io资源 8.避免使用join关联太多的表 缺点: 1. 每多关联一个表多占用一部分内存 2. 会产生临时表操作,影响效率 MySQL最多可以关联61个表,建议不超过5个 9.减少同数据库的交互次数 1. 数据库更适合处理批量操作 2. 合并多个相同的操作到一起,提高处理效率 10.使用in 代替 or in的值不要超过500个 in操作可以有效地利用索引 11.禁止使用 order by rand()进行随机排序 使用在程序中获得随机值,然后从数据库中获取 12.where从句中禁止对列进行函数转换和计算 缺点: 1. 会导致无法使用索引 13.在明显不会有重复值时使用union all 而不是union union会把所有数据放到临时表中在进行去重操作 union all不会对结果集进行去重操作 14.拆分复杂的大sql为多个小sql mysql 一个sql只能使用一个cpu进行计算 拆分后可提高效率
本站文章如未注明出处均为原创,转载请注明出处,如有侵权请邮件联系站长。