您的位置:首页 > 职场人生

Java面试知识点解析-04 —— 数据库篇(Mysql优化实战)

2019-04-29 11:56 711 查看

借参加过的多场Java开发面试,应聘岗位均为Java开发方向,在不断的面试中,又仔细对Java知识点进行复习和总结,也算是重新学习一下Java吧。

推荐收藏链接:Java 面试知识点解析

15)varchar和char的区别

char是一种固定长度的类型,varchar是一种可变长度的类型,例如:

定义一个char[10]和varchar[10],如果存进去的是 ‘test’,那么char所占的长度依然为10,除了字符 ‘test’ 外,后面跟六个空格,varchar就立马把长度变为4了,取数据的时候,char类型的要用trim()去掉多余的空格,而varchar是不需要的

char的存取速度还是要比varchar要快得多,因为其长度固定,方便程序的存储于查找

char也为此付出的是空间的代价,因为其长度固定,所以难免会有多余的空格占位符占据空间,可谓是以空间换取时间效率。

varchar是以空间效率为首位。

char的存储方式是:对英文字符(ASCII)占用1个字节,对一个汉字占用两个字节。

varchar的存储方式是:对每个英文字符占用2个字节,汉字也占用2个字节。
两者的存储数据都非unicode的字符数据。

16)主键、自增主键、主键索引与唯一索引概念区别
  • 主键:指字段 唯一、不为空值 的列;

  • 主键索引:指的就是主键,主键是索引的一种,是唯一索引的特殊类型。创建主键的时候,数据库默认会为主键创建一个唯一索引;

  • 自增主键:字段类型为数字、自增、并且是主键;

  • 唯一索引:索引列的值必须唯一,但允许有空值。主键是唯一索引,这样说没错;但反过来说,唯一索引也是主键就错误了,因为唯一索引允许空值,主键不允许有空值,所以不能说唯一索引也是主键。

17)主键就是聚集索引吗?主键和索引有什么区别?

主键是一种特殊的唯一性索引,其可以是聚集索引,也可以是非聚集索引。在SQLServer中,主键的创建必须依赖于索引,默认创建的是聚集索引,但也可以显式指定为非聚集索引。InnoDB作为MySQL存储引擎时,默认按照主键进行聚集,如果没有定义主键,InnoDB会试着使用唯一的非空索引来代替。如果没有这种索引,InnoDB就会定义隐藏的主键然后在上面进行聚集。所以,对于聚集索引来说,你创建主键的时候,自动就创建了主键的聚集索引。

18)实践中如何优化MySQL

实践中,MySQL的优化主要涉及SQL语句及索引的优化、数据表结构的优化、系统配置的优化和硬件的优化四个方面,如下图所示:

⑴ SQL语句优化:

SQL语句的优化主要包括三个问题,即如何发现有问题的SQL、如何分析SQL的执行计划以及如何优化SQL,下面将逐一解释。

① 怎么发现有问题的SQL?(通过MySQL慢查询日志对有效率问题的SQL进行监控)

MySQL的慢查询日志是MySQL提供的一种日志记录,它用来记录在MySQL中响应时间超过阀值的语句,具体指运行时间超过long_query_time值的SQL,则会被记录到慢查询日志中。long_query_time的默认值为10,意思是运行10s以上的语句。慢查询日志的相关参数如下所示:

通过MySQL的慢查询日志,我们可以查询出执行的次数多占用的时间长的SQL、可以通过pt_query_disgest(一种mysql慢日志分析工具)分析Rows examine(MySQL执行器需要检查的行数)项去找出IO大的SQL以及发现未命中索引的SQL,对于这些SQL,都是我们优化的对象。

② 通过explain查询和分析SQL的执行计划:

使用 EXPLAIN 关键字可以知道MySQL是如何处理你的SQL语句的,以便分析查询语句或是表结构的性能瓶颈。通过explain命令可以得到表的读取顺序、数据读取操作的操作类型、哪些索引可以使用、哪些索引被实际使用、表之间的引用以及每张表有多少行被优化器查询等问题。当扩展列extra出现Using filesort和Using temporay,则往往表示SQL需要优化了。

③ SQL语句的优化:

  • ⒈优化insert语句:一次插入多值;

  • ⒉应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描;

  • ⒊应尽量避免在 where 子句中对字段进行null值判断,否则将导致引擎放弃使用索引而进行全表扫描;

  • ⒋优化嵌套查询:子查询可以被更有效率的连接(Join)替代;

  • ⒌很多时候用 exists 代替 in 是一个好的选择。

  • ⒍选择最有效率的表名顺序:数据库的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表将被最先处理

    在FROM子句中包含多个表的情况下:

    如果三个表是完全无关系的话,将记录和列名最少的表,写在最后,然后依次类推
  • 也就是说:选择记录条数最少的表放在最后

如果有3个以上的表连接查询:

  • 如果三个表是有关系的话,将引用最多的表,放在最后,然后依次类推。
  • 也就是说:被其他表所引用的表放在最后
  • ⒎用IN代替OR:

    select * from emp where sal = 1500 or sal = 3000 or sal = 800;
    select * from emp where sal in (1500,3000,800);

  • ⒏SELECT子句中避免使用*号:

  • 我们最开始接触 SQL 的时候,

    “*”
    号是可以获取表中全部的字段数据的,但是它要通过查询数据字典完成,这意味着将消耗更多的时间,而且使用
    “*”
    号写出来的 SQL 语句也不够直观。

    ⑵ 索引优化:

    建议在经常作查询选择的字段、经常作表连接的字段以及经常出现在 order by、group by、distinct 后面的字段中建立索引。但必须注意以下几种可能会引起索引失效的情形:

    • 以 “%(表示任意0个或多个字符)” 开头的 LIKE 语句,模糊匹配;

    • OR语句前后没有同时使用索引;

    • 数据类型出现隐式转化(如varchar不加单引号的话可能会自动转换为int型);

    • 对于多列索引,必须满足最左匹配原则(eg,多列索引col1、col2和col3,则 索引生效的情形包括col1或col1,col2或col1,col2,col3)。

    ⑶ 数据库表结构的优化:

    ① 选择合适数据类型:

    • 使用较小的数据类型解决问题;
    • 使用简单的数据类型(mysql处理int要比varchar容易);
    • 尽可能的使用not null 定义字段;
    • 尽量避免使用text类型,非用不可时最好考虑分表;

    ② 表的范式的优化:

    • 一般情况下,表的设计应该遵循三大范式。

    ③ 表的垂直拆分:

    把含有多个列的表拆分成多个表,解决表宽度问题,具体包括以下几种拆分手段:

    • 把不常用的字段单独放在同一个表中;
    • 把大字段独立放入一个表中;
    • 把经常使用的字段放在一起;

    这样做的好处是非常明显的,具体包括:拆分后业务清晰,拆分规则明确、系统之间整合或扩展容易、数据维护简单

    ④ 表的水平拆分:

    表的水平拆分用于解决数据表中数据过大的问题,水平拆分每一个表的结构都是完全一致的。一般地,将数据平分到N张表中的常用方法包括以下两种:

    • 对ID进行hash运算,如果要拆分成5个表,mod(id,5)取出0~4个值;
    • 针对不同的hashID将数据存入不同的表中;

    表的水平拆分会带来一些问题和挑战,包括跨分区表的数据查询、统计及后台报表的操作等问题,但也带来了一些切实的好处:

    • 表分割后可以降低在查询时需要读的数据和索引的页数,同时也降低了索引的层数,提高查询速度;
    • 表中的数据本来就有独立性,例如表中分别记录各个地区的数据或不同时期的数据,特别是有些数据常用,而另外一些数据不常用。
    • 需要把数据存放到多个数据库中,提高系统的总体可用性(分库,鸡蛋不能放在同一个篮子里)。

    ⑷ 系统配置的优化:

    • 操作系统配置的优化:增加TCP支持的队列数

    • mysql配置文件优化:Innodb缓存池设置(innodb_buffer_pool_size,推荐总内存的75%)和缓存池的个数(innodb_buffer_pool_instances)

    ⑸ 硬件的优化:

    • CPU:核心数多并且主频高的
    • 内存:增大内存
    • 磁盘配置和选择:磁盘性能

    我总结出了很多互联网公司的面试题及答案,并整理成了文档,以及各种学习的进阶学习资料,免费分享给大家。扫描二维码加VX好友,拉你进【程序员面试学习交流群】免费领取。也欢迎各位一起在群里探讨技术。

    内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
    标签: 
    相关文章推荐