MySQL为什么用B+树作索引?聚集与非聚集索引的区别?
gudong366 2025-05-16 16:16 9 浏览
一、为什么使用B+树作为索引?
- InnoDB支持的常见的索引有:
- B+树索引
- 全文索引
- 哈希索引
- 其中B+树索引是InnoDB的默认索引,可参阅:https://blog.csdn.net/qq_41453285/article/details/104202458
Linux后台服务器开发交流/720209036
B-树的特点
一个M阶的B树具有如下几个特征:(如下图 M=3)(下文的关键字可以理解为有效数据,而不是单纯的索引)
定义任意非叶子结点最多只有 M 个儿子,且 M>2
根结点的儿子数为[2, M]除根结点以外的非叶子结点的儿子数为[M/2, M],向上取整; (儿子数:[2,3])
非叶子结点的关键字个数=儿子数-1;(关键字=2)
所有叶子结点位于同一层
k 个关键字把节点拆成 k+1 段,分别指向 k+1 个儿子,同时满足查找树的大小关系。 (k=2)
有关B树的一些特性,注意与后面的B+树区分:
关键字集合分布在整棵树中
任何一个关键字出现且只出现在一个结点中
搜索有可能在非叶子节点结束
其搜索性能等价于在关键字全集内做一次二分查找;
B+树的特点:
B+树,是B树的一种变体,查询性能更好
m阶的B+树的特征:
有 n 棵子树的非叶子结点中含有 n 个关键字(b 树是 n-1 个),这些关键字不保存数据, 只用来索引,所有数据都保存在叶子节点(b 树是每个关键字都保存数据)
所有的叶子结点中包含了全部关键字的信息,及指向含这些关键字记录的指针,且叶子 结点本身依关键字的大小自小而大顺序链接
所有的非叶子结点可以看成是索引部分,结点中仅含其子数中的最大(或最小)关键字
通常在 b+树上有两个头指针,一个指向根结点,一个指向关键字最小的叶子结点
同一个数字会在不同节点中重复出现,根节点的最大元素就是 b+树的最大元素
- 选用B+树作为数据库的索引结构的原因有:B+树的中间节点不保存数据,是纯索引。但是 B 树的中间节点是保存数据和索引的,相对来说,B+树磁盘也能容纳更多节点元素,更“矮胖”B+树查询必须查找到叶子节点,B树只要匹配到即可不用管元素位置,因此B+树查找更稳定(并不慢)对于范围查找来说,B+树只需遍历叶子节点链表即可,B树却需要重复地中序遍历,在项目中范围查找又很是常见的增删文件(节点)时,效率更高,因为 B+树的叶子节点包含所有关键字,并以有序的链表结构存储,这样可很好提高增删效率
- 如果上面的图片看不懂,可以参阅另外一篇B-树与B+树的介绍文章:https://blog.csdn.net/qq_41453285/article/details/108023666
二、索引是如何实现的?
- 详情还可以参阅:https://blog.csdn.net/qq_41453285/article/details/104208974
B+树的大致工作原理
先抛开各种实现细节,来说一说B+树索引的大致工作原理
工作原理如下:
假设现在是主键索引表,一个表中有0、1、2、3、4、5、6、7、8八个主键
那么在B+树中,其叶子节点存储的是这些主键
当我们select * from table where id >1 and id <7的时候,那么会先从B+树的根节点开始向下查找,查找到1这个节点之后,由于底层节点之间是链表形式组织的,因此主键向右进行查找,从而查找到2、3、4、5、6这几个节点
insert、update、delete这些都是相同的原理
InnoDB和MyIASM的B+树之间有什么差别
InnoDB和MyIASM都支持B+树索引,那么它们之间的区别是什么呢?
InnoDB:其叶子节点存储不仅存储着主键的值,并且还存储着该主键对应的行数据。因此,其每个叶子节点=主键+整行数据值
MyIASM:其叶子节点也是存储着主键的值,但是其不存储该主键对应的行数据,其存储的是指向该行数据对应的地址。当我们查找到该主键值,再通过该指针查找到对应地址上的值
MyIASM与InnoDB通过B+数索引操作数据,哪一个更快?
规则为:
当操作的数据量不多时,可能两者没什么差别
当操作的数据量较大时,那么InnoDB比MyIASM快
解释如下:
InnoDB从磁盘读取数据在内存中构造一棵B+树,由于其B+树叶子节点存储的都是数据的值,因此其数据直接存储在内存中
MyIASM从磁盘读取数据在内存中构造一棵B+树,由于其B+树叶子节点只存储数据对应的指针,不存储值,因此其不会将数据读取都内存中
所以当数据量不多时,两者没什么区别:因为数据量小,InnoDB直接从内存中取数据,MyIASM通过指针去磁盘中查找数据,效率差别不大
当操作的数据量较大时,InnoDB直接从内存中取数据,那么速度较快,但是MyIASM需要不断的通过指针去磁盘中取数据,从而导致速度较慢
三、聚集索引与非聚集索引的区别是什么?
- 详情还可以参阅:https://blog.csdn.net/qq_41453285/article/details/104208974
- 下面我们以InnoDB存储引擎为例进行介绍
- B+树索引分为:聚集索引(clustered index):按照每张表的主键构造一棵B+树,一个表只能有一个聚集索引非聚集索引(secondary index):根据非主键构造B+树,一个表可以有多个辅助索引
- 不管是聚集还是非聚集索引,其内部都是B+树的,即高度平衡的,叶子节点存放着所有的数据
- 聚集索引与非聚集索引不同的是,叶子节点存放的是否为一整行的信息
聚集索引
InnoDB表数据文件本身就是一个索引结构,树的叶节点data域保存了完整的数据记录,这种索引叫做聚集索引
非聚集索引(辅助索引)
辅助索引(secondary index)也称为非聚集索引,叶子节点并不包含行记录的全部数据
叶子节点除了包含键值以外,每个叶子节点中的索引行中还包含了一个书签(bookmark)。该书签用来告诉InnoDB存储引擎哪里可以找到与所以相对应的行数据。由于InnoDB存储引擎表是索引组织表,因此InnoDB存储引擎的辅助索引的书签就是相应行数据的聚集索引键
InnoDB的所有辅助索引都引用主键作为data域。下图为定义在Col3上的一个辅助索引
辅助索引搜索需要检索两遍索引:首先检索辅助索引获得主键,然后用主键到主键索引中检索获得记录
- 上一篇:如何利用CAS技术实现无锁队列
- 下一篇:谈谈TCP和UDP源端口的确定
相关推荐
- 梦幻诛仙12职业1亿元宝版本架设教程(包含资源下载)
-
架设教程:1;上传脚本zx到bin文件夹,给权限chmod-R777/bin2;输入zx安装宝塔面板输入对应序号,中途输入Y继续3;安装好之后,会给个宝塔地址及账号密码,复制地址...
- Java零基础入门,科普Java你应该了解什么
-
最近很多人问我想学Java但是一点基础没有,网上看了一堆学习线路图还是无从下手。今天耗时3小时整理了一套保姆级的Java入门教程,建议收藏按照线路图一点点学习。一、Java的概况Java是1995年6...
- 01.Java发展历史(java发展历史简要)
-
1.Java发展历史Java由SunMicrosystems公司(现为Oracle公司)的JamesGosling及其团队在1991年开发,最初命名为"Oak",后改名为"...
- Ubuntu16.04.1安装Java8(ubuntu终端安装java)
-
上篇文章讲解了怎么在Windows下安装Java8《Windows10安装Java8》,这里讲解下怎么在Linux下安装Java。由于之前已经安装了Ubuntu16.04.1《VmwareWorkst...
- 性能测试能力提升-JVM GC监控和优化
-
一、背景接着上一篇的知识:性能测试能力提升-JVMGC原理,本篇文章,我们将主要介绍JVMGC监控和优化相关的知识:命令行方式监控GC图形化方式监控GC什么时候需要开始GC优化?GC优化的目的GC...
- Spring Boot Jar 包秒变 Docker 镜像实现多环境部署
-
你是否在互联网大厂后端开发工作中,遇到过这样的困扰?当完成一个SpringBoot项目开发,准备将Jar包部署到不同环境时,却发现各个环境依赖不同、配置复杂,部署过程繁琐又容易出错,不仅耗费...
- 「JDK 11」关于 Java 模块系统,看这一篇就够了
-
继2014年3月Java8发布之后,时隔4年,2018年9月,Java11如期发布,其间间隔了Java9和Java10两个非LTS(LongTermSupp...
- 对Java学习的10条建议(对java的认识和理解)
-
不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...
- JAVA入门教程-第1章 概述(java入门指南)
-
大道至简-JAVA入门教程在本教程中,你将学习Java语言的基础知识。Java基础内容涵盖:Java基础概念、Java词法结构、Java数组、Java流程控制、Java字符串、Java...
- 推荐一款Java音频视频编码器,很赞
-
Jave2是什么JAVE2(Java音频视频编码器)库是ffmpeg项目上的Java包装器。开发人员可以利用JAVE2将音频和视频文件从一种格式转码为另一种格式。在示例中,您可以将AVI文件转换为MP...
- 【JAVA教程】JAVA入门及开发环境安装
-
一、Java开发环境概述Java开发需要三个核心组件:JDK(JavaDevelopmentKit)-Java开发工具包,开发、编译、调试Java程序JRE(JavaRuntimeE...
- Windows和Linux环境下的JDK安装教程
-
JavaDevelopmentKit(简称JDK),是Java开发的核心工具包,提供了Java应用程序的编译、运行和开发所需的各类工具和类库。它包括了JRE(JavaRuntimeEnviro...
- 记Tomcat优化方案(tomcat优化的几种方法)
-
Tomcat服务吞吐量评估方案问题:评估方案在一台8核16G的linux服务器上,使用tomcat容器部署服务。在正常情况下如何评估这个tomcat服务可处理的连接数,即服务的吞吐量,请在正常情况下考...
- JVM GC诡异问题排查,k8s差点害死我……
-
前言本文将通过一个真实的生产环境案例,详细展示如何系统性地排查和解决JVM垃圾收集问题。这个案例涵盖了从问题发现、分析诊断到最终解决的完整过程,对于理解JVM调优实战具有重要的参考价值。系统背景我们的...
- Thorium Reader - 功能强大的跨平台免费电子书阅读器
-
在日常阅读日益普及的今天,选择一款合适的电子书阅读器至关重要。ThoriumReader作为一款独具特色的阅读应用,正逐渐在众多同类产品中崭露头角,为用户带来了卓越的阅读体验。 跨平台的便捷性...
- 一周热门
- 最近发表
- 标签列表
-
- linux一键安装 (31)
- linux运行java (33)
- ln linux (27)
- linux 磁盘管理 (31)
- linux 内核升级 (30)
- linux 运行python (28)
- linux 备份文件 (30)
- linux 网络测试 (30)
- linux 网关配置 (31)
- linux jre (32)
- linux 杀毒软件 (32)
- linux语法 (33)
- linux博客 (33)
- linux 压缩目录 (37)
- linux 查看任务 (32)
- 制作linux启动u盘 (35)
- linux 查看存储 (29)
- linux乌班图 (31)
- linux挂载镜像 (31)
- linux 软件源 (28)
- linux题目 (30)
- linux 定时脚本 (30)
- linux 网站搭建 (28)
- linux 远程控制 (34)
- linux bind (31)