Redis学习
本文最后更新于:June 20, 2022 pm
NoSQL概述
为什么要用NoSQL
用户的个人信息,社交网络,地理位置。用户自己产生的数据,用户日志等爆发式的增长
这时候就需要使用NoSQL数据库
1、单机MySQL的年代
90年代,一个基本的网站访问量一般不会太大,单个数据库完全足够,那个时候,更多的是使用静态网页html,服务器没有太大压力
瓶颈
1、数据量如果太大,一个机器放不下
2、数据的索引(B + Tree),一个机器内存放不下
3、访问量(读写混合),一个服务器承受不了
出现以上情况就需要晋级
2、Memcached(缓存)+ MySQL + 垂直拆分
网站80%的情况都是在读,每次查询数据库十分麻烦,因此使用缓存来保证效率
发展过程:优化数据结构和索引 —> 文件缓存(IO)—> Memcached
什么是NoSQL
NoSQL
NoSQL = Not Only SQL (不仅仅是SQL)
关系型数据库: 表格,行,列(POI)
泛指非关系型数据库,随着web2.0互联网的诞生! 传统的关系型数据库很难对付web2.0时代!尤其是超大规模的高并发的社区! 暴露出很多难以克服的问题,NoSQL在当今大数据的环境下发展十分迅速,Redis是发展最快的,而且是是当下必须要掌握的
很多数据类型用户的个人信息,社交网络,地理位置。这些数据类型的存储不需要一个固定的格式,不需要多余的操作就可以横向扩展的!Map
NoSQL特点
解耦!
1、方便扩展(数据之间没有关系,很好扩展)
2、大数据高性能(Redis一秒写8万次,读取11万,NoSQL的缓存记录级,是一种细粒度的缓存,性能会比较高)
3、数据类型是多样型的(不需要事先设计数据库!随取随用!如果是数据量十分大的表,很多人就无法设计了)
4、传统RDBMS和NoSQL
1 |
|
1 |
|
了解:3V + 3高
大数据时代的3V:主要是描述问题的
1、海量的Volume
2、多样的Variety
3、实时Velocity
大数据时代的3高:主要是对程序的要求
1、高并发
2、高可扩(随时水平拆分,机器不够了,可以扩展机器来)
3、高性能 (保证用户体验和性能)
真正的实践:NoSQL + RDBMS一起使用
技术没有高低之分,看如何使用!
阿里演进分析
1 |
|
大型互联网应用的问题:
- 数据类型太多了
- 数据源繁多,经常重构
- 数据要改造,大面积改造
解决问题:
以上都是NoSQL的入门概述
NoSQL的四大分类
KV键值对:
- 新浪:Redis
- 美团:Redis + Tair
- 阿里、百度:Redis + memcache
文档型数据库(bson格式和json一样)
- MongoDB(一般必须掌握)
- MongoDB是一个基于分布式文件存储的数据库,C++编写,主要用来处理大量的文档
- MongoDB是一个介于关系型数据库和非关系型数据库中间的产品!MongoDB是非关系型数据库中功能最丰富,最像关系型数据库的
- ConthDB
列存储数据库
- HBase
- 分布式文件系统
图关系型数据库
- 他不是存图形,放的是关系,比如:朋友圈社交网络,广告推荐
- Neo4j,InfoGrid
四者对比!
分类 | Examples举例 | 典型应用场景 | 数据模型 | 优点 | 缺点 |
---|---|---|---|---|---|
键值(key-value) | Tokyo Cabinet/Tyrant,Redis, Voldemort,Oracle BDB | 内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等等。[3] | Key指向value的键值对,通常用hash table来实现[3] | 查找速度快 | 数据无结构化,通常只被当作字符串或者二进制数据 |
列存储数据库 | Cassandra, HBase,Riak | 分布式的文件系统 | 以列簇式存储,将同一列数据存在一起 | 查找速度快,可扩展性强,更容易进行分布式扩展 | 功能相对局限 |
文档型数据库 | CouchDB,MongoDb | Web应用(与Key-Value类似,Value是结构化的,不同的是数据库能够了解Value的内容) | Key-Value对应的键值对Value为结构化数据 | 数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要先定义表结构 | 查询性能不高,而且缺乏统一的查询语法 |
图形(Graph)数据库 | Neo4J, InfoGrid, lnfinite Graph | 社交网络,推荐系统等。专注于构建关系图谱 | 图结构 | 利用图结构相关算法。比如最短路径寻址,N度关系查找等 | 很多时候需要对整个图做计算才能得出需要的信息,而且这种结果后不太好做分布式的集群方案 |
Redis入门
概述
Redis是什么?
Redis(Remote Dictionary Server),即远程字典服务
是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API
redis会周期性的把更新的数据写入磁盘或把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步
免费和开源,是当下最热门的NoSQL技术之一,也被称为结构化数据库
Redis用途
1、内存存储、持久化,内存中是断电即失、所以说持久化很重要(rdb、aof)
2、效率高,可以用于高速缓存
3、发布订阅系统
4、地图信息分析
5、计时器、计数器(浏览量)
6、 … …
特性
1、多样的数据类型
2、持久化
3、集群
4、事务
… …
准备
Redis推荐都是在Linux服务器上搭建的
Windows安装
1、下载安装包:https://github.com/dmajkic/redis/releases
2、下载完毕得到压缩包
3、解压到自己电脑上的环境目录下
4、开启Redis,双击运行服务即可
5、使用redis客户端来连接redis
windows下使用确实简单,但是redis推荐使用Linux开发使用
Linux安装
1、下载安装包 redis-6.2.2.tar.gz
2、解压安装包 程序/opt
3、进入解压后的文件可以看到redis的配置文件
4、基本的环境安装
1 |
|
5、redis默认安装路径 usr/local/bin
6、将redis配置文件,复制到我们的当前目录下
7、redis默认不是后台启动的,修改配置文件
改为yes
8、启动redis服务
9、使用redis-cli进行连接测试
10、查看redis进程是否开启
11、如何关闭redis服务 shutdown
12、再次查看进程是否存在
测试性能
redis-benchmark 是一个压力测试工具
官方自带的性能测试工具
测试:
1 |
|
基础知识
redis默认有16个数据库
默认使用第0个
1 |
|
Redis是单线程的
Redis是很快的,Redis基于内存操作,CPU不是Redis性能瓶颈,Redis的瓶颈是根据机器的内存和网络带宽,既然可以使用单线程来实现,就使用单线程了,所以就使用单线程了
Redis是C语言写的,官方提供的数据为100000+的QPS,完全不比同样是使用key-value的Memcache差
Redis为什么单线程还这么快
1、误区1:高性能的服务器一定是多线程的
2、误区2:多线程(CPU上下文会切换)一定比单线程效率高
核心:redis是将所有的数据全部放在内存中的,所以使用单线程去操作效率就是最高的,多线程(CPU上下文会切换:耗时的操作),对于内存系统来说,如果没有上下文切换效率就是最高的,多次读写都是在一个CPU上的 ,在内存情况下,这个就是最佳方案
五大数据类型
官网文档
Redis是一个开源(BSD许可)的,两存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。它支持多种类型的数据结构,如字符串 ( strings ),散列 ( hashes ),列表( lists ),集合( sets),有序集合( sorted sets )与范围查询,bitmaps , hyperloglogs和地理空间(geospatial )索引半径查询。Redis内置了复制( replication ),LUA脚本(LuaRedis是一个开源(BSD许可)的,两存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。它支持多种类型的数据结构,如字符串 ( strings ),散列 ( hashes ),列表( lists ),集合( sets),有序集合( sorted sets )与范围查询,bitmaps ,hyperloglogs和地理空间(geospatial)索引半径查询。Redis内置了复制( replication ),LUA脚本(Luascripting ),LRU驱动事件(LRU eviction ),事务 ( transactions)和不同级别的磁盘持久化 ( persistence),并通过Redis哨兵( Sentinel )和自动分区( Cluster)提供高可用性( high availability )。
Redis-Key
1 |
|
官网可以查命令
String(字符串)
1 |
|
List
基本的数据类型,列表
在Redis里面,可以把llist当作栈,队列,阻塞队列
所有的list命令都是用l开头的,Redis不区分大小写命令
1 |
|
小结
- 实际上是一个链表,before Node after,left,right都可以插入值
- 如果key不存在,创建新的链表
- 如果key存在,新增内容
- 如果移除了所有值,空链表,也代表不存在
- 在两边插入或者改动值,效率最高。中间元素,相对来说效率会低一点
消息排队,消息队列 (lpush rpop),栈(lpush,lpop)
Set
set中的值是不能重读的
1 |
|
微博,A用户将所有关注的人放在一个set集合中,将他的粉丝也放在一个集合中
共同关注,共同爱好,二度好友(六度分割理论)
Hash
Map集合,key-map 这个值是一个map集合,本质和String类型没有太大区别,还是一个简单的key-value
1 |
|
hash变更的数据 user name age,尤其是用户信息之类的,经常变动的信息。Hash更适合对象的存储,String更适合字符串的存储
Zset(有序集合)
在set的基础上,增加了一个值,set k1 v1, zset k1 score1 v1
1 |
|
三种特殊数据类型
geospatial地理位置
…
hyperloglog基数统计
基数(不重复的元素个数)
优点:占用的内存是固定的,2^64不同元素的基数,只需要12KB的内存
网页的UV (一个人访问一个网站多次,但是还是算作一个人)
传统方式:set保存用户的id,然后就可以统计set中的元素数量来作为标准判断,这个方式如果保存大量的用户id,就会比较麻烦,我们的目的是为了计数,而不是保存用户id
0.81%错误率
…
bitmaps位图
位存储
统计用户信息,活跃,不活跃 登录,未登录 打卡
两个状态的,都可以使用Bitmaps
Bitmaps位图,数据结构,都是操作二进制位来进行记录,就只有0和1两个状态
…
事务
Redis事务本质:一组命令的集合,一个事务中所有的命令会被序列化,在事务执行过程中,会按照顺序执行
一次性、顺序性、排他性
==Redis事务没有隔离级别的概念==
所有的命令在事务中,并没有直接被执行,只有发起执行命令的时候才会执行
==Redis单条命令是保证原子性的,但是事务不保证原子性==
redis事务:
- 开启事务(multi)
- 命令入队()
- 执行事务(exec)
正常执行事务
1 |
|
放弃事务
1 |
|
编译型异常(代码有问题,命令有错),事务中所有的命令都不会被执行
1 |
|
运行时异常(1/0),如果事务队列中存在语法性,那么执行命令的时候,其他命令是可以正常执行的,错误命令会抛出异常
1 |
|
监控 Watch
悲观锁:
- 很悲观,认为什么时候都会出问题,无论做什么都会加锁
乐观锁:
- 很乐观,认为什么时候都不会出问题,所以不会上锁,更新数据的时候去判断一下,在此期间是否有人修改过这个数据
- 获取version
- 更新的时候比较version
Redis监视测试
正常执行成功
1 |
|
测试多线程修改值,使用watch当作redis的乐观锁操作
1 |
|
如果修改失败,获取最新的值就好
Jedis
使用Java来操作Redis
Jedis是Redis官方推荐的java连接开发工具,使用Java操作Redis中间件
测试
- 导入对应的依赖
- 编码测试
- 连接数据库
- 操作命令
- 断开连接
常用的API
String
List
Set
Hash
ZSet
Redis.conf详解
启动的时候,通过配置文件启动
单位
- 配置文件unit单位对大小写不敏感
包含
网络
1 |
|
通用GENERAL
1 |
|
快照
持久化,在规定时间内,执行了多少次操作,则会持久化到文件 .rdb .aof
redis是内存数据库,如果没有持久化,那么数据断电即失
1 |
|
限制CLIENTS
1 |
|
APPEND ONLY 模式 aof配置
1 |
|
Redis持久化
Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以Redis提供了持久化功能
RDB(Redis DataBase)
什么是RDB
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建 ( fork )一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。一般默认用RDB
==rdb保存的文件是dump.rdb==
触发机制
- save 的规则满足的情况下,会自动触发rdb的规则
- 执行flushall命令,也会触发rdb规则
- 退出redis,也会产生rdb文件
备份就会自动生成一个rdb文件dump.rdb
如何恢复rdb文件
只需要将rdb文件放在redis的启动目录就可以,redis启动的时候会自动检查dump.rdb恢复其中的数据
查看位置
1
2
3127.0.0.1:6379> config get dir
1) "dir"
2) "/" # 如果在这个目录下存在dump.rdb文件,启动就会自动恢复其中的数据
默认配置一般够用
优点:
1. 适合大规模的数据恢复
2. 对数据的完整性要求不高
缺点:
1. 需要一定的时间间隔进行操作,如果redis意外宕机了,这个最后一次修改数据就没有了
2. fork进行的时候,会占用一定的内容空间
AOF(Append Only File)
将所有命令记录下来,恢复的时候就把这个文件全部再执行一遍
是什么
以日志的形式来记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作
==AOF保存的是aof文件appendonly.aof==
默认是不开启的,需要手动配置,只需要将appendonly改为yes就开启了aof
重启,redis就可以生效了
如果aof文件有错误,redis是启动不起来的,需要修复这个aof文件
redis提供了一个修复工具==redis-check-aof —fix==
如果文件正常,重启就可以直接恢复了
优点和缺点
优点:
- 每一次修改都同步,文件的完整性会更好
- 每秒同步一次,可能会丢失一秒的数据
- 从不同步,效率是最高的
缺点:
- 相对于数据文件来说,aof远远大于rdb,修复的速度也比rdb慢
- Aof运行效率也比rdb慢,所以redis默认的配置就是rdb持久化
扩展:
- RDB持久化方式能够在指定的时间间隔内对你的数据进行快照存储
- AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis 协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大。
- 只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化
- 同时开启两种持久化方式
- 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。
- RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?作者建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段
- 性能建议
- 因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 9001这条规则。
- 如果Enable AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一是带来了持续的IО,二是AOF rewrite 的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重写可以改到适当的数值。
- 如果不Enable AOF,仅靠Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价是如果Master/Slave同时倒掉(断电),会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave 中的RDB文件,载入较新的那个,微博就是这种架构。
Redis发布订阅
Redis 发布订阅(pub/sub)是一种消息通信模式∶发送者(pub)发送消息,订阅者(sub)接收消息。
Redis 客户端可以订阅任意数量的频道。
订阅/发布消息图︰
下图展示了频道channel1,以及订阅这个频道的三个客户端—client2、 client5和client1之间的关系:
当有新消息通过PUBLISH 命令发送给频道channel1时,这个消息就会被发送给订阅它的三个客户端:
命令
广泛用于构建即时通信应用,比如网络聊天室(chatroom)和实时广播、实时提醒等。
原理
Redis是使用C实现的,通过分析Redis源码里的pubsub.c文件,了解发布和订阅机制的底层实现,籍此加深对Redis的理解。
Redis通过PUBLISH、SUBSCRIBE和PSUBSCRIBE等命令实现发布和订阅功能。
微信︰
通过SUBSCRIBE命令订阅某频道后,redis-server里维护了一个字典,字典的键就是一个个频道!,而字典的值则是一个链表,链表中保存了所有订阅这个channel的客户端。SUBSCRIBE命令的关键,就是将客户端添加到给定channel的订阅链表中。
通过PUBLISH命令向订阅者发送消息,redis-server会使用给定的频道作为键,在它所维护的channel字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。
Pub/Sub从字面上理解就是发布( Publish )与订阅(Subscribe ),在Redis中,你可以设定对某一个key值进行消息发布及消息订阅,当一个key值上进行了消息发布后,所有订阅它的客户端都会收到相应的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。
使用场景:
1. 实时消息系统
2. 实时聊天(频道当作聊天室,将消息回显给所有人)
3. 订阅,关注系统
稍微复杂的场景就会使用 消息中间件来做MQ()
Redis主从复制
概念
主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(master/leader),后者称为从节点(slave/follower);==数据的复制是单向的,只能由主节点到从节点。==Master以写为主,Slave以读为主。
默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。主从复制的作用主要包括︰
- 数据冗余︰主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
- 故障恢复︰当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
- 负载均衡︰在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
- 高可用(集群)基石∶除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的(宕机),原因如下︰
- 从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大;
- 从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,==单台Redis最大使用内存不应该超过20G==。
电商网站上的商品,一般都是一次上传,无数次浏览的,说专业点也就是”多读少写”。
主从复制,读写分离。80%的情况下都是在进行读操作,减缓服务器的压力,架构中经常使用,一主二从
环境配置
只配置从库,不用配置主库
1 |
|
复制3个配置文件,然后修改对应的信息
- 端口
- pid 名字
- log文件名字
- dump.rdb名字
细节
主机可以写,从机不能写只能读。主机中的所有信息和数据,都会自动被从机保存
主机断开连接,从机依旧连接到主机的,但是没有写操作,这个时候主机如果回来了,从机依旧可以直接获取到主机写的信息
如果是使用命令行来配置的主从,这个时候如果重启了,就会变成主机。只要变为从机,立马就会从主机中获取值
复制原理
Slave启动成功连接到 master后会发送一个sync同步命令
Master接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行完毕之后,==master将传送整个数据文件到slave,并完成一次完全同步==
- 全量复制:而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中
- 增量复制:Master继续将新的所有收集到的修改命令依次传给slave,完成同步但是只要是重新连接master,一次完全同步(全量复制)将被自动执行
但是只要是重新连接master,一次完全同步(全量复制)将被自动执行,我们是数据一定可以在从机中看到
手动
如果主机断开了连接,我们可以使用下面的指令来让自己变成主机,其他的节点就可以手动连接到最新的这个主节点(手动)。如果原主机修复了,那就重新连接
1 |
|
哨兵模式(自动)
概述
主从切换技术的方法是︰当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel (哨兵)架构来解决这个问题。
能够后台监控主机是否故障,如果故障了根据投票数自动将从库转化为主库。
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。
这里的哨兵有两个作用
- 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器
- 当哨兵监测到master宕机,会自动将slave切换成为mater,然后通过发布订阅通知其他的从服务器,修改配置文件,让他们切换主机
然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式
假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线。
主机回来后只能归并到新的主机下,当作从机,这就是哨兵模式的规则
哨兵模式
优点:
- 哨兵集群,基于主从复制模式,所有的主从配置优点
- 主从可以切换,故障可以转移,系统的可用性会更好
- 哨兵模式就是主从模式的升级版,手动到自动,更加健壮
缺点:
- Redis不方便在线扩容,集群容量一旦到达上限,在线扩容就十分麻烦
- 实现哨兵模式的配置其实是很麻烦的,里面有很多选择
Redis缓存穿透和雪崩
服务的高可用问题
Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来了一些问题。其中最要害的问题,就是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。另外的一些典型问题就是,缓存穿透、缓存雪崩和缓存击穿。
参考:https://www.cnblogs.com/javalanguage/p/12401829.html
缓存穿透(查不到)
概念
缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。
解决方案
布隆过滤器
布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力。
参考:https://zhuanlan.zhihu.com/p/43263751
缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源
但是这种方法会存在两个问题:
- 如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的空值的键;
- 即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。
缓存击穿(量太大,缓存过期)
概念
缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。
当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。
解决方案
设置热点数据永不过期
从缓存层面来看,没有设置过期时间,所以不会出现热点key过期后产生的问题。
加互斥锁
分布式锁︰使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
缓存雪崩
概念
缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis宕机
比如对于系统A,假设每天高峰期每秒5000个请求,本来缓存在高峰期可以扛住每秒4000个请求,但是缓存机器意外发生了全盘宕机。缓存挂了,此时 1 秒 5000个请求全部落数据库,数据库必然扛不住,它会报一下警,然后就挂了。此时,如果没有采用什么特别的方案来处理这个故障,DBA 很着急,重启数据库,但是数据库立马又被新的流量给打死了。
解决方案
redis高可用
增加redis,一台挂掉还有其他的继续工作,其实就是搭建集群
限流降级
在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如说对某个key只允许一个线程查询数据和写数据,其他线程等待
数据预热
数据预热的含义就是在正式部署之前,把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问签手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀
面试题
Redis 和 MemeCache 有什么区别?
- 存储方式 Memecache把数据全部存在内存之中,断电后会挂掉,数据不能超过内存大小。 Redis有部份存在硬盘上,这样能保证数据的持久性。
- 数据支持类型 Memcache对数据类型支持相对简单。 Redis有复杂的数据类型。
- Memcached 是多线程,非阻塞 IO 复用的网络模型;Redis 使用单线程的多路 IO 复用模型
- Memcached 过期数据的删除策略只用了惰性删除,而 Redis 同时使用了惰性删除与定期删除
Redis 为什么是单线程的?
因为 redis 利用队列技术将并发访问变为串行访问,消除了传统数据库串行控制的开销。
- 单线程编程容易并且更容易维护;
- Redis 的性能瓶颈不在 CPU ,主要在内存和网络;
- 多线程就会存在死锁、线程上下文切换等问题,甚至会影响性能。
Redis 支持的数据类型有哪些?
- string 字符串(可以为整形、浮点型和字符串,统称为元素)
- list 列表(实现队列,元素不唯一,先入先出原则)
- set 集合(各不相同的元素)
- hash hash散列值(hash的key必须是唯一的)
- sort set 有序集合
Redis 支持的 Java 客户端都有哪些?
Redis Desktop Manager 、Redis Client、Redis Studio、jedis
Jedis 和 Redisson 有哪些区别?
Jedis 是 Redis的 java 实现客户端,其 API 提供了比较全面的 Redis 命令的支持;Redisson 实现了分布式和可扩展的 Java 数据结构,和 Jedis 相比,功能较为简单,不支持字符串操作,不支持排序、事务‘管道、分区等 Redis 特性。Redisson 的宗旨是促进使用者对 Redis 的关注分离,从而让使用者能够将精力更集中地放在处理业务逻辑上。
怎么保证缓存和数据库数据的一致性?
- 延时双删
- binLog 和消息队列
Redis 持久化方式
- RDB 快照的方式:直接使用快照将数据定时写入磁盘当中,数据量大具有优势。
- AOF 方式:存储redis操作日志进行存储数据,方便数据的复现。
Redis 分布式锁有什么缺陷?
在工作和网络上看到过各个版本的Redis分布式锁实现,每种实现都有一些不严谨的地方,甚至有可能是错误的实现,包括在代码中,如果不能正确的使用分布式锁,可能造成严重的生产环境故障。
redis分布式锁的缺陷
传送门: https://blog.csdn.net/matt8/article/details/64442064
Redis 淘汰策略有哪些?
redis 提供 8 种数据淘汰策略:
- volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰
- volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰
- volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰
- allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰(最常用)
- allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
- no-enviction(驱逐):禁止驱逐数据,写入报错
- volatile-lfu(least frequently used):从已设置过期时间的数据集(server.db[i].expires)中挑选最不经常使用的数据淘汰
- allkeys-lfu(least frequently used):当内存不足以容纳新写入数据时,在键空间中,移除最不经常使用的 key
Redis 常见的性能问题有哪些?该如何解决?
master 写内存快照,save 命令调度 rdbsave 函数,会阻塞主线程的工程,当快照比较大的时候对性能的影响是非常大的,会间断性暂停服务 。所以 master 最好不要写内存快照。
master AOF 持久化,如果不重写 AOF 文件,这个持久化方式对性能的影响是最小的,但是 AOF 文件会不断增大,AOF 文件过大会影响 master重启时的恢复速度。master 最好不要做任何持久化工作,包括内存快照和AOF日志文件,特别是不要启用内存快照做持久化,如果数据比较关键,某个 slave 开启 AOF 备份数据,策略每秒为同步一次。
master 调用 BGREWRITEAOF 重写 AOF 文件,AOF 在重写的时候会占大量的 CPU 和内存资源,导致服务 load 过高,出现短暂的服务暂停现象。
redis 主从复制的性能问题,为了主从复制的速度和连接的稳定性,slave 和 master 最好在同一个局域网内。
Redis 和 Mysql 数据库数据如何保持一致性
主要采用策略是延迟双删
Redisson 分布式锁(单机)
下图的意思就是可重入锁的机制,它最大的优点就是相同线程不需要在等待锁,而是可以直接进行相应操作。
Redis分布式锁会有个缺陷,就是在 Redis 哨兵模式下:
客户端1
对某个 master节点
写入了 redisson 锁,此时会异步复制给对应的 slave 节点。但是这个过程中一旦发生 master 节点宕机,主备切换,slave 节点从变为了 master 节点。这时 客户端2
来尝试加锁的时候,在新的 master 节点上也能加锁,此时就会导致多个客户端对同一个分布式锁完成了加锁。这时系统在业务语义上一定会出现问题, 导致各种脏数据的产生 。
缺陷
在哨兵模式或者主从模式下,如果 master 实例宕机的时候,可能导致多个客户端同时完成加锁。
RedLock分布式锁(多机版本)
现在假设有5个 Redis 主节点(大于3的奇数个),这样基本保证他们不会同时都宕掉,获取锁和释放锁的过程中,客户端会执行以下操作:
1.获取当前 Unix 时间,以毫秒为单位;
2.依次尝试从5个实例,使用相同的 key 和具有唯一性的 value 获取锁;
当向 Redis 请求获取锁时,客户端应该设置一个网络连接和响应超时时间,这个超时时间应该小于锁的失效时间,这样可以避免客户端死等;3.客户端使用当前时间减去开始获取锁时间就得到获取锁使用的时间。当且仅当从半数以上的 Redis 节点取到锁,并且使用的时间小于锁失效时间时,锁才算获取成功;
4.如果取到了锁,key 的真正有效时间等于有效时间减去获取锁所使用的时间,这个很重要;
5.如果因为某些原因,获取锁失败(没有在半数以上实例取到锁或者取锁时间已经超过了有效时间),客户端应该在所有的 Redis 实例上进行解锁,无论 Redis 实例是否加锁成功,因为可能服务端响应消息丢失了但是实际成功了,毕竟多释放一次也不会有问题。
Redis 可以做消息队列么?
Redis 5.0 新增加的一个数据结构 Stream
可以用来做消息队列,Stream
支持:
- 发布 / 订阅模式
- 按照消费者组进行消费
- 消息持久化( RDB 和 AOF)
不过,和专业的消息队列相比,还是有很多欠缺的地方比如消息丢失和堆积问题不好解决。
我们通常建议是不需要使用 Redis 来做消息队列的,你完全可以选择市面上比较成熟的一些消息队列比如 RocketMQ、Kafka。
相关文章推荐:Redis 消息队列的三种方案(List、Streams、Pub/Sub)
Redis 持久化机制(怎么保证 Redis 挂掉之后再重启数据可以进行恢复)
Redis 的一种持久化方式叫快照(snapshotting,RDB),另一种方式是只追加文件(append-only file, AOF)。
快照(snapshotting)持久化(RDB)
Redis 可以通过创建快照来获得存储在内存里面的数据在某个时间点上的副本。Redis 创建快照之后,可以对快照进行备份,可以将快照复制到其他服务器从而创建具有相同数据的服务器副本(Redis 主从结构,主要用来提高 Redis 性能),还可以将快照留在原地以便重启服务器的时候使用。快照持久化是 Redis 默认采用的持久化方式,在 Redis.conf 配置文件中默认有此下配置:
1 |
|
AOF(append-only file)持久化
与快照持久化相比,AOF 持久化的实时性更好,因此已成为主流的持久化方案。默认情况下 Redis 没有开启 AOF(append only file)方式的持久化,可以通过 appendonly 参数开启。
开启 AOF 持久化后每执行一条会更改 Redis 中的数据的命令,Redis 就会将该命令写入到内存缓存 server.aof_buf
中,然后再根据 appendfsync
配置来决定何时将其同步到硬盘中的 AOF 文件。
在 Redis 的配置文件中存在三种不同的 AOF 持久化方式,它们分别是:
1 |
|
拓展:Redis 4.0 对于持久化机制的优化
Redis 4.0 开始支持 RDB 和 AOF 的混合持久化(默认关闭,可以通过配置项 aof-use-rdb-preamble
开启)。
3种常用的缓存读写策略
Cache Aside Pattern(旁路缓存模式)
写:
先更新 DB
然后直接删除 cache
若改变顺序会导致数据库缓存数据不一致的问题。
读:
从 cache 中读取数据,读取到就直接返回
cache中读取不到的话,就从 DB 中读取数据返回
再把数据放到 cache 中
缺陷:
- 首次请求数据一定不在 cache
- 写操作比较频繁的话导致 cache 中的数据会被频繁删除,这样会影响缓存命中率
解决:
- 可以将热点数据可以提前放入 cache 中。
- 数据库和缓存数据强一致场景 :更新DB的时候同样更新cache,不过我们需要加一个锁/分布式锁来保证更新cache的时候不存在线程安全问题
Read/Write Through Pattern(读写穿透)
服务端把 cache 视为主要数据存储,从中读取数据并将数据写入其中。cache 服务负责将此数据读取和写入 DB,从而减轻了应用程序的职责。这种策略非常少见, Redis 也没有提供 cache 将数据写入DB的功能。
写:
- 先查 cache,cache 中不存在,直接更新 DB
- cache 中存在,则先更新 cache,然后 cache 服务自己更新 DB(同步更新 cache 和 DB)
读:
- 从 cache 中读取数据,读取到就直接返回
- 读取不到的话,先从 DB 加载,写入到 cache 后返回响应
Write Behind Pattern(异步缓存写入)
与读写穿透相似都是由 cache 服务来负责和 DB 的读写。
不同是Read/Write Through 是同步更新 cache 和 DB,而 Write Behind Caching 则是只更新缓存,不直接更新 DB,而是改为异步批量的方式来更新 DB。
这种策略在我们平时开发过程中也非常少见
本地缓存与 Redis 缓存的区别
- 读写速度,不考虑并发,本地缓存自然是最快的。
- redis 内存可能 n 多扩充,而本地扩大堆内存代价是很大的。
- 本地缓存需要自己实现过期功能,实现不好可能导致极其严重的后果,而redis经过大量的流量验证,许多漏洞无需考试,安全。
- 本地缓存无法提供丰富的数据结构,redis可以。redis可以写磁盘,持久化,本地缓存不可以或者说很麻烦要考虑的东西太多。
- 使用本地缓存极有可能导致严重的线程安全问题,并发考虑严重。
Redis 为什么这么快
根据官方数据,Redis 的 QPS 可以达到约 100000(每秒请求数)。
Redis 是基于内存的数据库,跟磁盘数据库相比,完全吊打磁盘的速度
高效的数据结构
采用 I/O 多路复用技术,并发处理连接。采用了 epoll + 自己实现的简单的事件框架。
参考:狂神说
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!