当前位置:首页 >娱乐 >Redis八股文精讲:字符串 讲字能不能搞个八股文精讲

Redis八股文精讲:字符串 讲字能不能搞个八股文精讲

2024-05-16 22:18:32 [百科] 来源:避面尹邢网

Redis八股文精讲:字符串

作者:后端技术小牛说 存储 Redis 文精Redis底层是C语言实现的。于是讲字不少朋友想当然的以为,Redis的符串字符串和C语言字符串实现方式一致。

[[431323]]

写在前面

小牛之前出了八股文背诵版系列,文精不少朋友问我,讲字能不能搞个八股文精讲,符串把面试问题讲讲透,文精于是讲字系列就这样诞生了。咱们第一期先聊聊Redis。符串

字符串

Redis底层是文精C语言实现的。于是讲字不少朋友想当然的以为,Redis的符串字符串和C语言字符串实现方式一致。

Redis八股文精讲:字符串 讲字能不能搞个八股文精讲

但事实上,文精Redis自己定义了一套字符串的讲字实现,名曰SDS(simple dynamic string)。符串

Redis八股文精讲:字符串 讲字能不能搞个八股文精讲

不少同学在面试时,面试官轻描淡学来一句,来讲一讲Redis的SDS吧。大家一脸懵逼,半天答不上来。最后搞半天,其实面试官就是问的Redis字符串呀。

Redis八股文精讲:字符串 讲字能不能搞个八股文精讲

首先回答一个问题:为什么Redis不采用C语言的字符串直接做具体实现?

这当然是因为这种数据结构有固有缺陷啦。主要有如下几个

缺点1:O(n)复杂度获取长度

我们知道,C语言如何判断一个字符串已经结束,当然是通过标志位'\0'。

C语言Str

所以,对于我们想获得字符串长度,我们需要从头开始遍历,直至遍历到\0,时间复杂度变成了O(n)。

缺点2:没有较好的扩容机制

对于C语言,想要搞个字符串数组,肯定需要预先确定好字符串长度。如果这个字符串经常需要修改,修改前后长度一致还好说,如果不一致,那程序层面就需要重新申请一段新内存,并把字符一个个拷贝到新的地方。

缺点3:特殊字符无法处理

引用《Redis源码剖析与实战》的例子 如果我们想存储字符串"redis\0"

  1. char *a = "redis\0"; 

到原始C语言,它编译器看到\0,以为还是字符结束的标志呢,如果把它打印下来,它只打出redis。所以特别是对于二进制数据,这种奇奇怪怪的case特别多,因此C语言的字符数组就处理不了这块存储二进制字符的需求了。

为了解决C语言字符数组的不足,redis提出了新的方法。我们先来看看3.0及之前版本的实现。

  1. struct sdshdr {  
  2.     unsigned int len; 
  3.     unsigned int free; 
  4.     char buf[]; 

来解释一下这些字段吧。

len:数组字符串已使用长度

free: 数组未使用的字符串长度

buf:存储字符串

在之后的版本,Redis对SDS进行了改进,但大体思想不变

  1. struct sdshdr {  
  2.     unsigned int len; 
  3.     unsigned int alloc; 
  4.     unsigned char flags; 
  5.     char buf[]; 

来解释一下这些字段吧。

len:数组字符串已使用长度

alloc: 数组分配的长度

flags: 表示SDS类型

buf:存储字符串

对于SDS类型,我也稍微多啰嗦两句。在新版本redis中,有4种SDS类型(sdshrd5 never used)。其中 sdshrd8 sdshrd16 sdshrd32 sdshrd64 的区别仅仅就在len和alloc上有所区别。

对于sdshrd8 该定义为

  1. struct sdshdr8 {  
  2.     uint8_t len; 
  3.     uint8_t alloc; 
  4.     unsigned char flags; 
  5.     char buf[]; 

以此类推,sdshrd16就是

  1. struct sdshdr16 {  
  2.     uint16_t len; 
  3.     uint16_t alloc; 
  4.     unsigned char flags; 
  5.     char buf[]; 

那为啥新版Redis搞这么多结构体?一个结构体不是一法通万法就够了嘛。

当然,事实确实如此,按实现角度看。如果只采用sdshrd64,肯定也够了。

但按抠门角度看呢?如果我们机子很菜,内存很小,想抠抠索索能省一点,是一点,这样做就有好处辣。

好处在哪里?当然是uint8_t、uint16_t、uint32_t、uint64_t占的空间不一样,对于小字符串,用小头sdshdr8,这样len 和alloc占用字段也能省一点,就是这么回事。

所以可以看到,SDS本质上是C语言的字符数组,加上了一点别的标识属性的结构体而已。小伙伴们下次碰见面试官问SDS,就不用慌啦!

最后多啰嗦两句SDS扩容:

  • 对于字符串增加了,如果原始的剩余空间足够,直接返回
  • 如果空间不足够,重新申请两倍最小需要长度的空间,再进行挨个赋值。

最后总结一下:Redis提出动态字符串这一数据结构,改进了C语言字符数组的不足。该动态字符串有如下好处:

  1. 字符串长度获取时间复杂度从O(n)->O(1)
  2. 减少字符串扩容引起的数据搬运次数。
  3. 可以存储更加复杂的二进制数据

参考

《Redis源码剖析与实战》

https://blog.csdn.net/weixin_39744512/article/details/111170924

https://blog.csdn.net/wolf2s/article/details/107945242 

《Redis的设计与实现》

 

责任编辑:武晓燕 来源: 后端技术小牛说 Redis字符串复杂度

(责任编辑:综合)

    推荐文章
    热点阅读