数据结构

Last updated: ... / Reads: 5013 Edit

redis包含哪些数据结构？

字符串：实现字符串对象
链表：实现列表对象
map：实现map对象
压缩列表：实现列表和map对象
跳表：实现有序集合对象

redis压缩列表

Redis压缩列表（ziplist）是一种紧凑且高效的数据结构，用于存储Redis列表、哈希表等数据类型的元素。压缩列表的实现采用了一系列的优化技巧，使得其在占用空间较少的情况下，能够提供高效的访问性能。

压缩列表的基本结构如下：

| <zlbytes> | <zltail> | <zllen> | <entry> ... <entry> | <zlend> |

其中，zlbytes表示整个压缩列表的长度，zltail表示尾节点的偏移量，zllen表示压缩列表中节点的个数，entry是存储数据的节点，zlend表示压缩列表的结束标志。

压缩列表中的节点有两种类型：一种是压缩列表节点（zlentry），另一种是非压缩列表节点（zlend）。压缩列表节点存储了元素的实际值和长度信息，而非压缩列表节点只是一个特殊的标记，表示压缩列表的结束。

在压缩列表中，每个节点的长度都是不定长的，因此压缩列表的元素可以按需增加或减少，避免了空间浪费的问题。同时，由于节点的长度是紧凑的，可以有效减少内存碎片的产生，提高内存利用率。

压缩列表在实现上采用了多种优化技巧，如对小整数的编码优化、对字符串的编码优化、使用前向指针等，这些技巧使得压缩列表的访问性能得到了很大的提升，同时也使得压缩列表在Redis中得到了广泛的应用。

redis压缩列表的优点？

Redis压缩列表（ziplist）是一种紧凑且高效的数据结构，用于存储Redis列表、哈希表等数据类型的元素。相比于其他数据结构，Redis压缩列表具有以下优点：

紧凑的存储结构：Redis压缩列表采用变长节点的方式存储数据，可以灵活地根据数据大小调整节点的大小。这种设计使得Redis压缩列表在存储相同数量的数据时，占用的内存空间比其他数据结构更小，能够更加高效地利用内存资源。
高效的内存使用：由于Redis压缩列表采用了变长节点的方式，因此在存储数据时，可以避免产生内存碎片，减少内存使用的浪费。此外，压缩列表的节点长度是紧凑的，可以使得节点在内存中的布局更加紧密，提高了内存访问的效率。
高效的数据访问：Redis压缩列表支持O(1)复杂度的元素访问和更新操作，同时支持在表头和表尾进行快速的插入和删除操作，因此在实际应用中可以获得较高的读写性能。
优化的节点存储：Redis压缩列表对不同类型的数据（如整数、字符串、小字符串等）采用不同的编码方式进行存储，从而可以更加高效地利用内存空间。此外，压缩列表还采用了一些特殊的节点类型，如前向指针节点，可以进一步优化节点的存储效率。

总之，Redis压缩列表是一种高效的数据结构，能够在存储和访问效率上取得优秀的表现。在Redis中，压缩列表被广泛地应用于列表、哈希表等数据类型中，对于大规模数据存储和高并发访问场景具有较高的适用性。

Redis压缩列表优化了什么？

Redis压缩列表（ziplist）在设计上采用了多种优化技巧，使得其能够更加高效地利用内存空间，并提供更快的数据访问速度。以下是Redis压缩列表所采用的主要优化技巧：

变长节点设计：Redis压缩列表的节点采用了变长设计，可以根据实际存储的数据大小，灵活地调整节点的大小，从而减少空间浪费。
小整数编码：Redis压缩列表对小整数（-128到127）采用了特殊的编码方式，使用1字节存储整数值，从而减少存储开销。
字符串编码优化：Redis压缩列表对较短的字符串（小于等于64字节）采用了特殊的编码方式，避免了额外的指针和长度信息存储，从而节省了存储空间。
前向指针：Redis压缩列表在节点中增加了前向指针，用于加速节点的遍历和访问操作。
指针压缩：Redis压缩列表采用指针压缩的方式存储前向指针和后向指针，从而减少指针的存储空间，降低内存占用。
压缩列表节点类型：Redis压缩列表中的节点不仅包括普通节点，还包括一些特殊类型的节点，如头节点和尾节点，用于简化压缩列表的实现。

总之，Redis压缩列表采用了多种优化技巧，从存储结构、数据编码、指针存储等多个方面对数据结构进行了优化，使得其在占用空间较少的情况下，能够提供高效的访问性能。

压缩列表比链表的优点？

Redis中，链表（Linked List）和压缩列表（ziplist）都是用于实现列表数据结构的存储方式。相比于链表，压缩列表具有以下优点：

空间占用更小：压缩列表采用紧凑的存储方式，能够更加高效地利用内存空间，相同数量的数据在压缩列表中占用的空间通常要比链表小得多。这使得压缩列表在对内存空间有较高要求的场景下更具优势。
更快的访问速度：由于压缩列表采用连续的内存块存储元素，而链表需要通过指针进行访问，因此在对列表进行遍历、查找等操作时，压缩列表的访问速度通常会比链表更快。
更少的内存碎片：链表中节点的大小可以不同，插入和删除节点时会产生内存碎片，浪费部分内存空间。而压缩列表中的节点大小都是可变的，并且采用连续的内存块存储元素，因此不会产生内存碎片，更加高效地利用内存空间。
支持多种数据类型：压缩列表支持多种类型的数据，如整数、字符串等，不仅能够存储普通数据，还能存储二进制数据，具有更加灵活的数据存储能力。

综上所述，压缩列表相比链表在空间占用、访问速度、内存碎片、数据类型支持等方面具有优势。不过，在某些特定的应用场景下，链表可能更加适用，比如需要支持任意大小的元素、需要经常插入和删除元素的场景。

跳跃表

跳跃表（Skip List）是一种数据结构，它可以用来维护一个有序的链表，支持高效的插入、删除和查找操作，其时间复杂度均为 O(log n)，其中 n 是链表中元素的个数。

跳跃表的核心思想是利用随机化的方式来构造一个多层的链表结构，每一层都是原链表的一个“跳跃”，可以帮助我们快速定位到目标元素所在的区间，从而实现高效的查找、插入和删除操作。

具体来说，跳跃表由若干个层组成，其中第一层是一个普通的有序链表，每个元素在每一层都会出现。而从第二层开始，每一层都是在下一层中“跳跃”若干个元素后再进行排列，从而达到更快的查找速度。对于一个元素的插入或删除，我们需要在所有涉及到的层中进行相应的修改。

跳跃表的实现并不复杂，但需要注意的是，为了保持跳跃表的高效性，我们需要合理地控制其层数、跳跃的步长以及随机化的参数等，这些参数的调整需要根据实际应用场景进行适当的选择。

Redis跳跃表

Redis 中的跳跃表（Skip List）是一种用于实现有序集合（Sorted Set）的数据结构，它可以快速地支持元素的插入、删除和查找操作，并且具有较高的性能。

Redis 的跳跃表由多个层级组成，每一层都是一个有序链表，其中第一层是原始的链表。每个元素都会在第一层中出现，而从第二层开始，每一层都是在下一层中“跳跃”若干个元素后再进行排列，从而达到更快的查找速度。

在 Redis 中，跳跃表的实现相对来说比较简单，每个节点包含了一个成员对象和一个指向下一个节点的指针数组，每个指针数组中的元素表示在当前层级中，跳过多少个元素可以到达下一个节点。

在跳跃表中，每个节点的高度是随机的，但是其高度不能超过一个固定的最大值，这样可以保证跳跃表的高效性。当插入或删除元素时，Redis 会通过更新相应的指针数组来保持跳跃表的有序性和平衡性。

由于 Redis 的跳跃表实现简单、高效，因此被广泛应用于 Sorted Set 等数据结构的底层实现。

如何去重？

在跳跃表中进行去重操作，通常可以通过以下几种方式实现：

1.使用 Set 数据结构

在跳跃表中，每个节点通常包含了一个成员对象和一个指向下一个节点的指针数组。因此，我们可以在每个节点中再添加一个 Set 数据结构，用于存储该节点对应的成员对象的所有值。这样，当插入新元素时，我们可以先在对应的节点的 Set 中查找是否已经存在该值，如果存在则不再插入；如果不存在，则在跳跃表中插入该元素，并将该值添加到对应节点的 Set 中。这种方式可以保证跳跃表中的元素唯一性，但会增加额外的存储空间和插入/查询的时间复杂度。

2.在节点中记录已存在的值

在跳跃表的节点中，我们可以添加一个额外的标志位，用于标识当前节点是否已经包含了该成员对象的值。当插入新元素时，我们可以先在跳跃表中查找该元素所在的节点，如果该节点已经包含了该成员对象的值，则直接返回；否则，我们在该节点中记录该成员对象的值，并将标志位设置为已存在。这种方式可以在保证跳跃表元素唯一性的同时，减少了额外的存储空间和插入/查询的时间复杂度，但会增加节点中的标志位的复杂度。

3.使用哈希表

在跳跃表中，我们可以使用一个哈希表来记录已经存在的元素。每当需要插入新元素时，我们可以先在哈希表中查找是否已经存在该元素，如果存在则直接返回；否则，我们在跳跃表中插入新元素，并在哈希表中记录该元素的位置。这种方式可以保证跳跃表元素唯一性，并且插入/查询的时间复杂度为 O(1)，但会增加额外的存储空间和哈希表的维护成本。

以上三种方式各有优劣，我们可以根据具体的场景和需求选择合适的方式。

Redis如何去重？

在 Redis 中，可以通过使用有序集合（Sorted Set）的方式来实现元素去重。

有序集合在 Redis 中是一个基于跳跃表（Skip List）实现的数据结构，它的特点是既保持了元素的有序性，又能够快速地实现元素的插入、删除和查找操作。在有序集合中，每个元素都有一个对应的分值（score），Redis会按照元素的分值来对其进行排序，如果分值相同，会按照元素的字典序来进行排序。

由于有序集合本身的特性，它就天然具有去重的能力。当向有序集合中插入一个元素时，如果该元素已经存在，则直接更新其分值；否则，将该元素插入到有序集合中。这样，无论是对于单个元素的去重还是对于整个有序集合的去重，都能够很好地满足需求。

需要注意的是，当使用有序集合进行去重时，元素的分值不能相同，否则在插入元素时就无法区分重复元素。因此，在使用有序集合进行去重时，我们通常会将元素的分值设置为某个唯一的值，例如时间戳或随机数等。

Redis有序集合如何去重？

Redis 有序集合（Sorted Set）是一个基于跳跃表实现的数据结构，它的特点是元素有序、插入、删除和查找操作的时间复杂度都很优秀。因此，Redis 有序集合天然具备去重的能力。

当我们向 Redis 有序集合插入新的元素时，如果该元素已经存在，则直接更新该元素的分值；否则，将该元素插入到有序集合中。由于有序集合中元素的分值必须是唯一的，因此使用有序集合进行去重的关键在于如何设置元素的分值。

一般来说，我们可以将元素的分值设置为某个唯一的值，例如时间戳或随机数等。这样就可以保证每个元素的分值都是唯一的，从而实现元素的去重。具体地，我们可以使用 Redis 命令 ZADD 来向有序集合中插入元素，例如：

ZADD myset 1 "foo"
ZADD myset 2 "bar"
ZADD myset 3 "baz"

上述命令会向名为 myset 的有序集合中插入三个元素，它们的分值分别为 1、2 和 3，对应的成员分别为 "foo"、"bar" 和 "baz"。如果我们再次执行 ZADD myset 2 "bar"，则该命令不会产生任何效果，因为有序集合中已经存在分值为 2 的元素，对应的成员为 "bar"。

除了使用 ZADD 命令外，我们还可以使用其他的 Redis 命令对有序集合进行操作，例如 ZRANGE、ZREVRANGE、ZREM 等。在使用这些命令时，也会自动进行元素去重。

Redis跳跃表如何去重？

Redis 中的跳跃表（Skip List）是一种基于有序链表的数据结构，它的特点是能够在有序链表的基础上实现快速的查找、插入和删除操作，从而在某些场景下比红黑树等平衡树结构更加高效。Redis 使用跳跃表实现有序集合（Sorted Set）和有序哈希表（Sorted Hash Table）等数据结构。

由于 Redis 中的跳跃表是基于有序链表实现的，因此它天然就具备去重的能力。当我们向有序集合或有序哈希表中插入新的元素时，如果该元素已经存在，则直接更新该元素的值；否则，将该元素插入到跳跃表中。在插入元素时，Redis 会根据元素的值进行比较，并按照从小到大的顺序将元素插入到合适的位置。

需要注意的是，由于 Redis 中的跳跃表是基于有序链表实现的，因此在插入元素时需要遍历链表，并在合适的位置插入新的节点。这样会导致插入操作的时间复杂度为 O(n)，其中 n 是跳跃表中的节点数量。为了优化插入操作的效率，Redis 使用了一些技巧，例如在插入元素时随机生成层数，从而使得节点能够在跳跃表中“跳跃”，从而快速找到合适的位置进行插入。此外，Redis 还采用了一些其他的优化策略，例如缓存跳跃表节点等，从而进一步提高了跳跃表的性能。

Redis有序集合使用跳跃表如何去重？

Redis 有序集合使用跳跃表实现，因此它天然就具备去重的能力。当我们向有序集合中插入新的元素时，如果该元素已经存在，则直接更新该元素的分值；否则，将该元素插入到有序集合中。在插入元素时，Redis 会根据元素的分值进行比较，并按照从小到大的顺序将元素插入到合适的位置。

具体地，我们可以使用 Redis 命令 ZADD 来向有序集合中插入元素。如果该元素已经存在，则直接更新其分值；否则，将该元素插入到有序集合中，并赋予一个新的分值。例如，我们可以执行以下命令来向名为 myset 的有序集合中插入三个元素：

ZADD myset 1 "foo"
ZADD myset 2 "bar"
ZADD myset 3 "baz"

上述命令会向 myset 中插入三个元素，它们的分值分别为 1、2 和 3，对应的成员分别为 "foo"、"bar" 和 "baz"。如果我们再次执行 ZADD myset 2 "bar"，则该命令不会产生任何效果，因为有序集合中已经存在分值为 2 的元素，对应的成员为 "bar"。如果我们想要强制更新元素的值，可以使用 ZADD 命令的 XX 选项，例如：

ZADD myset XX 2 "newbar"

上述命令会将分值为 2 的元素的成员值从 "bar" 修改为 "newbar"。

需要注意的是，由于 Redis 使用跳跃表实现有序集合，因此在插入元素时需要遍历跳跃表，并在合适的位置插入新的节点。这样会导致插入操作的时间复杂度为 O(log n)，其中 n 是有序集合中元素的数量。由于跳跃表天然就具备快速查找、插入和删除等操作的优秀性能，因此在实际应用中，Redis 的有序集合通常具备非常高的性能和可扩展性。

Redis有序集合使用压缩列表如何去重？

Redis 有序集合可以使用压缩列表实现，而压缩列表本身就是一个数组，因此它并不天然具备去重的能力。不过，Redis 在使用压缩列表实现有序集合时，仍然可以通过一些技巧实现去重。

具体地，当我们向有序集合中插入新元素时，可以先使用 ZRANK 命令查找该元素是否已经存在于有序集合中。如果元素不存在，则使用 ZINSERT 命令将该元素插入到有序集合中；否则，直接更新该元素的分值即可。需要注意的是，在使用 ZRANK 命令查找元素时，需要遍历压缩列表中的所有元素，这样会导致查询操作的时间复杂度为 O(n)，其中 n 是有序集合中元素的数量。

另外，由于压缩列表本身的大小是固定的，因此在插入元素时，如果有序集合的大小已经超出了压缩列表的容量，那么就需要进行扩容。扩容的具体策略可以根据实际情况选择，例如可以使用类似于 C++ 中 vector 的策略，即每次扩容将容量翻倍。这样做虽然会导致一些额外的空间浪费，但可以保证扩容的时间复杂度为 O(1)。

需要注意的是，使用压缩列表实现有序集合会对插入、查询等操作的时间复杂度带来一定的影响，因此在实际应用中需要根据具体情况选择使用跳跃表或压缩列表实现有序集合。

Redis有序集合使用散列去重吗？

Redis 有序集合不会使用散列来实现。虽然 Redis 支持散列（hash）类型，但是散列类型和有序集合类型是两种不同的数据结构，它们的实现方式也不同。散列是一种键值对的集合，可以通过 key 来访问其中的 value，而有序集合则是一种有序的、不重复的元素集合。

在 Redis 中，有序集合的底层实现有两种方式：跳跃表和压缩列表。Redis 的作者在实现有序集合时，选择使用跳跃表和压缩列表这两种数据结构，因为它们可以在保证元素有序的同时，支持高效的插入、删除、查找等操作。

跳跃表是一种随机化的数据结构，可以在 log(n) 的时间复杂度内执行查找、插入、删除等操作，其中 n 是元素的数量。跳跃表通过维护多级索引来加速查找操作，因此它的查找效率非常高。

压缩列表是一种紧凑的数组结构，可以在插入、删除等操作时进行自动扩容，从而避免了频繁的内存分配和释放操作。压缩列表在元素数量较少时，可以提供较好的性能，但是在元素数量较多时，其时间复杂度会退化为线性，因此需要进行优化。Redis 在使用压缩列表实现有序集合时，通过一些技巧来实现去重、分值更新等操作，以提高其性能。

因此，虽然 Redis 支持散列类型，但是它不会将散列用于实现有序集合。

那到底怎么去重呢？

在 Redis 中，有序集合的去重实际上是通过使用有序集合元素的唯一标识符来实现的。每个有序集合元素都有一个唯一的标识符，这个标识符是有序集合内部自动生成的，用户不能修改它。有序集合在插入新元素时，会自动检查新元素的标识符是否已经存在于有序集合中，如果已经存在，则会更新该元素的分值；否则，会将新元素插入到有序集合中。

在跳跃表中，有序集合元素的唯一标识符由一个 64 位的整数来表示，该整数由有序集合内部自动生成。在压缩列表中，有序集合元素的唯一标识符由元素的值和分值共同组成，它们会被压缩在一起存储在压缩列表的数组中。

需要注意的是，在使用压缩列表实现有序集合时，由于压缩列表的大小是固定的，因此在插入元素时，如果有序集合的大小已经超出了压缩列表的容量，那么就需要进行扩容。为了避免过多的空间浪费，Redis 会在扩容时尽量减少已经存在的重复元素的空间占用。具体地，它会使用一些技巧来将重复元素的标识符合并在一起，从而减少它们在压缩列表中的占用空间。

综上所述，Redis 中有序集合的去重是通过使用唯一标识符来实现的，每个元素的标识符都是内部自动生成的，用户无法修改它。在使用压缩列表实现有序集合时，还可以通过一些技巧来减少已经存在的重复元素的空间占用。