布隆过滤器是如何避免缓存穿透的？

news/2024/4/30 2:53:48/文章来源:https://blog.csdn.net/weixin_37954941/article/details/137341032

布隆过滤器（Bloom filter）是一种空间效率极高的概率型数据结构，用于判断一个元素是否在一个集合中。它的原理是当一个元素被加入集合时，通过几个不同的Hash函数将元素映射成一个位数组中的多个位置，再次查询时如果位数组中的每一位都此被设置过，则肯定在集合中。如果这些位有任何一位没有被设置过，则肯定不在集合中。主要的优点是空间效率和查询时间都远超一般的算法。

布隆过滤器可以用来解决缓存穿透问题。在接到一个查询请求时，先用布隆过滤器检查，如果布隆过滤器判断元素不在集合中，那么就可以不用去数据库中查询了，直接返回“元素不存在”。

具体操作如下：

先将所有可能查询的数据hash到布隆过滤器中
当用户查询数据的时候，首先在布隆过滤器查询数据是否存在
如果布隆过滤器认为数据不存在，则直接返回给用户“数据不存在”
如果布隆过滤器认为数据存在，那么再去数据库中查询数据
再将数据库查询出来的数据存入缓存

当然，布隆过滤器也存在一定的误判率，即它可能判断出某个数据在集合中，但实际上这个数据并不在集合中。这种情况下，我们仍然需要查询数据库，但是因为我们已经将大部分不存在的数据过滤掉了，所以数据库的压力依然会大大降低。

问查询缺陷在于：虽然布隆过滤器能够判断出数据不存在的情况，但是在判断数据存在的情况并不精确，也就是说，如果布隆过滤器检测结果存在，可能实际上数据并不存在，此时会导致缓存穿透，但是误报的概率较低，一般可以接受。

Java示例：

在Java中，有一个开源库叫做Guava，提供了实现布隆过滤器的方法。以下是一个简单的使用示例：

首先，向过滤器中添加元素：

import com.google.common.hash.BloomFilter;
import com.google.common.hash.Funnels;// 创建布隆过滤器
BloomFilter<Integer> filter = BloomFilter.create(Funnels.integerFunnel(), 500, 0.01);
// 循环 1 至 100 添加进入布隆过滤器中
for (int i = 1; i <= 100; i++) {filter.put(i);
}

然后，查询某个元素是否存在：

// 之前添加了100个数，检测这100个数，理论上都返回true
for (int i = 1; i <= 100; i++) {if (!filter.mightContain(i)) {System.out.println("有问题的数字："+ i);}
}// 检测不存在布隆过滤器的值，理论上都返回false
for (int i = 101; i <= 200; i++) {if (filter.mightContain(i)) {System.out.println("有问题的数字："+ i);}
}

以上就是一个使用布隆过滤器的示例，实际工程应用中，可能会对布隆过滤器做一些定制化的改动，以满足各种各样的需求。

这就是布隆过滤器如何解决缓存穿透的简单示例，如果想要在大规模的系统中使用布隆过滤器，需要对其进行优化和精细化的调整。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_1046262.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！