从SpringBoot构建十万博文聊聊高并发文章浏览量设计

前言

在经历了，缓存、限流、布隆穿透等等一系列加强功能，十万博客基本算是成型，网站上线以后也加入了百度统计来见证十万+ 的整个过程。

但是百度统计并不能对每篇博文进行详细的浏览量统计，如果做一些热点博文排行、48小时排行之类统计，还需要引入浏览量统计功能。

设计

通常情况下，我们只需要每次请求浏览量+1，但是这样真的好吗？或者更直白的讲，真实浏览数准确吗？

UPDATE blog SET views = views+1 WHERE id=?

参考了多个社区博客的设计，因为并不十分清楚其后端实现过程，只能从前端得出以下结论。

慕课网手记：无论是用户登录模式还是用户状态，每次刷新页面浏览数都会 +1。
51CTO博客：无论是用户登录模式还是用户状态，每次刷新页面浏览数都会 +1。
简书：用户登录模式下，无论如何刷新浏览数都不会新增，但是游客状态下每次刷新浏览数都会+1。
博客园：无论是用户登录模式还是用户状态，每次刷新页面浏览数都不变，即使隔天访问，也不变，没细测。
微信公众号：只能是用户登录状态，每次刷新浏览数基本不变，有时候会出现由多变少的情况，不知道大家有没有发现。
CSDN博客：无论是用户登录模式还是用户状态，每次刷新页面浏览数都不变，但是隔天访问，浏览数会+1，没细测。

基于以上社区的数据，直接 Pass 掉前两位，总结了以下几种方案，都是基于缓存标识实现。

如果游客或者登录用户访问，按照 IP + 文章 ID 维度增加浏览数，那局域网中怎么算？
如果是游客访问，按照 IP + 浏览器SessionId + 文章 ID 维度增加浏览数，可能解决局域网问题，那么关闭浏览器，重新打开又怎么算？
如果是登录用户，用户ID + 文章 ID 维度增加浏览数，那么游客在登录后算不算一个浏览数，或者是用户换个 IP 登录算不算？

所以说，怎么算都不准确，浏览数本身就是一个不需要太精确的功能，不要想太多，直接使用 IP + 文章ID 维度即可。

方案

方案一

得到 GET 请求，在限流之后，缓存之前，判断缓存中是否存在 IP+ 文章ID是否存在 Key。

如果存在，说明之前浏览过，就什么也不做。如果没有，就加上这个 Key，根据业务设置缓存失效时间，然后更新数据库浏览量+1，下面是代码实现：

//获取 Key

String key = IPUtils.getIpAddr()+":blog:"+id;

//判断是否存在

boolean flag =  redisUtil.hasKey(key);

if(!flag){

	//设置缓存标识并更新数据库

	redisUtil.set(key,"true",36000);

	String nativeSql = "UPDATE blog SET views = views+1 WHERE id=?";

	dynamicQuery.nativeExecuteUpdate(nativeSql,new Object[]{id});

}

方案二

这样基本能保证真实的博文浏览量，你以为就这么结束了吗？我们做的可是一个高并发的博客，直接落库，显得不是逼格太 Low 了！

为了进一步提升性能力，来做下一步优化，判断不存在之后，先不急于更新数据库，先在 Redis 里给这篇文章的浏览量+1，Key 为 viewCount:articleId，value 为缓存的浏览量。然后设置一个定时任务，定时更新 Redis 缓存数据到数据库。

这样，是不是逼格一下子提升了好几个档次！！！下面来介绍一款更有逼格的第三方计数工具。

方案三

一款高并发计数神器 Redis HyperLogLog，她是用来做基数统计的算法，优点是，在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。

在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比。

什么是基数？比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。

为了校验准确性，博主特意测试了一下，分别测试了，20000 和 100000 的数据量，基本上用了 12KB。

在测试之前 info 查询一下：

used_memory_human:910.14K

测试之后，可以说基本差不多：

used_memory_human:922.27K

下面我们通过代码来实现，引入 redis starter：

<dependency>

       <groupId>org.springframework.boot</groupId>

       <artifactId>spring-boot-starter-data-redis</artifactId>

</dependency>

这里，我们只需要两个API即可：

/**

 * 计数

 *  https://blog.52itstyle.vip

 * @param key

 * @param value

 */

public void add(String key, Object... value) {

	redisTemplate.opsForHyperLogLog().add(key,valu);

}

/**

  * 获取总数

  *  https://blog.52itstyle.vip

  * @param key

  */

public Long size(String key) {

	return redisTemplate.opsForHyperLogLog().size(key);

}

然后写个AOP：

@Around("ServiceAspect()")

public  Object around(ProceedingJoinPoint joinPoint) {

     Object[] object = joinPoint.getArgs();

     Object blogId = object[0];

     Object obj = null;

     try {

         String value = IPUtils.getIpAddr();

         String key = "viewCount:" + blogId;

		 // key 为 文章ID，Value 为请求IP地址

         redisUtil.add(key,value);

         obj = joinPoint.proceed();

     } catch (Throwable e) {

         e.printStackTrace();

     }

     return obj;

}

博文请求：

/**

  * 博文

  *  https://blog.52itstyle.vip

  */

@RequestMapping("{id}.shtml")

public String page(@PathVariable("id") Long id, ModelMap model) {

     try{

         Blog blog = blogService.getById(id);

         String key = "viewCount:"+id;

         Long views = redisUtil.size(key);

		 //直接从缓存中获取并与之前的数量相加

         blog.setViews(views+blog.getViews());

         model.addAttribute("blog",blog);

     } catch (Throwable e) {

         return  "error/404";

     }

     return  "article";

}

业务代码：

/**

  *  https://blog.52itstyle.vip

  * 执行顺序

  * 1）限流

  * 2）布隆

  * 3）计数

  * 4) 缓存

  * @param id

  * @return

  */

@Override

@ServiceLimit(limitType= ServiceLimit.LimitType.IP)

@BloomLimit

@HyperLogLimit

@Cacheable(cacheNames ="blog")

public Blog getById(Long id) {

     String nativeSql = "SELECT * FROM blog WHERE id=?";

     return dynamicQuery.nativeQuerySingleResult(Blog.class,nativeSql,new Object[]{id});

}

最后，写个定时任务，夜间入库：

@Scheduled(cron = "0 30 23 * * ?")

public void createHyperLog() {

     logger.info("计数落库开始");

     String nativeSql = "SELECT id FROM blog";

     List<Object> list = dynamicQuery.query(nativeSql,new Object[]{});

     list.forEach(blogId ->{

         String key  = "viewCount:"+blogId;

         Long views = redisUtil.size(key);

         if(views>0){

             String updateSql = "UPDATE blog SET views=views+? WHERE id=?";

                dynamicQuery.nativeExecuteUpdate(updateSql,new Object[]{views,blogId});

                redisUtil.del(key);

         }

     });

     logger.info("计数落库结束");

}

小结

撸完计数功能，作为一个个人博客基本上差不多了已经，前后端框架、连接池、限流、缓存、计数、动静分离，HTTPS安全认证、百度收录等等，后面会追加后台管理，模板、插件等等一系列功能，有兴趣的小伙伴可以一起参与进来啊啊啊啊啊啊......

案例

源码：https://gitee.com/52itstyle/spring-boot-blog

列表：https://blog.52itstyle.top/index

博文：https://blog.52itstyle.top/51.html

参考

Redis HyperLogLog

神奇的HyperLogLog算法

从SpringBoot构建十万博文聊聊高并发文章浏览量设计的更多相关文章

从SpringBoot构建十万博文聊聊缓存穿透
前言在博客系统中,为了提升响应速度,加入了 Redis 缓存,把文章主键 ID 作为 key 值去缓存查询,如果不存在对应的 value,就去数据库中查找 .这个时候,如果请求的并发量很大,就会对后 ...
从SpringBoot构建十万博文聊聊限流特技
前言在开发十万博客系统的的过程中,前面主要分享了爬虫.缓存穿透以及文章阅读量计数等等.爬虫的目的就是解决十万+问题:缓存穿透是为了保护后端数据库查询服务:计数服务解决了接近真实阅读数以及数据库服务的 ...
从SpringBoot构建十万博文聊聊Tomcat集群监控
前言在十万博文终极架构中,我们使用了Tomcat集群,但这并不能保证系统不会出问题,为了保证系统的稳定运行,我们还需要对 Tomcat 进行有效的运维监控手段,不至于问题出现或者许久一段时间才知道. ...
聊聊高并发（二十）解析java.util.concurrent各个组件（二） 12个原子变量相关类
这篇说说java.util.concurrent.atomic包里的类,总共12个.网上有非常多文章解析这几个类.这里挑些重点说说. watermark/2/text/aHR0cDovL2Jsb2cu ...
聊聊高并发（二十五）解析java.util.concurrent各个组件（七）理解Semaphore
前几篇分析了一下AQS的原理和实现.这篇拿Semaphore信号量做样例看看AQS实际是怎样使用的. Semaphore表示了一种能够同一时候有多个线程进入临界区的同步器,它维护了一个状态表示可用的票 ...
聊聊高并发（二十九）解析java.util.concurrent各个组件（十一）再看看ReentrantReadWriteLock可重入读-写锁
上一篇聊聊高并发(二十八)解析java.util.concurrent各个组件(十) 理解ReentrantReadWriteLock可重入读-写锁讲了可重入读写锁的基本情况和基本的方法,显示了怎样 ...
聊聊高并发（三十四）Java内存模型那些事（二）理解CPU快速缓存的工作原理
在上一篇聊聊高并发(三十三)从一致性(Consistency)的角度理解Java内存模型我们说了Java内存模型是一个语言级别的内存模型抽象.它屏蔽了底层硬件实现内存一致性需求的差异,提供了对上层的 ...
聊聊高并发（三十二）实现一个基于链表的无锁Set集合
Set表示一种没有反复元素的集合类,在JDK里面有HashSet的实现,底层是基于HashMap来实现的.这里实现一个简化版本号的Set,有下面约束: 1. 基于链表实现.链表节点依照对象的hashC ...
聊聊高并发（十八）理解AtomicXXX.lazySet方法
看过java.util.concurrent.atomic包里面各个AtomicXXX类实现的同学应该见过lazySet方法.比方AtomicBoolean类的lazySet方法 public fin ...

随机推荐

ES6 let const 关键字
ECMAScript 和 JavaScript的关系? 前者是后者的规格,后者是前者的实现. 符合ECMAScript 规格的还有 Flash 中的AcionScript 和 TypeScript. ...
sql server 2008 NULL值
SQL支持用NULL符号来表示缺少的值,它使用的是三值谓词逻辑,计算结果可是以TURE.FALSE或UNKNOWN. SQL中不同语言元素处理NULL和UNKNOWN的方式也有所不同,如果逻辑表达式只 ...
py+selenium 无法定位ShowModalDialog模态窗口【已解决】
问题:无法定位弹出的模态窗口. 前瞻: 模态窗口:关闭之前,无法操作其他窗口. 但是selenium无法定位到这类窗口,百度说是目前selenium不支持处理模态窗口. 目标:定位到窗口里面的元素,完 ...
c# Inner Join sql 和 Enumerable.Join
using System; using System.Collections.Generic; using System.Linq; namespace ConsoleApp1 { class Pro ...
最好的导航分割栏，分割线，实现底部透明，纯css
<div class="Ui_Ct_Line padding_5"> <div>为您推荐</div> </div> .Ui_Ct_L ...
JS高级程序设计第4章--精简版
前言:纯手打!!!按照自己思路重写!!!这次是二刷了,想暑假做一次完整的笔记,但用本子来写笔记的话太贵了,可能哪天还丢了..所以还是博客好== 第四章:变量.作用域和内存问题 4.1 基本类型和引用类 ...
Android studio 混淆打包安装后报错NullPointerException int java.util.List.size()
菜鸟的我,尝试混淆打包app...打包之前没有什么问题,混淆打包之后遇到各种问题.首先,感谢原博主的分享.解决了我的问题.谢谢. 原文地址:http://blog.csdn.net/tou_star/ ...
Spark-windows安装
Spark 目的:达到能在pycharm中测试 1.安装必要的文件: JDK AnaConda spark hadoop jdk测试:java -version Anaconda测试: 打开Anaco ...
C/C++中指向结构体变量的指针，调用指向的那个结构体中的成员
设p是指向结构体变量的指针,则可以通过以下的方式,调用指向的那个结构体中的成员: (1)结构体变量.成员名.如,stu.num. (2)(*p).成员名.如,(*p).num. (3)p->成员 ...
最短代码实现包含100个key的字典，且每个value值不同
最短代码实现包含100个key的字典,且每个value值不同 {x:x*2 for x in range(100)}

从SpringBoot构建十万博文聊聊高并发文章浏览量设计

前言

设计

方案

方案一

方案二

方案三

小结

案例

参考

从SpringBoot构建十万博文聊聊高并发文章浏览量设计的更多相关文章

随机推荐

热门专题