SpringBoot:高并发下浏览量入库设计
一、背景
文章浏览量统计,low的做法是:用户每次浏览,前端会发送一个
GET
请求获取一篇文章详情时,会把这篇文章的浏览量+1
,存进数据库里。
1.1 这么做,有几个问题:
- 在GET请求的业务逻辑里进行了数据的写操作!
- 并发高的话,数据库压力太大;
- 同时,如果文章做了缓存和搜索引擎如
ElasticSearch
的存储,同步更新缓存和ElasticSearch
更新同步更新太耗时,不更新就会导致数据不一致性。
1.2 解决方案
HyperLogLog
HyperLogLog
是Probabilistic data Structures
的一种,这类数据结构的基本大的思路就是使用统计概率上的算法,牺牲数据的精准性来节省内存的占用空间及提升相关操作的性能。
- 设计思路
- 为保证真实的博文浏览量,根据用户访问的
ip
和文章id
,进行唯一校验,即同一个用户多次访问同一篇文章,改文章访问量只增加1; - 将用户的浏览量用
opsForHyperLogLog().add(key,value)
的存储在Redis
中,在半夜浏览量低的时候,通过定时任务,将浏览量更新至数据库中。
二、 手把手实现
2.1 项目配置
sql
DROP TABLE IF EXISTS `article`;
CREATE TABLE `article` (
`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键',
`title` varchar(100) NOT NULL COMMENT '标题',
`content` varchar(1024) NOT NULL COMMENT '内容',
`url` varchar(100) NOT NULL COMMENT '地址',
`views` bigint(20) NOT NULL COMMENT '浏览量',
`create_time` timestamp NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
PRIMARY KEY (`id`)
) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
INSERT INTO article VALUES(1,'测试文章','content','url',10,NULL);
插入了一条数据,并设计访问量已经为10了,便于测试。
- 项目依赖
pom.xml
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-aop</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
</dependency>
<!--mysql-->
<dependency>
<groupId>mysql</groupId>
<artifactId>mysql-connector-java</artifactId>
</dependency>
<!-- mybatis -->
<dependency>
<groupId>org.mybatis.spring.boot</groupId>
<artifactId>mybatis-spring-boot-starter</artifactId>
<version>1.3.2</version>
</dependency>
<!-- redis -->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-pool2</artifactId>
<version>2.0</version>
</dependency>
<!-- lombok-->
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
<optional>true</optional>
</dependency>
application.yml
spring:
# 数据库配置
datasource:
url: jdbc:mysql://47.98.178.84:3306/dev
username: dev
password: password
driver-class-name: com.mysql.cj.jdbc.Driver
redis:
host: 47.98.178.84
port: 6379
database: 1
password: password
timeout: 60s # 连接超时时间,2.0 中该参数的类型为Duration,这里在配置的时候需要指明单位
# 连接池配置,2.0中直接使用jedis或者lettuce配置连接池(使用lettuce,依赖中必须包含commons-pool2包)
lettuce:
pool:
# 最大空闲连接数
max-idle: 500
# 最小空闲连接数
min-idle: 50
# 等待可用连接的最大时间,负数为不限制
max-wait: -1s
# 最大活跃连接数,负数为不限制
max-active: -1
# mybatis
mybatis:
mapper-locations: classpath:mapper/*.xml
# type-aliases-package: cn.van.redis.view.entity
2.2 浏览量的切面设计
- 自定义一个注解,用于新增文章浏览量到
Redis
中
@Target({ElementType.PARAMETER, ElementType.METHOD})
@Retention(RetentionPolicy.RUNTIME)
@Documented
public @interface PageView {
/**
* 描述
*/
String description() default "";
}
- 切面处理
@Aspect
@Configuration
@Slf4j
public class PageViewAspect {
@Autowired
private RedisUtils redisUtil;
/**
* 切入点
*/
@Pointcut("@annotation(cn.van.redis.view.annotation.PageView)")
public void PageViewAspect() {
}
/**
* 切入处理
* @param joinPoint
* @return
*/
@Around("PageViewAspect()")
public Object around(ProceedingJoinPoint joinPoint) {
Object[] object = joinPoint.getArgs();
Object articleId = object[0];
log.info("articleId:{}", articleId);
Object obj = null;
try {
String ipAddr = IpUtils.getIpAddr();
log.info("ipAddr:{}", ipAddr);
String key = "articleId_" + articleId;
// 浏览量存入redis中
Long num = redisUtil.add(key,ipAddr);
if (num == 0) {
log.info("该ip:{},访问的浏览量已经新增过了", ipAddr);
}
obj = joinPoint.proceed();
} catch (Throwable e) {
e.printStackTrace();
}
return obj;
}
}
- 工具类
RedisUtils.java
@Component
public class RedisUtils {
@Resource
private RedisTemplate<String, Object> redisTemplate;
/**
* 删除缓存
* @param key 可以传一个值 或多个
*/
public void del(String... key) {
redisTemplate.delete(key[0]);
}
/**
* 计数
* @param key
* @param value
*/
public Long add(String key, Object... value) {
return redisTemplate.opsForHyperLogLog().add(key,value);
}
/**
* 获取总数
* @param key
*/
public Long size(String key) {
return redisTemplate.opsForHyperLogLog().size(key);
}
}
- 工具类
IpUtils.java
该工具类我在
Mac
下测试没问题,Windows
下如果有问题,请反馈给我
@Slf4j
public class IpUtils {
public static String getIpAddr() {
try {
Enumeration<NetworkInterface> allNetInterfaces = NetworkInterface.getNetworkInterfaces();
InetAddress ip = null;
while (allNetInterfaces.hasMoreElements()) {
NetworkInterface netInterface = (NetworkInterface) allNetInterfaces.nextElement();
if (netInterface.isLoopback() || netInterface.isVirtual() || !netInterface.isUp()) {
continue;
} else {
Enumeration<InetAddress> addresses = netInterface.getInetAddresses();
while (addresses.hasMoreElements()) {
ip = addresses.nextElement();
if (ip != null && ip instanceof Inet4Address) {
log.info("获取到的ip地址:{}", ip.getHostAddress());
return ip.getHostAddress();
}
}
}
}
} catch (Exception e) {
log.error("获取ip地址失败,{}",e);
}
return null;
}
}
2.3 同步任务ArticleViewTask.java
ArticleService.java
里面的代码比较简单,详见文末源码。
@Component
@Slf4j
public class ArticleViewTask {
@Resource
private RedisUtils redisUtil;
@Resource
ArticleService articleService;
// 每天凌晨一点执行
@Scheduled(cron = "0 0 1 * * ? ")
@Transactional(rollbackFor=Exception.class)
public void createHyperLog() {
log.info("浏览量入库开始");
List<Long> list = articleService.getAllArticleId();
list.forEach(articleId ->{
// 获取每一篇文章在redis中的浏览量,存入到数据库中
String key = "articleId_"+articleId;
Long view = redisUtil.size(key);
if(view>0){
ArticleDO articleDO = articleService.getById(articleId);
Long views = view + articleDO.getViews();
articleDO.setViews(views);
int num = articleService.updateArticleById(articleDO);
if (num != 0) {
log.info("数据库更新后的浏览量为:{}", views);
redisUtil.del(key);
}
}
});
log.info("浏览量入库结束");
}
}
2.4 测试接口PageController.java
@RestController
@Slf4j
public class PageController {
@Autowired
private ArticleService articleService;
@Autowired
private RedisUtils redisUtil;
/**
* 访问一篇文章时,增加其浏览量:重点在的注解
* @param articleId:文章id
* @return
*/
@PageView
@RequestMapping("/{articleId}")
public String getArticle(@PathVariable("articleId") Long articleId) {
try{
ArticleDO blog = articleService.getById(articleId);
log.info("articleId = {}", articleId);
String key = "articleId_"+articleId;
Long view = redisUtil.size(key);
log.info("redis 缓存中浏览数:{}", view);
//直接从缓存中获取并与之前的数量相加
Long views = view + blog.getViews();
log.info("文章总浏览数:{}", views);
} catch (Throwable e) {
return "error";
}
return "success";
}
}
这里,具体的
Service
中的方法因为都被我放在Controller
中处理了,所以就是剩下简单的Mapper
调用了,这里就不浪费时间了,详见文末源码。(按理说,这些逻辑处理,应该放在Service
处理的,请按实际情况优化)
三、 测试
启动项目,测试访问量,先请求http://localhost:8080/1,日志打印如下:
2019-03-2623:50:50.047 INFO 2970 --- [nio-8080-exec-1] cn.van.redis.view.aspect.PageViewAspect : articleId:1
2019-03-2623:50:50.047 INFO 2970 --- [nio-8080-exec-1] cn.van.redis.view.utils.IpUtils : 获取到的ip地址:192.168.1.104
2019-03-2623:50:50.047 INFO 2970 --- [nio-8080-exec-1] cn.van.redis.view.aspect.PageViewAspect : ipAddr:192.168.1.104
2019-03-2623:50:50.139 INFO 2970 --- [nio-8080-exec-1] io.lettuce.core.EpollProvider : Starting without optional epoll library
2019-03-2623:50:50.140 INFO 2970 --- [nio-8080-exec-1] io.lettuce.core.KqueueProvider : Starting without optional kqueue library
2019-03-2623:50:50.349 INFO 2970 --- [nio-8080-exec-1] com.zaxxer.hikari.HikariDataSource : HikariPool-1 - Starting...
2019-03-2623:50:50.833 INFO 2970 --- [nio-8080-exec-1] com.zaxxer.hikari.HikariDataSource : HikariPool-1 - Start completed.
2019-03-2623:50:50.872 INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController : articleId = 1
2019-03-2623:50:50.899 INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController : redis 缓存中浏览数:1
2019-03-2623:50:50.900 INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController : 文章总浏览数:11
观察一下,数据库,访问量确实没有增加,本机再次访问,发现,日志打印如下:
2019-03-2623:51:14.658 INFO 2970 --- [nio-8080-exec-3]
cn.van.redis.view.aspect.PageViewAspect : articleId:1
2019-03-2623:51:14.658 INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.utils.IpUtils : 获取到的ip地址:192.168.1.104
2019-03-2623:51:14.658 INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.aspect.PageViewAspect : ipAddr:192.168.1.104
2019-03-2623:51:14.692 INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.aspect.PageViewAspect : 该ip:192.168.1.104,访问的浏览量已经新增过了
2019-03-2623:51:14.752 INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController : articleId = 1
2019-03-2623:51:14.760 INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController : redis 缓存中浏览数:1
2019-03-2623:51:14.761 INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController : 文章总浏览数:11
- 定时任务触发,日志打印如下
2019-03-27 01:00:00.265 INFO 2974 --- [ scheduling-1] cn.van.redis.view.task.ArticleViewTask : 浏览量入库开始
2019-03-27 01:00:00.448 INFO 2974 --- [ scheduling-1] io.lettuce.core.EpollProvider : Starting without optional epoll library
2019-03-27 01:00:00.449 INFO 2974 --- [ scheduling-1] io.lettuce.core.KqueueProvider : Starting without optional kqueue library
2019-03-27 01:00:00.663 INFO 2974 --- [ scheduling-1] cn.van.redis.view.task.ArticleViewTask : 数据库更新后的浏览量为:11
2019-03-27 01:00:00.682 INFO 2974 --- [ scheduling-1] cn.van.redis.view.task.ArticleViewTask : 浏览量入库结束
观察一下数据库,发现数据库中的浏览量增加到11
,同时,Redis
中的浏览量没了,说明成功!
四、 源码及说明
4.1 源码地址
SpringBoot:高并发下浏览量入库设计的更多相关文章
- 从SpringBoot构建十万博文聊聊高并发文章浏览量设计
前言 在经历了,缓存.限流.布隆穿透等等一系列加强功能,十万博客基本算是成型,网站上线以后也加入了百度统计来见证十万+ 的整个过程. 但是百度统计并不能对每篇博文进行详细的浏览量统计,如果做一些热点博 ...
- springboot~高并发下耗时操作的实现
高并发下的耗时操作 高并发下,就是请求在一个时间点比较多时,很多写的请求打过来时,你的服务器承受很大的压力,当你的一个请求处理时间长时,这些请求将会把你的服务器线程耗尽,即你的主线程池里的线程将不会再 ...
- 高并发下的缓存架构设计演进及redis常见的缓存应用异象解决方案
待总结 缓存穿透 缓存击穿 缓存雪崩等
- C#爬虫使用代理刷csdn文章浏览量
昨天写了一篇关于“c#批量抓取免费代理并验证有效性”的文章,接着昨天的目标继续完成吧,最终实现的目的就是刷新csdn文章的浏览量(实际上很简单,之前博客园的文章也是可以使用代理ip来刷的,后来不行了) ...
- 分布式高并发下Actor模型
分布式高并发下Actor模型 写在开始 一般来说有两种策略用来在并发线程中进行通信:共享数据和消息传递.使用共享数据方式的并发编程面临的最大的一个问题就是数据条件竞争.处理各种锁的问题是让人十分头痛的 ...
- Tumblr:150亿月浏览量背后的架构挑战
Tumblr:150亿月浏览量背后的架构挑战 2013/04/08 · IT技术, 开发 · 9.9K 阅读 · HBase, Tumblr, 架构 英文原文:High Scalability,编译: ...
- Stack Overflow 上 370万浏览量的一个问题:如何比较 Java 的字符串?
在逛 Stack Overflow 的时候,发现了一些访问量像喜马拉雅山一样高的问题,比如说这个:如何比较 Java 的字符串?访问量足足有 370万+,这不得了啊!说明有很多很多的程序员被这个问题困 ...
- 大数据量数据库设计与优化方案(SQL优化)
转自:http://blog.sina.com.cn/s/blog_6c0541d50102wxen.html 一.数据库结构的设计 如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的 ...
- 海量数据和高并发下的 Redis 业务优化实践
本文内容是我在 6 月 23 日参加的深圳 GIAC 技术大会上演讲的文字稿. 观众朋友们,我是来自掌阅的工程师钱文品,掘金小册<Redis 深度历险>的作者.今天我带来的是分享主题是:R ...
随机推荐
- Java中的单例模式(Singleton Pattern in Java)
Introduction 对于系统中的某个类来说,只有一个实例是很重要的,比如只有一个timer和ID Producer.又比如在服务器程序中,配置信息保留在一个文件中,这些配置信息由一个单例对象统一 ...
- 个人用户永久免费,可自动升级版Excel插件,使用VSTO开发,Excel催化剂安装过程详解及安装失败解决方法
因Excel催化剂用了VSTO的开发技术,并且为了最好的用户体验,用了Clickonce的布署方式(无需人工干预自动更新,让用户使用如浏览器访问网站一般,永远是最新的内容和功能).对安装过程有一定的难 ...
- [HNOI2015]亚瑟王[期望DP]
也许更好的阅读体验 \(\mathcal{Description}\) 给出\(n\)个技能,每个技能按输入顺序有\(p[i]\)的概率释放并造成\(d[i]\)的伤害.每轮游戏从前往后顺序查看每个技 ...
- 万能RecyclerView的数据适配器BaseRecyclerViewAdapterHelper
今天楼主才发现github上有这么一个好用的开源代码,充满好奇心的楼主马上使用了,特地分享给大家. 此项目的github地址: https://github.com/CymChad/BaseRecyc ...
- C#3.0新增功能10 表达式树 07 翻译(转换)表达式
连载目录 [已更新最新开发文章,点击查看详细] 本篇将介绍如何访问表达式树中的每个节点,同时生成该表达式树的已修改副本. 以下是在两个重要方案中将使用的技巧. 第一种是了解表达式树表示的算法,以 ...
- python执行unittest界面设置
执行单元测试时,系统会自动添加unittest in...的执行服务器. 执行时unittest in...的执行服务器在界面右上方可以看到,且执行结果为左侧框和右侧统计结果. 如果没有,会导致测试结 ...
- 《VR入门系列教程》之11---基本几何-材质-光照
网格.多边形.顶点 绘制3D图形有许多方法,用的最多的是用网格绘制.一个网格由一个或多个多边形组成,这些多边形的顶点都是三维空间中的点,它们具有x.y.z三个坐标值.网格中通常采用三角形和四边 ...
- 高级MySQL
一.MySQL的架构介绍 1.高级MySQL MySQL内核 SQL优化 MySQL服务器的优化 各种参数常亮设定 查询语句优化 主从复制 软硬件升级 容灾备份 SQL编程 2.MySQL的Linux ...
- 搭建python环境
参考文章:https://blog.csdn.net/qq_33855133/article/details/73106176 对于配置环境变量,懂些技术的人来说,都是很简单. 变量是在操作系统中一个 ...
- Java集合Collention
集合:又被称为容器,用来存储数据,他是一个对象,能够将具有相同性质的多个元素汇聚成一个整体,集合被用于存储,获取,操纵和传输聚合的数据. 这种数据结构称为集合 Collenction:他是集合的根接口 ...