SpringBoot：高并发下浏览量入库设计

一、背景

文章浏览量统计，low的做法是：用户每次浏览，前端会发送一个GET请求获取一篇文章详情时，会把这篇文章的浏览量+1，存进数据库里。

1.1 这么做，有几个问题：

在GET请求的业务逻辑里进行了数据的写操作！
并发高的话，数据库压力太大；
同时，如果文章做了缓存和搜索引擎如ElasticSearch的存储，同步更新缓存和ElasticSearch 更新同步更新太耗时，不更新就会导致数据不一致性。

1.2 解决方案

HyperLogLog

HyperLogLog是Probabilistic data Structures的一种，这类数据结构的基本大的思路就是使用统计概率上的算法，牺牲数据的精准性来节省内存的占用空间及提升相关操作的性能。

设计思路

为保证真实的博文浏览量，根据用户访问的ip和文章id,进行唯一校验，即同一个用户多次访问同一篇文章，改文章访问量只增加1；
将用户的浏览量用opsForHyperLogLog().add(key,value)的存储在Redis中，在半夜浏览量低的时候，通过定时任务，将浏览量更新至数据库中。

二、手把手实现

2.1 项目配置

sql

DROP TABLE IF EXISTS `article`;

CREATE TABLE `article` (

  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键',

  `title` varchar(100) NOT NULL COMMENT '标题',

  `content` varchar(1024) NOT NULL COMMENT '内容',

  `url` varchar(100) NOT NULL COMMENT '地址',

	`views` bigint(20) NOT NULL COMMENT '浏览量',

  `create_time` timestamp NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',

  PRIMARY KEY (`id`)

) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

INSERT INTO article VALUES(1,'测试文章','content','url',10,NULL);

插入了一条数据，并设计访问量已经为10了，便于测试。

项目依赖pom.xml

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-web</artifactId>

</dependency>

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-aop</artifactId>

</dependency>

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-test</artifactId>

</dependency>

<!--mysql-->

<dependency>

    <groupId>mysql</groupId>

    <artifactId>mysql-connector-java</artifactId>

</dependency>

<!-- mybatis -->

<dependency>

    <groupId>org.mybatis.spring.boot</groupId>

    <artifactId>mybatis-spring-boot-starter</artifactId>

    <version>1.3.2</version>

</dependency>

<!-- redis -->

<dependency>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-data-redis</artifactId>

</dependency>

<dependency>

    <groupId>org.apache.commons</groupId>

    <artifactId>commons-pool2</artifactId>

    <version>2.0</version>

</dependency>

<!-- lombok-->

<dependency>

    <groupId>org.projectlombok</groupId>

    <artifactId>lombok</artifactId>

    <optional>true</optional>

</dependency>

application.yml

spring:

  # 数据库配置

  datasource:

    url: jdbc:mysql://47.98.178.84:3306/dev

    username: dev

    password: password

    driver-class-name: com.mysql.cj.jdbc.Driver

  redis:

    host: 47.98.178.84

    port: 6379

    database: 1

    password: password

    timeout: 60s  # 连接超时时间，2.0 中该参数的类型为Duration，这里在配置的时候需要指明单位

    # 连接池配置，2.0中直接使用jedis或者lettuce配置连接池（使用lettuce，依赖中必须包含commons-pool2包）

    lettuce:

      pool:

        # 最大空闲连接数

        max-idle: 500

        # 最小空闲连接数

        min-idle: 50

        # 等待可用连接的最大时间，负数为不限制

        max-wait:  -1s

        # 最大活跃连接数，负数为不限制

        max-active: -1

# mybatis

mybatis:

  mapper-locations: classpath:mapper/*.xml

#  type-aliases-package: cn.van.redis.view.entity

2.2 浏览量的切面设计

自定义一个注解，用于新增文章浏览量到Redis中

@Target({ElementType.PARAMETER, ElementType.METHOD})

@Retention(RetentionPolicy.RUNTIME)

@Documented

public @interface PageView {

    /**

     * 描述

     */

    String description()  default "";

}

切面处理

 @Aspect

@Configuration

@Slf4j

public class PageViewAspect {

    @Autowired

    private RedisUtils redisUtil;

    /**

     * 切入点

     */

    @Pointcut("@annotation(cn.van.redis.view.annotation.PageView)")

    public void PageViewAspect() {

    }

    /**

     * 切入处理

     * @param joinPoint

     * @return

     */

    @Around("PageViewAspect()")

    public  Object around(ProceedingJoinPoint joinPoint) {

        Object[] object = joinPoint.getArgs();

        Object articleId = object[0];

        log.info("articleId:{}", articleId);

        Object obj = null;

        try {

            String ipAddr = IpUtils.getIpAddr();

            log.info("ipAddr:{}", ipAddr);

            String key = "articleId_" + articleId;

            // 浏览量存入redis中

            Long num = redisUtil.add(key,ipAddr);

            if (num == 0) {

                log.info("该ip:{},访问的浏览量已经新增过了", ipAddr);

            }

            obj = joinPoint.proceed();

        } catch (Throwable e) {

            e.printStackTrace();

        }

        return obj;

    }

}

工具类RedisUtils.java

 @Component

public  class RedisUtils {

    @Resource

    private RedisTemplate<String, Object> redisTemplate;

    /**

     * 删除缓存

     * @param key 可以传一个值 或多个

     */

    public void del(String... key) {

        redisTemplate.delete(key[0]);

    }

    /**

     * 计数

     * @param key

     * @param value

     */

    public Long add(String key, Object... value) {

        return redisTemplate.opsForHyperLogLog().add(key,value);

    }

    /**

     * 获取总数

     * @param key

     */

    public Long size(String key) {

        return redisTemplate.opsForHyperLogLog().size(key);

    }

}

工具类 IpUtils.java

该工具类我在Mac下测试没问题，Windows下如果有问题，请反馈给我

 @Slf4j

public class IpUtils {

    public static String getIpAddr() {

        try {

            Enumeration<NetworkInterface> allNetInterfaces = NetworkInterface.getNetworkInterfaces();

            InetAddress ip = null;

            while (allNetInterfaces.hasMoreElements()) {

                NetworkInterface netInterface = (NetworkInterface) allNetInterfaces.nextElement();

                if (netInterface.isLoopback() || netInterface.isVirtual() || !netInterface.isUp()) {

                    continue;

                } else {

                    Enumeration<InetAddress> addresses = netInterface.getInetAddresses();

                    while (addresses.hasMoreElements()) {

                        ip = addresses.nextElement();

                        if (ip != null && ip instanceof Inet4Address) {

                            log.info("获取到的ip地址：{}", ip.getHostAddress());

                            return ip.getHostAddress();

                        }

                    }

                }

            }

        } catch (Exception e) {

            log.error("获取ip地址失败，{}",e);

        }

        return null;

    }

}

2.3 同步任务`ArticleViewTask.java`

ArticleService.java里面的代码比较简单，详见文末源码。

@Component

@Slf4j

public class ArticleViewTask {

    @Resource

    private RedisUtils redisUtil;

    @Resource

    ArticleService articleService;

	// 每天凌晨一点执行

    @Scheduled(cron = "0 0 1 * * ? ")

    @Transactional(rollbackFor=Exception.class)

    public void createHyperLog() {

        log.info("浏览量入库开始");

        List<Long> list = articleService.getAllArticleId();

        list.forEach(articleId ->{

            // 获取每一篇文章在redis中的浏览量，存入到数据库中

            String key  = "articleId_"+articleId;

            Long view = redisUtil.size(key);

            if(view>0){

                ArticleDO articleDO = articleService.getById(articleId);

                Long views = view + articleDO.getViews();

                articleDO.setViews(views);

                int num = articleService.updateArticleById(articleDO);

                if (num != 0) {

                    log.info("数据库更新后的浏览量为：{}", views);

                    redisUtil.del(key);

                }

            }

        });

        log.info("浏览量入库结束");

    }

}

2.4 测试接口`PageController.java`

@RestController

@Slf4j

public class PageController {

    @Autowired

    private ArticleService articleService;

    @Autowired

    private RedisUtils redisUtil;

    /**

     * 访问一篇文章时，增加其浏览量:重点在的注解

     * @param articleId：文章id

     * @return

     */

    @PageView

    @RequestMapping("/{articleId}")

    public String getArticle(@PathVariable("articleId") Long articleId) {

        try{

            ArticleDO blog = articleService.getById(articleId);

            log.info("articleId = {}", articleId);

            String key = "articleId_"+articleId;

            Long view = redisUtil.size(key);

            log.info("redis 缓存中浏览数：{}", view);

            //直接从缓存中获取并与之前的数量相加

            Long views = view + blog.getViews();

            log.info("文章总浏览数：{}", views);

        } catch (Throwable e) {

            return  "error";

        }

        return  "success";

    }

}

这里，具体的Service中的方法因为都被我放在Controller中处理了，所以就是剩下简单的Mapper调用了，这里就不浪费时间了，详见文末源码。（按理说，这些逻辑处理，应该放在Service处理的，请按实际情况优化）

三、测试

启动项目，测试访问量，先请求http://localhost:8080/1,日志打印如下：

2019-03-2623:50:50.047  INFO 2970 --- [nio-8080-exec-1]  cn.van.redis.view.aspect.PageViewAspect  : articleId:1

2019-03-2623:50:50.047  INFO 2970 --- [nio-8080-exec-1] cn.van.redis.view.utils.IpUtils          : 获取到的ip地址：192.168.1.104

2019-03-2623:50:50.047  INFO 2970 --- [nio-8080-exec-1] cn.van.redis.view.aspect.PageViewAspect  : ipAddr:192.168.1.104

2019-03-2623:50:50.139  INFO 2970 --- [nio-8080-exec-1] io.lettuce.core.EpollProvider            : Starting without optional epoll library

2019-03-2623:50:50.140  INFO 2970 --- [nio-8080-exec-1] io.lettuce.core.KqueueProvider           : Starting without optional kqueue library

2019-03-2623:50:50.349  INFO 2970 --- [nio-8080-exec-1] com.zaxxer.hikari.HikariDataSource       : HikariPool-1 - Starting...

2019-03-2623:50:50.833  INFO 2970 --- [nio-8080-exec-1] com.zaxxer.hikari.HikariDataSource       : HikariPool-1 - Start completed.

2019-03-2623:50:50.872  INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController    : articleId = 1

2019-03-2623:50:50.899  INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController    : redis 缓存中浏览数：1

2019-03-2623:50:50.900  INFO 2970 --- [nio-8080-exec-1] c.v.r.v.web.controller.PageController    : 文章总浏览数：11

观察一下，数据库，访问量确实没有增加，本机再次访问，发现，日志打印如下:

2019-03-2623:51:14.658  INFO 2970 --- [nio-8080-exec-3]

cn.van.redis.view.aspect.PageViewAspect  : articleId:1

2019-03-2623:51:14.658  INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.utils.IpUtils          : 获取到的ip地址：192.168.1.104

2019-03-2623:51:14.658  INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.aspect.PageViewAspect  : ipAddr:192.168.1.104

2019-03-2623:51:14.692  INFO 2970 --- [nio-8080-exec-3] cn.van.redis.view.aspect.PageViewAspect  : 该ip:192.168.1.104,访问的浏览量已经新增过了

2019-03-2623:51:14.752  INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController    : articleId = 1

2019-03-2623:51:14.760  INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController    : redis 缓存中浏览数：1

2019-03-2623:51:14.761  INFO 2970 --- [nio-8080-exec-3] c.v.r.v.web.controller.PageController    : 文章总浏览数：11

定时任务触发，日志打印如下

2019-03-27 01:00:00.265  INFO 2974 --- [   scheduling-1] cn.van.redis.view.task.ArticleViewTask   : 浏览量入库开始

2019-03-27 01:00:00.448  INFO 2974 --- [   scheduling-1] io.lettuce.core.EpollProvider            : Starting without optional epoll library

2019-03-27 01:00:00.449  INFO 2974 --- [   scheduling-1] io.lettuce.core.KqueueProvider           : Starting without optional kqueue library

2019-03-27 01:00:00.663  INFO 2974 --- [   scheduling-1] cn.van.redis.view.task.ArticleViewTask   : 数据库更新后的浏览量为：11

2019-03-27 01:00:00.682  INFO 2974 --- [   scheduling-1] cn.van.redis.view.task.ArticleViewTask   : 浏览量入库结束

观察一下数据库，发现数据库中的浏览量增加到11，同时，Redis中的浏览量没了，说明成功！

四、源码及说明

4.1 源码地址

Github 示例代码

SpringBoot：高并发下浏览量入库设计的更多相关文章

从SpringBoot构建十万博文聊聊高并发文章浏览量设计
前言在经历了,缓存.限流.布隆穿透等等一系列加强功能,十万博客基本算是成型,网站上线以后也加入了百度统计来见证十万+ 的整个过程. 但是百度统计并不能对每篇博文进行详细的浏览量统计,如果做一些热点博 ...
springboot~高并发下耗时操作的实现
高并发下的耗时操作高并发下,就是请求在一个时间点比较多时,很多写的请求打过来时,你的服务器承受很大的压力,当你的一个请求处理时间长时,这些请求将会把你的服务器线程耗尽,即你的主线程池里的线程将不会再 ...
高并发下的缓存架构设计演进及redis常见的缓存应用异象解决方案
待总结缓存穿透缓存击穿缓存雪崩等
C#爬虫使用代理刷csdn文章浏览量
昨天写了一篇关于“c#批量抓取免费代理并验证有效性”的文章,接着昨天的目标继续完成吧,最终实现的目的就是刷新csdn文章的浏览量(实际上很简单,之前博客园的文章也是可以使用代理ip来刷的,后来不行了) ...
分布式高并发下Actor模型
分布式高并发下Actor模型写在开始一般来说有两种策略用来在并发线程中进行通信:共享数据和消息传递.使用共享数据方式的并发编程面临的最大的一个问题就是数据条件竞争.处理各种锁的问题是让人十分头痛的 ...
Tumblr：150亿月浏览量背后的架构挑战
Tumblr:150亿月浏览量背后的架构挑战 2013/04/08 · IT技术, 开发 · 9.9K 阅读 · HBase, Tumblr, 架构英文原文:High Scalability,编译: ...
Stack Overflow 上 370万浏览量的一个问题：如何比较 Java 的字符串？
在逛 Stack Overflow 的时候,发现了一些访问量像喜马拉雅山一样高的问题,比如说这个:如何比较 Java 的字符串?访问量足足有 370万+,这不得了啊!说明有很多很多的程序员被这个问题困 ...
大数据量数据库设计与优化方案(SQL优化)
转自:http://blog.sina.com.cn/s/blog_6c0541d50102wxen.html 一.数据库结构的设计如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的 ...
海量数据和高并发下的 Redis 业务优化实践
本文内容是我在 6 月 23 日参加的深圳 GIAC 技术大会上演讲的文字稿. 观众朋友们,我是来自掌阅的工程师钱文品,掘金小册<Redis 深度历险>的作者.今天我带来的是分享主题是:R ...

随机推荐

hmm隐马尔可夫真的那么难吗？
hmm隐马尔可夫真的那么难吗? 首先上代码这里是github上的关于hmm的:链接概率计算问题:前向-后向算法学习问题:Baum-Welch算法(状态未知) 预测问题:Viterbi算法 htt ...
[leetcode] 64. Minimum Path Sum (medium)
原题简单动态规划重点是:grid[i][j] += min(grid[i][j - 1], grid[i - 1][j]); class Solution { public: int minPat ...
Webpack打包效率优化篇
Webpack基础配置: 语法解析:babel-loader 样式解析:style-loader css解析:css-loader less解析:less-loader 文件解析:url-loader ...
Lombok 使用介绍(常见注解)
目录 @Data @NonNull @Getter & @Setter @ToString @EqualsAndHashCode @NoArgsConstructor, @RequiredAr ...
如何编译生成Linux-C静态链接库
目标生成的静态库文件为:libnpcp.a 举例:我们有四个文件分别为:npcp.c npcp.h other.h main.c main.h在npcp.c里面#include "other ...
Mobile game forensics
My friend Carrie'd like to know "Garena 传说对决" violates any mobile risks such as insecure d ...
mysql新增一列为主键
mysql新增一列为主键由于一次疏忽在建表的时候忘记加上主键了, 但是目前来说表里面又有数据了,所以不能删表重建,所以需要新加一列主键然后我就新加一列,并且为auto_increment,然后设置 ...
算法与数据结构基础 - 哈希表(Hash Table)
Hash Table基础哈希表(Hash Table)是常用的数据结构,其运用哈希函数(hash function)实现映射,内部使用开放定址.拉链法等方式解决哈希冲突,使得读写时间复杂度平均为O( ...
Node.js 环境搭建及简单应用
Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境.Node.js 使用了一个事件驱动.非阻塞式 I/O 的模型.如果你想创建自己的服务,那么Node.js是一个非 ...
Spring的数据库编程浅入浅出——不吹牛逼不装逼
Spring的数据库编程浅入浅出——不吹牛逼不装逼前言上文书我写了Spring的核心部分控制反转和依赖注入,后来又衔接了注解,在这后面本来是应该写Spring AOP的,但我觉得对于初学者来说,这 ...