SpringBoot开发案例之打造十万博文Web篇

前言

通过 Python 爬取十万博文之后，最重要的是要让互联网用户访问到，那么如何做呢？

选型

从后台框架、前端模板、数据库连接池、缓存、代理服务、限流等组件多个维度选型。

后台框架 SpringBoot2+、JPA
前端框架 Vue
模块框架 Thymeleaf
数据库连接池 HikariCP
缓存 Redis
限流 Guava
代理服务 Nginx
文章编辑 Markdown

架构

博文

我们可以通过以下方式访问：

https://blog.52itstyle.top/49.html

亦或是：

https://blog.52itstyle.top/49.shtml

当然，如果你愿意你也可以显示为：

https://blog.52itstyle.top/49.php

https://blog.52itstyle.top/49.asp

https://blog.52itstyle.top/49.jsp

只需要在后台配置对应的映射关系即可：

/**

* 博文

*/

@RequestMapping("{id}.html")

public String blog(@PathVariable("id") Long id, ModelMap model) {

   Blog blog = blogService.getById(id);

   model.addAttribute("blog",blog);

   return  "article";

}

由于数据库存储的是 markedown 格式的数据，前台我们通过 editormd 转为 html 代码显示，这里只展示部分代码：

<script type='text/javascript' src='js/jquery.min.js'></script>

<!--省略部分代码-->

<script type='text/javascript' src="editor/editormd.min.js"></script>

<!--省略部分代码-->

<div id="article">

	<textarea  th:text="${blog.content}"  style="display:none;" placeholder="markdown语言">

	</textarea>

</div>

<!--省略部分代码-->

<script>

editormd.markdownToHTML("article", {

	htmlDecode      : "style,script,iframe",

	emoji           : true,

	taskList        : true,

	tex             : true,  // 默认不解析

	flowChart       : true,  // 默认不解析

	sequenceDiagram : true  // 默认不解析

});

</script>

缓存

爬取的博文一般、基本、大概不会修改，所以我们完全可以缓存起来，避免跟数据库直接交互，顺便提升一下访问速速。正好手头有个 256MB 的阿里云 Redis 服务，拿来就用了。

首相引入以下组件：

<dependency>

     <groupId>org.springframework.boot</groupId>

     <artifactId>spring-boot-starter-cache</artifactId>

</dependency>

<dependency>

     <groupId>org.springframework.boot</groupId>

     <artifactId>spring-boot-starter-data-redis</artifactId>

</dependency>

配置 redis：

spring.redis.database=1

spring.redis.host=r-m5e4873fd882de14.redis.rds.aliyuncs.com

spring.redis.port=6379

spring.redis.password=6347888

spring.redis.pool.max-active=8

spring.redis.pool.max-wait=-1

spring.redis.pool.max-idle=8

spring.redis.pool.min-idle=0

spring.redis.timeout=3000ms

spring.cache.type = redis

接口实现，引入 Cacheable 注解：

@Override

@Cacheable(cacheNames ="blog")

public Blog getById(Long id) {

     String nativeSql = "SELECT * FROM blog WHERE id=?";

     return dynamicQuery.nativeQuerySingleResult(Blog.class,nativeSql,new Object[]{id});

}

配置完成之后，我们打开数据库配置，多次访问博文地址，如果只是初次打印 SQL 说明配置成功：

spring.jpa.show-sql = true

限流

万一哪天流量暴涨亦或是有人恶意攻击，尔等小服务器根本扛不住，所以有时候我们需要一定的手段进行限流，比如限制IP访问的频率次数。

这里我们使用开源的第三方组件库，引入以下组件：

<dependency>

     <groupId>com.google.guava</groupId>

     <artifactId>guava</artifactId>

     <version>25.1-jre</version>

</dependency>

自定义注解：

/**

 * 自定义注解  限流

 */

@Target({ElementType.PARAMETER, ElementType.METHOD})

@Retention(RetentionPolicy.RUNTIME)

@Documented

public  @interface ServiceLimit {

    /**

     * 描述

     */

    String description()  default "";

    /**

     * key

     */

    String key() default "";

    /**

     * 类型

     */

    LimitType limitType() default LimitType.CUSTOMER;

    enum LimitType {

        /**

         * 自定义key

         */

        CUSTOMER,

        /**

         * 根据请求者IP

         */

        IP

    }

}

限流逻辑：

/**

 * 限流 AOP

 */

@Aspect

@Configuration

public class LimitAspect {

    //根据IP分不同的令牌桶, 每天自动清理缓存

    private static LoadingCache<String, RateLimiter> caches = CacheBuilder.newBuilder()

            .maximumSize(1000)

            .expireAfterWrite(1, TimeUnit.DAYS)

            .build(new CacheLoader<String, RateLimiter>() {

                @Override

                public RateLimiter load(String key){

                    // 新的IP初始化 每秒只发出5个令牌

                    return RateLimiter.create(5);

                }

            });

    //Service层切点  限流

    @Pointcut("@annotation(com.itstyle.blog.common.limit.ServiceLimit)")

    public void ServiceAspect() {

    }

    @Around("ServiceAspect()")

    public  Object around(ProceedingJoinPoint joinPoint) {

        MethodSignature signature = (MethodSignature) joinPoint.getSignature();

        Method method = signature.getMethod();

        ServiceLimit limitAnnotation = method.getAnnotation(ServiceLimit.class);

        ServiceLimit.LimitType limitType = limitAnnotation.limitType();

        String key = limitAnnotation.key();

        Object obj;

        try {

            if(limitType.equals(ServiceLimit.LimitType.IP)){

                key = IPUtils.getIpAddr();

            }

            RateLimiter rateLimiter = caches.get(key);

            Boolean flag = rateLimiter.tryAcquire();

            if(flag){

                obj = joinPoint.proceed();

            }else{

                throw new RrException("小同志，你访问的太频繁了");

            }

        } catch (Throwable e) {

            throw new RrException("小同志，你访问的太频繁了");

        }

        return obj;

    }

}

收录

完事具备，就差被搜索引擎收录了，我们可以通过手动生成网站地图，提交给百度。

/**

 * 生成地图

 * 参见：https://blog.52itstyle.top/sitemap.xml

 */

@Component

public class SitemapTask {

    @Autowired

    private DynamicQuery dynamicQuery;

    protected Logger logger = LoggerFactory.getLogger(getClass());

    @Value("${blog.url}")

    private  String blogUrl;

    //每天23点执行一次

    @Scheduled(cron = "0 0 23 * * ?")

    public void createSitemap() {

        logger.info("定时提交百度收录开始");

        StringBuffer xml = new  StringBuffer();

        xml.append("<?xml version='1.0' encoding='utf-8'?>\n");

        xml.append("<urlset>\n");

        String nativeSql = "SELECT id,create_time FROM blog";

        List<Object[]> list = dynamicQuery.query(nativeSql,new Object[]{});

        list.forEach(blog -> {

            String url = blogUrl+blog[0]+".html";

            xml.append("   <url>\n");

            xml.append("       <loc>"+url+"</loc>\n");

            xml.append("       <lastmod>"+blog[1]+"</lastmod>\n");

            xml.append("   </url>\n");

        });

        xml.append("</urlset>\n");

        saveAsFileWriter(xml.toString());

        logger.info("定时提交百度收录结束");

    }

    private static void saveAsFileWriter(String content) {

        String path = ClassUtils.getDefaultClassLoader().getResource("").getPath();

        String filePath = path + "static"+ SystemConstant.SF_FILE_SEPARATOR+"sitemap.xml";

        FileWriter fwriter = null;

        try {

            fwriter = new FileWriter(filePath, false);

            fwriter.write(content);

        } catch (IOException ex) {

            ex.printStackTrace();

        } finally {

            try {

                fwriter.flush();

                fwriter.close();

            } catch (IOException ex) {

                ex.printStackTrace();

            }

        }

    }

}

打包

尽量不要以Jar包形式部署，为了以后方便部署，最好放置到外置Tomcat 下。

pom.xml 中移除内置 Tomcat：

<dependency>

      <groupId>org.springframework.boot</groupId>

      <artifactId>spring-boot-starter-tomcat</artifactId>

      <scope>provided</scope>

</dependency>

修改启动类：

/**

 * 启动类

 * 创建者 科帮网

 * 创建时间	2019年7月21日

 */

@SpringBootApplication

@EnableCaching

@EnableScheduling

public class Application extends SpringBootServletInitializer {

    private static final Logger logger = LoggerFactory.getLogger(Application.class);

    public static void main(String[] args) {

        SpringApplication.run(Application.class, args);

        logger.info("项目启动");

    }

    @Override

    protected SpringApplicationBuilder configure(SpringApplicationBuilder application) {

        return application.sources(Application.class);

    }

}

代理

项目部署后，最好加一层代理服务，这里我们使用Nginx：

server {

    listen 80;

    server_name blog.52itstyle.top;

    return 301 https://$server_name$request_uri;

}

server{

    listen 443 ssl;

    server_name blog.52itstyle.top;

    #证书路径

    ssl_certificate    /usr/local/openresty/nginx/cert/2543486_blog.52itstyle.top.pem;

    #私钥路径

    ssl_certificate_key   /usr/local/openresty/nginx/cert/2543486_blog.52itstyle.top.key;

    #缓存有效期

    ssl_session_timeout 5m;

    #可选的加密算法,顺序很重要,越靠前的优先级越高.

    ssl_ciphers ECDHE-RSA-AES128-GCM-SHA256:ECDHE:ECDH:AES:HIGH:!NULL:!aNULL:!MD5:!ADH:!RC4;

    #安全链接可选的加密协议

    ssl_protocols TLSv1 TLSv1.1 TLSv1.2;

    ssl_prefer_server_ciphers on;

    location = /500.html {

        root   /usr/local/openresty/nginx/html;

    }

    error_page 500 502 503 504 = /503/503.html;

    location / {

        proxy_pass  http://127.0.0.1:8080;

    }

    location ~ /\.ht {

        deny  all;

    }

}

动静分离，将静态文件交由Nginx处理，加速博客访问：

#静态文件交给nginx处理

location ~ .*\.(js|css|gif|jpg|jpeg|png|bmp)?$

{

   root /home/tomcat8/webapps/ROOT/WEB-INF/classes/static;

   expires 2h;

}

源码：https://gitee.com/52itstyle/Python

演示：https://blog.52itstyle.top

列表：https://blog.52itstyle.top/index

详情：https://blog.52itstyle.top/49.shtml

小结

撸完整个项目，基本能接触的都用上了，前后端框架、连接池、限流、缓存、动静分离，HTTPS安全认证、百度收录等等，特别适合有一定开发基础的小伙伴！

源码

https://gitee.com/52itstyle/spring-boot-blog

SpringBoot开发案例之打造十万博文Web篇的更多相关文章

SpringBoot开发案例之打造私有云网盘
前言最近在做工作流的事情,正好有个需求,要添加一个附件上传的功能,曾找过不少上传插件,都不是特别满意.无意中发现一个很好用的开源web文件管理器插件 elfinder,功能比较完善,社区也很活跃,还 ...
「玩转Python」打造十万博文爬虫篇
前言这里以爬取博客园文章为例,仅供学习参考,某些AD满天飞的网站太浪费爬虫的感情了. 爬取使用 BeautifulSoup 获取博文通过 html2text 将 Html 转 Markdown ...
SpringBoot开发案例从0到1构建分布式秒杀系统
前言最近,被推送了不少秒杀架构的文章,忙里偷闲自己也总结了一下互联网平台秒杀架构设计,当然也借鉴了不少同学的思路.俗话说,脱离案例讲架构都是耍流氓,最终使用SpringBoot模拟实现了部分秒杀场 ...
SpringBoot开发案例之多任务并行+线程池处理
前言前几篇文章着重介绍了后端服务数据库和多线程并行处理优化,并示例了改造前后的伪代码逻辑.当然了,优化是无止境的,前人栽树后人乘凉.作为我们开发者来说,既然站在了巨人的肩膀上,就要写出更加优化的程序 ...
SpringBoot开发案例之整合Activiti工作流引擎
前言 JBPM是目前市场上主流开源工作引擎之一,在创建者Tom Baeyens离开JBoss后,JBPM的下一个版本jBPM5完全放弃了jBPM4的基础代码,基于Drools Flow重头来过,目前官 ...
SpringBoot开发案例之整合Dubbo分布式服务
前言在 SpringBoot 很火热的时候,阿里巴巴的分布式框架 Dubbo 不知是处于什么考虑,在停更N年之后终于进行维护了.在之前的微服务中,使用的是当当维护的版本 Dubbox,整合方式也是使 ...
SpringBoot开发案例之整合Kafka实现消息队列
前言最近在做一款秒杀的案例,涉及到了同步锁.数据库锁.分布式锁.进程内队列以及分布式消息队列,这里对SpringBoot集成Kafka实现消息队列做一个简单的记录. Kafka简介 Kafka是由A ...
转载-SpringBoot开发案例之整合日志管理
转载:https://cloud.tencent.com/developer/article/1097579 有一种力量无人能抵挡,它永不言败生来倔强.有一种理想照亮了迷茫,在那写满荣耀的地方. 00 ...
SpringBoot开发案例之分布式集群共享Session
前言在分布式系统中,为了提升系统性能,通常会对单体项目进行拆分,分解成多个基于功能的微服务,如果有条件,可能还会对单个微服务进行水平扩展,保证服务高可用. 那么问题来了,如果使用传统管理 Sessi ...

随机推荐

大白话5分钟带你走进人工智能-第31节集成学习之最通俗理解GBDT原理和过程
目录 1.前述 2.向量空间的梯度下降: 3.函数空间的梯度下降: 4.梯度下降的流程: 5.在向量空间的梯度下降和在函数空间的梯度下降有什么区别呢? 6.我们看下GBDT的流程图解: 7.我们看一个 ...
常用的方法论-PDCA
C++中 =default,=delete用法
=default: 用于显式要求编译器提供合成版本的四大函数(构造.拷贝.析构.赋值) 例如: class A{ public: A() = default; A(const A& a) = ...
kuangbin专题专题一简单搜索 Catch That Cow POJ - 3278
题目链接:https://vjudge.net/problem/POJ-3278 题意:人可以左移动一格,右移动一格,或者移动到当前位置两倍下标的格子思路:把题意的三种情况跑bfs,第一个到达目的地 ...
Java 代码界 3% 的王者？看我是如何解错这 5 道题的
前些日子,阿里妹(妹子出题也这么难)发表了一篇文章<悬赏征集!5 道题征集代码界前 3% 的超级王者>——看到这个标题,我内心非常非常激动,因为终于可以证明自己技术很牛逼了. 但遗憾的是, ...
apache开启vhost后localhost和127.0.0.1无法访问
自己单独搭建了php+mysql+apach+windows环境:后面又开启apache的虚拟主机vhost;然后自己配置虚拟主机站点可以正常访问,但是localhost和127.0.0.1无法访问, ...
在CentOS6.5部署Redis为开机自启
2 - redis的生产启动方案要把redis作为一个系统的daemon进程去运行的,每次系统启动,redis进程一起启动,配置方案如下: 1. 在redis utils 目录下,有个redis_ ...
【深搜(DFS)-例题-踏青】-C++
描述小白和他的朋友周末相约去召唤师峡谷踏青.他们发现召唤师峡谷的地图是由一块一块格子组成的,有的格子上是草丛,有的是空地.草丛通过上下左右 4 个方向扩展其他草丛形成一片草地,任何一片草地中的格子都 ...
Golang 高效实践之并发实践context篇
前言在上篇Golang高效实践之并发实践channel篇中我给大家介绍了Golang并发模型,详细的介绍了channel的用法,和用select管理channel.比如说我们可以用channel来控 ...
HttpClient多文件上传代码及普通参数中文乱码问题解决
该随笔记录了在实际项目中使用HttpClient调用外部api,需上传文件和普通参数的代码. 笔者在使用 HttpClient 调用 http api 接口时,需要服务端上传文件和一些普通参数给 ht ...

SpringBoot开发案例之打造十万博文Web篇

前言

选型

架构

博文

缓存

限流

收录

打包

代理

小结

源码

SpringBoot开发案例之打造十万博文Web篇的更多相关文章

随机推荐

热门专题