什么是RSS,它可以做什么

快2020年了,RSS日渐式微,我也是去年机缘巧合下才开始使用的,以前只是听说过。RSS,全称Really Simple Syndication,又称简易信息聚合(也叫聚合内容)是一种RSS基于XML标准,在互联网上被广泛采用的内容包装和投递协议。RSS搭建了信息迅速传播的一个技术平台,使得每个人都成为潜在的信息提供者。它简洁直接无广告,只提供内容!

说人话就是采用一种某种标准的信息数据,广泛应用于网上新闻,博客,不用打开相关网站,有新内容就会推送(当然,前提是需要有一个RSS阅读器),其实RSS用途不仅于此,你可以使用RSS订阅一切内容,例如如下场景:

  • 某个资源网站更新了想看的信息,自动推送相关信息给你
  • 喜欢的爱豆在各个平台上有新动态了,第一时间get~
  • 关注的歌手在附近有新演唱会啦,买买买~
  • 淘宝上看中的宝贝降价啦,立马提醒你
  • 明天会下雨,提前温馨通知
  • ......

可以直接食用的订阅源

简单推荐一些官方的源和各位大佬们做好的

网站 简述
FeedX 主要提供国内外新闻平台的RSS源,很良心
RSSHub DIYGod大佬的开源项目,提供了很多RSS源,种类很多,目前还在不断更新中
cnbeta 主要提供科技数码方面的新闻,官方源https://www.cnbeta.com/backend.php,但是不提供全文。
少数派 官方源https://sspai.com/feed

获取全文输出

有的官方源不支持全文输出,只有简述,例如cnbeta,将其转成有全文输出的办法也简单,利用相关网站。以下推荐一些


给指定网站制作RSS源

Feed43 国外老牌RSS定制网站,已运营多年,它能将网页转换为标准格式的 RSS 源。

优点

  • 免费(也有收费套餐,但一般用不上)
  • 容易上手,无需编程基础

缺点

  • 国外服务,不是很稳定
  • 可自定义程度略低
  • 有些网站不能抓取,报403或404
  • 免费版只会每6小时抓取一次

开始炮制

  1. 如果你想以后继续用或者更改你的feed,可以注册一个账号,不注册登录也可以用

  2. 点击create your first rss feed开始

  3. 这里以1905电影网为例,Step 1. Specify source page address (URL)在Address框输入网址,然后点击reload加载,如果出现乱码,试试Encoding框输入UTF-8

  4. 如果不幸显示404 Not Found或者403 Forbid,那么说明该网站无法转换,你可以换个姿势再试试

  5. 如果成功你就可以看到Page Source框里的html代码,Step 2. Define extraction rules,定义抓取规则。

  6. Global Search Pattern是可选的,一般留空即可,重点在Item (repeatable) Search Pattern

  7. 我要抓取1905网里的电影资讯,源代码中的资讯代码形如<a href="https://www.1905.com/news/20191225/1428107.shtml" target="_blank" data-hrefexp="fr=homepc_news_kx">奥斯卡热门影片《别告诉她》聚焦社会话题 文化差异引碰撞</a>

  8. 那么在Item (repeatable) Search Pattern框下输入<a href="{%}" target="_blank" data-hrefexp="fr=homepc_news_kx">{%}</a>

    即可,{%}表示你要获取的内容,点击Extract然后可以看到网页中符合这个模板的内容都会被抓取到。

  9. Step 3. Define output format,定义输出格式,重点在RSS item properties下的Item Title Template(标题)、Item Link Template(链接)、Item Content Template(全文内容),将第二步获取到的内容输入,{%数字}的形式

    最后点击Preview即可,然后你就能看到最后的RSS源

    Feed URL就是RSS源,你还可以修改成简单好记的名称。

全文输出

利用Feed43做的RSS源无法获取到全文内容,那么利用上文提到的相关网站就可以啦,下面我使用freefullrss进行操作。

在输入框输入相关信息,然后点击Creat Full Text RSS,成功就会显示如下成果:

最后将该网页网址复制添加到RSS阅读器即可,大功告成!本文首发于个人博客

利用Feed43为网站自制RSS源的更多相关文章

  1. C#读取RSS源,并利用Solr索引

    折磨我几天的问题今天终于解决了,分享一下近期solr使用的一些经验. 本来是用nutch在爬取页面,可是客户需要爬取RSS,而且可以识别那些页面是通过RSS源抓取出来的.nutch虽然自带解析RSS的 ...

  2. 如何自己烧制全文RSS(打造自己RSS源)

    烧制RSS源 到Feed43注册一个账号,虽说不注册也能用,但是为了方便修改自己烧制的RSS,最好还是注册一个账号来管理 到主页点击Create new feed 输入网址点击reload 可以看到请 ...

  3. windows下利用iis建立网站网站并实现局域共享

    博客园 首页 新随笔 联系 管理 订阅 随笔- 54  文章- 9  评论- 0  Windows下利用IIS建立网站并实现局域网共享 https://blog.csdn.net/qq_4148541 ...

  4. CozyRSS开发记录21-默认RSS源列表

    CozyRSS开发记录21-默认RSS源列表 1.默认列表 在第一次使用CozyRSS的情况下,我们让它内置五个RSS源吧: 2.响应RSS源的更新 先不处理RSS源列表项的点击,响应下下拉菜单里的更 ...

  5. CozyRSS开发记录11-够用的RSS源管理

    CozyRSS开发记录11-够用的RSS源管理 1.分析需求 先随手画个用例图来看看有哪些参与者会访问我们的源管理: 2.搞一个Controller类 根据前面分析得出的用例图,我们就可以来设计实现一 ...

  6. 利用ThinkPHP搭建网站后台架构

    记录一下ThinkPHP搭建网站后台.调整好样式等操作步骤 下载好ThinkPHP(3.2.3),解压后将核心文件夹ThinkPHP以及index.php等文件复制到网站根目录如下图 对index.p ...

  7. 利用Ihttpmodel实现网站缓存,解决Server.Transfer 直接输出HTML源代码的问题

    今天在用.NET利用IHttpModel实现网站静态缓存的时候,不知道最后为什么用 Server.Transfer(html)的时候结果输出的是HTML的源代码. 贴上源代码 using System ...

  8. XML制作RSS源

    什么是RSS源?看到这片文章的人相信都知道.自己博客首页不就是一个吗? 好吧,先来一个简单点的.直接就是死代码:详细如何使用就看RSS使用标准吧! <?xml version = "1 ...

  9. spring mvc: 生成RSS源

    spring mvc: 生成RSS源 准备: 从相同的maven存储库页面下载 Rome 库及其依赖项rome-utils,jdom和slf4j.和所需的依赖关系 <!-- rss源依赖 --& ...

随机推荐

  1. Java练习 SDUT-1119_输入数字星期,输出英文(switch语句)

    C语言实验--输入数字星期,输出英文(switch语句) Time Limit: 1000 ms Memory Limit: 65536 KiB Problem Description 从键盘上输入数 ...

  2. Java练习 SDUT-1586_计算组合数

    计算组合数 Time Limit: 1000 ms Memory Limit: 32768 KiB Problem Description 计算组合数.C(n,m),表示从n个数中选择m个的组合数. ...

  3. Python基础:11变量作用域和闭包

    一:变量作用域 变量可以是局部域或者全局域.定义在函数内的变量有局部作用域,在一个模块中最高级别的变量有全局作用域. 全局变量的一个特征是除非被删除掉,否则它们的存活到脚本运行结束,且对于所有的函数, ...

  4. oracle函数 NLS_UPPER(x[,y])

    [功能]返回字符串并将字符串的转换为大写; [参数]x字符型表达式 [参数]Nls_param可选,指定排序的方式(nls_sort=) . SCHINESE_RADICAL_M(部首.笔画) SCH ...

  5. Object-c学习笔记十八-----NSPredicate

    Cocoa提供了一个类NSPredicate类,该类主要用于指定过滤器的条件,该对象可以准确的描述所需条件,对每个对象通过谓词进行筛选,判断是否与条件相匹配.谓词表示计算真值或假值的函数. NSPre ...

  6. pytorch学习笔记(十二):详解 Module 类

    Module 是 pytorch 提供的一个基类,每次我们要 搭建 自己的神经网络的时候都要继承这个类,继承这个类会使得我们 搭建网络的过程变得异常简单. 本文主要关注 Module 类的内部是怎么样 ...

  7. mysql format时间格式化说明

    原文地址为:mysql format时间格式化说明 date_format(datetime,formatting)可以格式日期和时间(例如 YYYY-MM-DD HH:MM:SS)和(HH:MM:S ...

  8. 在ORACLE存储过程中创建临时表

    在ORACLE存储过程中创建临时表 存储过程里不能直接使用DDL语句,所以只能使用动态SQL语句来执行 --ON COMMIT DELETE ROWS 说明临时表是事务指定,每次提交后ORACLE将截 ...

  9. Getting started with the basics of programming exercises_2

    1.编写简单power函数 #include<stdio.h> int power(int m, int n); // test power function int main(void) ...

  10. hdu 3790 最短路径问题(迪杰斯特拉)

    最短路径问题 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Subm ...