新闻类网站rss接口的编写心得
使用的是Jdom中的相关API,具体步骤如下
要求的格式:
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" version="2.0">
<channel>
<title>上千趣,顶有趣</title>
<description>千趣网,有趣新闻第一聚合平台,生产和提供适合社交网络传播的各类有趣新闻。</description>
<link>http://www.qianqu.cc</link>
<language>zh_CN</language>
<pubDate>Tue, 06 Sep 2016 13:46:22 +0800</pubDate>
<item>
<title>
<![CDATA[俄罗斯推出女模裸体高速举牌活动,成效实在是太好了 ]]>
</title>
<link>http://127.0.0.1:8080/life/55720.html?from=LieBao&s=cm</link>
<description>
<![CDATA[俄罗斯的交通事故发生率非常高,每年有三万多人因此死亡受伤 ]]>
</description>
<content:encoded>
<![CDATA[
<article id="articleContent">
<p style="text-align: left; text-indent: 2em;">俄罗斯的交通事故发生率非常高,每年都有三万多人因此死亡受伤。为了让人们意识到超速行驶的危害,当局做了很多努力,效果都不理想。现在他们又做了一个大胆的尝试,那就是让半裸美女在街头举限速牌,提醒司机不要超速<span style="text-indent: 2em;">很多司机看到后果然将车速放缓,慢了下来。</span>
</p><p style="text-align: center; text-indent: 2em;"><img src="http://www.qianqu.cc/uploads/image/article/big/20160906/1473140636321029057.jpg"/></p><p style="text-align: left; text-indent: 2em;">因为美女的颜值太高了,当她们在路边举牌的时候路过的车辆无一不按照规定限速安全驾驶。当局让半裸美女举限速标志,就是为了让人们放慢车速,不管是要看美女还是看限速牌,只要慢下来就是成功。
</p><p style="text-align: center; text-indent: 2em;"><img src="http://www.qianqu.cc/uploads/image/article/big/20160906/1473140636507051888.jpg"/></p><p style="text-align: center; text-indent: 2em;"><img src="http://www.qianqu.cc/uploads/image/article/big/20160906/1473140636664041317.jpg"/></p><p style="text-align: center; text-indent: 2em;">
<img src="http://www.qianqu.cc/uploads/image/article/big/20160906/1473140636765052287.jpg"/></p><p style="text-align: center; text-indent: 2em;"><img src="http://www.qianqu.cc/uploads/image/article/big/20160906/1473140636859014104.jpg"/></p><p style="text-align: left; text-indent: 2em;">这就是俄罗斯街头的场景。
</p><p style="text-align: left; text-indent: 2em;">路边突然出现半裸美女,司机很容易分神。虽然她们是一番好意,举牌提醒司机不要超速,但分神带来的后果可能更加严重。之前莫斯科街头一辆印有女子胸部广告的卡车就在一天内引发500多起车祸。</p><p style="text-align: left; text-indent: 2em;">和美女一姐打嘴炮、探讨不一样姿势。微信添加朋友→公众号→搜“姿势情报局一姐”(已认证),太纯洁的,不要来!
<br style="text-align: left;"/></p></article>
]]>
</content:encoded>
<category>生活</category>
<source>千趣网</source>
<pubDate>Tue, 06 Sep 2016 13:44:18 +0800</pubDate>
</item>
</channel>
</rss>
第一步:创建根标签
Document doc = new Document();
Element rss = new Element("rss");
rss.setAttribute("version", "2.0");
doc.setRootElement(rss);
第二步:创建子标签(带有CDATA的)
Element channel = new Element("channel");
//将channel标签置于rss标签中
rss.addContent(channel);
//不带CDATA区域的
Element CTitle = new Element("title");
CTitle.addContent(channelData.getTitle());
channel.addContent(CTitle);
//带CDATA区域的
Element CDescription = new Element("description");
CDATA str = new CDATA(channelData.getDescription());
CDescription.addContent(str);
channel.addContent(CDescription);...........以此类推,需要多少标签,已同样的方式创建即可,如果标签较多,也得自己手动编写代码,是一件比较苦逼的活儿
第三步:使用io流将拼接好的xml输出
XMLOutputter out = new XMLOutputter();// 创建输出流
ByteArrayOutputStream buf = new ByteArrayOutputStream();
out.output(doc, buf);
String ok = buf.toString("ISO-8859-1");
return ok;
这里需要强调一下:这里的编码我这边是需要改成iso-8859-1的(控制台输出的=对应的日志也是乱码,但是再浏览器中访问接口链接时,不会出现乱码),我这我也比较郁闷,之前换成utf-8不好使,会出现乱码
注意事项:
1,我使用的是springmvc作为表现层框架的
@Controller
@RequestMapping("")
public class SuNingAction {
@Autowired
private SuNingService suNingService;
@RequestMapping(method={RequestMethod.GET},produces = MediaType.APPLICATION_XHTML_XML_VALUE,value={"/suNing"})
@ResponseBody()
public String Xiaozhi(HttpServletResponse response) throws JAXBException, IOException {具体代码就是上面的三大步骤;return null;}
2,关于xml中的名称空间问题<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" version="2.0">
Document doc = new Document();
Element rss = new Element("rss");
//名称空间的添加
Namespace ns= Namespace.getNamespace("content", "http://purl.org/rss/1.0/modules/content/");
rss.addNamespaceDeclaration(ns);
//版本号的添加
rss.setAttribute("version", "2.0");
doc.setRootElement(rss);
//这招绝对好用
3,有的rss中的content标签,需要带上encoded,比如说上面的案例就需要使用 <content:encoded>并且还需CDATA包裹
Element Icontent = new Element("encoded", "content","http://purl.org/rss/1.0/modules/content/");
CDATA c = new CDATA(itemData.get(i).getContent());
Icontent.addContent(c);
item.addContent(Icontent);
4,时间格式问题
涉及到时间的格式化问题Tue, 06 Sep 2016 13:44:18 +0800
还有就是星期的转化,中英文的转换问题,这些可以通过百度自行解决,并不是难点
5,还有最后一个问题是在servcie层中关于数据返回的问题
注意变量的定义的范围,也就是全局变量与局部变量的定义位置问题,当从数据库中获取到数据后,通过get/set方法存值时,千万注意,不要将变量定义成全局的
否则无论你检索的数据有多少条,存放值的对象中使用是一条相同的数据,这个问题虽然不大,但尽量不要犯,会被人嘲笑的, 擦,老子就被总监嘲笑半天.......
Element CDescription = new Element("description");
CDATA str = new CDATA(channelData.getDescription());
CDescription.addContent(str);
channel.addContent(CDescription);
新闻类网站rss接口的编写心得的更多相关文章
- GNE: 4行代码实现新闻类网站通用爬虫
GNE(GeneralNewsExtractor)是一个通用新闻网站正文抽取模块,输入一篇新闻网页的 HTML, 输出正文内容.标题.作者.发布时间.正文中的图片地址和正文所在的标签源代码.GNE在提 ...
- 新闻类网站的通用爬虫--GNE
GNE(GeneralNewsExtractor)是一个通用新闻网站正文抽取模块,输入一篇新闻网页的 HTML, 输出正文内容.标题.作者.发布时间.正文中的图片地址和正文所在的标签源代码.GNE在提 ...
- Java基础-接口.编写2个接口:InterfaceA和InterfaceB;在接口InterfaceA中有个方法void printCapitalLetter();在接口InterfaceB中有个方法void printLowercaseLetter();然 后写一个类Print实现接口InterfaceA和InterfaceB,要求 方法 实现输出大写英文字母表的功能,printLowerca
#34.编写2个接口:InterfaceA和InterfaceB:在接口InterfaceA中有个方法void printCapitalLetter():在接口InterfaceB中有个方法void ...
- java处理高并发高负载类网站的优化方法
java处理高并发高负载类网站中数据库的设计方法(java教程,java处理大量数据,java高负载数据) 一:高并发高负载类网站关注点之数据库 没错,首先是数据库,这是大多数应用所面临的首个SPOF ...
- [转]java处理高并发高负载类网站的优化方法
本文转自:http://www.cnblogs.com/pengyongjun/p/3406210.html java处理高并发高负载类网站中数据库的设计方法(java教程,java处理大量数据,ja ...
- 用react开发一个新闻列表网站(PC和移动端)
最近在学习react,试着做了一个新闻类的网站,结合ant design框架, 并且可以同时在PC和移动端运行: 主要包含登录和注册组件.头部和脚部组件.新闻块类组件.详情页组件.评论和收藏组件等: ...
- 爬取表格类网站数据并保存为excel文件
本文转载自以下网站:50 行代码爬取东方财富网上市公司 10 年近百万行财务报表数据 https://www.makcyun.top/web_scraping_withpython6.html 主要学 ...
- web应急:新闻源网站劫持
新闻源网站一般权重较高,收录快,能够被搜索引擎优先收录,是黑灰产推广引流的必争之地,很容易成为被攻击的对象.被黑以后主要挂的不良信息内容主要是博彩六合彩等赌博类内容,新闻源网站程序无论是自主开发的还是 ...
- TestNG使用教程详解(接口测试用例编写与断言)
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/sinat_34766121/artic ...
随机推荐
- Hadoop学习笔记——搭建
一搭建环境列表 操作系统:centos6.5 64位 JDK环境:jdk1.7.0_71 hadoop版本:社区版本2.7.2,hadoop-2.7.2-src.tar.gz 主机名 ip 角色 用户 ...
- Gamma函数是如何被发现的?
学过微积分的人,肯定都接触过Euler积分,按教科书上的说法,这是两种含有参变量的定积分,但其实没那么玄乎,它们只是两个函数.其中第一型Euler积分叫\(B\)-函数,第二型Euler积分叫\(\G ...
- Android开发学习之路-带文字的图片分享
有用过微信分享SDK的都应该知道,微信分享到朋友圈的时候是不能同时分享图片和文字的,只要有缩略图,那么文字就不会生效.那么问题就来了,如果我们想把APP内的某些内容连带图片一起分享到微信,是不是没办法 ...
- slave IO流程之一:mysql登陆过程(mysql_real_connect)
最近看了slave IO的源码,发现slave IO的写relay log貌似是单线程单连接的,这让我有点小失望. slave IO的主函数是handle_slave_io,处理流程如下: 图1 ha ...
- Redux
redux是Flux的一种实现方式,但还是和Flux有些不同. React控制视图层,要想做一个完整的数据流,必须要用react-redux. 官方demo,自己收集了一下: demo1http:// ...
- CSS系列:CSS中盒子之间的关系
1. 标准文档流 标准文档流是值在不使用其他的雨排列和定位相关的特殊CSS规则时,各种元素的排列规则. 1.1 块级元素(block level) 块级元素不会排在同一行中,总是以一个块的形式表现出来 ...
- LINQ系列:Linq to Object投影操作符
投影是指在将序列中的元素转换为一个自定义形式的操作.投影操作符Select和SelectMany用于选择出赋予了适当功能的值.SelectMany操作符可以处理多个集合. LINQ表达式语法: 1. ...
- 【CSS进阶】box-shadow 与 filter:drop-shadow 详解及奇技淫巧
box-shadow 在前端的 CSS 编写工作想必十分常见.但是 box-shadow 除去它的常规用法,其实还存在许多不为人知的奇技淫巧. 喜欢 markdown 版本的可以戳这里. box-sh ...
- C# Excel 为图表添加模拟运算表
Excel中的图表能够将数据可视化,方便我们比较分析数据.但也有一定的局限,例如:不能够直接从图表中读出原来数据的准确值.Excel提供的解决方案是,在图表下方添加一个模拟运算表,即在坐标轴下方添加包 ...
- C++入门知识总结(1)
1.有符号数和无符号数. 这个问题其实是一个很细的问题,我们还要把问题追溯到“位”,针对不同的“位”,那么能表示的最大数的范围不同.因为计算机存储数据都是以二进制的方式去存储的,即0和1,比如 110 ...