新浪新闻API
新浪新闻API
新浪新闻的API:
1.访问手机新浪网https://sina.cn/?from=sinacom(可以从新浪新闻的首页链接进入)
2.选择国内新闻,分析网页源代码,发现有个动态加载更多新闻的api
http://interface.sina.cn/wap_api/layout_col.d.json?&showcid=56261
访问之,发现返回json格式的新闻,但并不是当前页面的内容,即缺少参数
3、进一步分析网页,发现channel.min.js文件进行动态加载
使用我几乎没有的js知识,意会了一下源码:
(1)搜索了load_api,发现了channel.mim.js中的
W.loadMoreApplyURL=scope.load_api,W.page=2,W.show_num=scope.show_num,...
(2)搜索了loadMoreApplyURL,发现了
if(W.iscolumn){
var e=W.loadMoreApplyURL,t=W.page,n=W.show_num;
if($(".star_nav").length>0)
var o=$(".star_nav").data("type"),d=$("#j_"+o+"list").data("cid"),c=$("#j"+o+"_list").data("level");
else
var d=$("#j_items_list").find(".j_itemscard").last().data("cid"),c=$("#j_items_list").find(".j_itemscard").last().data("level");
var l={col:d,level:c,show_num:W.show_num,page:W.page,act:"more",jsoncallback:"callbackFunction"}}
else...
大概理解了一下:
变量o设置了type的值,变量d设置了cid的值,变量c设置了level的值
然后再变量l中为jsoncallback函数callbackFunction传递参数:
col:d,即cid,
level:c,即level的值,
show_num:W.show_num,即每页显示,
page:W.page,即页码
act:"more",表示更多
由此可以得到新浪新闻api:
接口:http://interface.sina.cn/wap_api/layout_col.d.json?&showcid=56261
参数:
col表示新闻类别
国内:56261
国际:56262
社会:56264
历史:97223
level表示新闻等级
show_num表示新闻条数
page表示页码
地方资讯:56327是无锡
http://interface.sina.cn/dfz/outside/wap/news/list.d.html?col=56327
娱乐频道:
https://interface.sina.cn/ent/feed.d.json?ch=ent&col=ent&act=more&t=1484477669001&show_num=10&page=4
参数说明:
ch:频道
娱乐:ent
体育:sports
科技:tech
教育:edu
健康:health
时尚:fashion
博客:blog
col:分类
show_num
page
新浪新闻API的更多相关文章
- 新浪新闻API接口
头条 http://api.sina.cn/sinago/list.json?channel=news_toutiao推荐 http://api.sina.cn/sinago/list.json?ch ...
- Python_网络爬虫(新浪新闻抓取)
爬取前的准备: BeautifulSoup的导入:pip install BeautifulSoup4 requests的导入:pip install requests 下载jupyter noteb ...
- 采集新浪新闻php插件
今天没事,就分享一个采集新浪新闻PHP插件接口,可用于火车头采集,比较简单,大家可以研究! 新浪新闻实时动态列表为:https://news.sina.com.cn/roll/?qq-pf-to=pc ...
- linux - 使用curl实现新浪天气API应用
新浪天气API的使用方法: API地址:http://php.weather.sina.com.cn/xml.php?city=%B1%B1%BE%A9&password=DJOYnieT82 ...
- 门户级UGC系统的技术进化路线——新浪新闻评论系统的架构演进和经验总结(转)
add by zhj:先收藏了 摘要:评论系统是所有门户网站的核心标准服务组件之一.本文作者曾负责新浪网评论系统多年,这套系统不仅服务于门户新闻业务,还包括调查.投票等产品,经历了从单机到多机再到集群 ...
- Lance老师UI系列教程第八课->新浪新闻SlidingMenu界面的实现
UI系列教程第八课:Lance老师UI系列教程第八课->新浪新闻SlidingMenu界面的实现 今天蓝老师要讲的是关于新浪新闻侧滑界面的实现.先看看原图: 如图所示,这种侧滑效果以另一种方式替 ...
- selenium+BeautifulSoup+phantomjs爬取新浪新闻
一 下载phantomjs,把phantomjs.exe的文件路径加到环境变量中,也可以phantomjs.exe拷贝到一个已存在的环境变量路径中,比如我用的anaconda,我把phantomjs. ...
- 小爬新浪新闻AFCCL
1.任务目标: 爬取新浪新闻AFCCL的文章:文章标题.时间.来源.内容.评论数等信息. 2.目标网页: http://sports.sina.com.cn/z/AFCCL/ 3.网页分析 4.源代码 ...
- Python爬虫:新浪新闻详情页的数据抓取(函数版)
上一篇文章<Python爬虫:抓取新浪新闻数据>详细解说了如何抓取新浪新闻详情页的相关数据,但代码的构建不利于后续扩展,每次抓取新的详情页时都需要重新写一遍,因此,我们需要将其整理成函数, ...
随机推荐
- Erlang学习记录:app demo
目录结构 │ Emakefile │ make.bat │ start.bat ├─config │ config.config │ server.app ├─ebin │ wulin_app.bea ...
- 那些年,我们见过的 Java 服务端“问题”
导读 明代著名的心学集大成者王阳明先生在<传习录>中有云: 道无精粗,人之所见有精粗.如这一间房,人初进来,只见一个大规模如此.处久,便柱壁之类,一一看得明白.再久,如柱上有些文藻,细细都 ...
- BCD Code ZOJ - 3494 AC自动机+数位DP
题意: 问A到B之间的所有整数,转换成BCD Code后, 有多少个不包含属于给定病毒串集合的子串,A,B <=10^200,病毒串总长度<= 2000. BCD码这个在数字电路课上讲了, ...
- object_detection/protos/*.proto: No such file or directory
1 背景 使用TensorFlow Object Detection API的时,在object_detection/protos/中,可以看到一些proto 文件,需要使用protoc程序将这些pr ...
- JavaWeb读取资源文件的四种方式
1. ServletContext 1. 调用getResourcesAsStream方法获取输入流, 相对于webroot, 不用加/2. 读取任何类型的文件3. *只能在web环境下使用 Inpu ...
- 今天给各位介绍Linux touch命令详述
触摸命令 touch命令有两个功能:一个是将现有文件的时间戳更新为系统的当前时间(默认模式),它们的数据将保持不变;第二个是创建一个新的空文件. 语法 触摸(可选) 最常见的用法:touch file ...
- Python基础笔记_变量类型
下面是W3C学习笔记 , , ) :] ]) :]) :]) :-]) :-]) ]) :]) :]) ) , , ]) :]) :]) ) , , , ]) :]) :]) ) ] = , ])) ...
- cache方法用于查询缓存操作,也是连贯操作方法之一。
cache方法用于查询缓存操作,也是连贯操作方法之一. cache可以用于select.find和getField方法,以及其衍生方法,使用cache方法后,在缓存有效期之内不会再次进行数据库查询操作 ...
- 0810NOIP模拟测试赛后总结
明日之后将是什么. 悲哀, 还是希望? 60分我没脸了…… 所以T1好不容易想到了正解结果实现打挂w0了…… 贪心想的还是相当完美的. 不知道我咋想的开了1e6个栈然后dfs模拟结果MLE原地自爆…… ...
- Python-网络编程之粘包、UDP
目录 粘包问题 subprocess模块 struct模块 UDP协议编程 简易qq聊天室 粘包问题 什么是粘包问题呢? 在我们写 tcp socket编程的时候,tcp协议是一个流式的协议,服务端第 ...