抓取mooc中国随笔

// $url = "http://www.baidu.com/";
　　$url= "https://www.icourse163.org/web/j/courseBean.getCoursePanelListByFrontCategory.rpc?csrfKey=8259facdbcf54eebbb98ee0b438c10b2";
　　$UserAgent = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36';
// $data=array('type'=>0,'orderBy'=>0,'pageIndex'=>1,'pageSize'=>20,'categoryId'=>'1001043131');
　　$data=array('type'=>0,'orderBy'=>0,'pageIndex'=>1,'pageSize'=>20);

// $headers = array("Content-Type: multipart/form-data", "Content-Length: 62","edu-script-token: 8259facdbcf54eebbb98ee0b438c10b2");
// $headers = array("Content-Type: multipart/form-data", "Content-Length: 62");
　　$referer ='https://www.icourse163.org/category/computer';
　　$curl = curl_init();
　　curl_setopt($curl, CURLOPT_URL, $url);
　　curl_setopt($curl, CURLOPT_COOKIE, 'EDUWEBDEVICE=99c3d9a6b54d43a7a9bcfe57b1f7f469; hb_MA-A976-948FFA05E931_source=www.baidu.com; WM_TID=FnTVRQrj75JFAVAUAVYpLtgFCUC00fNJ; P_INFO=176***********|1544579809|1|imooc|00&99|null&null&null#CN&null#10#0|&0||17638564503; NTESSTUDYSI=8259facdbcf54eebbb98ee0b438c10b2; utm="eyJjIjoiIiwiY3QiOiIiLCJpIjoiIiwibSI6IiIsInMiOiIiLCJ0IjoiIn0=|aHR0cHM6Ly93d3cuYmFpZHUuY29tL2xpbms/dXJsPURJc1lveUp6SVBuVUNBRUp2SkdvOU5CV3k1MVlidFVGOGFMUlktZGZCc0Q0V1BUNkgwUm5HM1N3ZHh3cUk3QXkmd2Q9JmVxaWQ9ZGI3YmQxZDgwMDAzZmQ3MDAwMDAwMDAzNWMxOTk5MGE="; __utma=63145271.1156471569.1544579763.1544579763.1545181455.2; __utmc=63145271; __utmz=63145271.1545181455.2.2.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; WM_NI=uB9OxGY%2Ff%2FUg2M2gqw6Ix3qwvOcP%2BlFtk7iePzDjB4QKd1Y6hxVMHgYe9Kkwq2t7v%2Bu2Bnax1nHcMckQaOMyPpUzP57cBZ68p1NHiD%2FeWHO0b%2F49o6ogUNOLPCqba5ISU0E%3D; WM_NIKE=9ca17ae2e6ffcda170e2e6ee9aaa40fc9c008ee25d81928fb2d14f978a8aabb76ff58fae97f16afcba8991f52af0fea7c3b92ab79ef7b0fb4d9bf1aad0d86df293fe88f47df697b8d4f47db691adb1aa6886aca5d8ec6f94a68c8bc1409395acd2dc3eaca89aaecb6d9bbbf7acea7db3eebcd8f521b7ee8e8fe474f3b28884d069a98fafb0d07394b09b9bd33ff5bd8ebbb534b4ef82a9ec50edbb99a9ce3ca2f1fcdaee3eadb99bafce48949dbf83e43f8b8d9bd1c837e2a3; __utmb=63145271.7.9.1545181499475');
　　curl_setopt($curl, CURLOPT_HEADER, 0); //0表示不输出Header，1表示输出
// curl_setopt($curl, CURLOPT_HTTPHEADER, $headers);
　　$data = http_build_query($data);
　　curl_setopt($curl, CURLOPT_REFERER, $referer);
　　if(!empty($data)){
　　　　curl_setopt($curl, CURLOPT_POST, true);
　　　　curl_setopt($curl, CURLOPT_POSTFIELDS, $data);
　　}
　　curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
　　curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
　　curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
　　curl_setopt($curl, CURLOPT_ENCODING, '');
　　curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);
　　curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
　　$data = curl_exec($curl);
　　echo '<pre>';
　　$dataArr=json_decode($data,true);
　　var_dump($dataArr['result']['result'][0]);

抓取mooc中国随笔的更多相关文章

python 爬虫抓取 MOOC 中国课程的讨论区内容
一:selenium 库 selenium 每次模拟浏览器打开页面,xpath 匹配需要抓取的内容.可以,但是特别慢,相当慢.作为一个对技术有追求的爬虫菜鸡,狂补了一些爬虫知识.甚至看了 scrapy ...
开源中国上抓取的content-type
开源中国上抓取的content-type类型,来源:http://www.cnblogs.com/smallyard/p/5632608.html { ".*": "ap ...
Python抓取第一网贷中国网贷理财每日收益率指数
链接:http://www.p2p001.com/licai/index/id/147.html 所需获取数据链接类似于:http://www.p2p001.com/licai/shownews/id ...
scrapy抓取中国新闻网新闻
目标说明利用scrapy抓取中新网新闻,关于自然灾害滑坡的全部国内新闻:要求主题为滑坡类新闻,包含灾害造成的经济损失等相关内容,并结合textrank算法,得到每篇新闻的关键词,便于后续文本挖掘分析 ...
【转】详解抓取网站，模拟登陆，抓取动态网页的原理和实现（Python，C#等）
转自:http://www.crifan.com/files/doc/docbook/web_scrape_emulate_login/release/html/web_scrape_emulate_ ...
网络爬虫：使用Scrapy框架编写一个抓取书籍信息的爬虫服务
上周学习了BeautifulSoup的基础知识并用它完成了一个网络爬虫( 使用Beautiful Soup编写一个爬虫系列随笔汇总 ), BeautifulSoup是一个非常流行的Python网 ...
网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(3): 抓取amazon.com价格
通过上一篇随笔的处理,我们已经拿到了书的书名和ISBN码.(网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息 ...
网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息及ISBN码
这一篇首先从allitebooks.com里抓取书籍列表的书籍信息和每本书对应的ISBN码. 一.分析需求和网站结构 allitebooks.com这个网站的结构很简单,分页+书籍列表+书籍详情页. ...
网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(1): 基础知识Beautiful Soup
开始学习网络数据挖掘方面的知识,首先从Beautiful Soup入手(Beautiful Soup是一个Python库,功能是从HTML和XML中解析数据),打算以三篇博文纪录学习Beautiful ...

随机推荐

LeetCode – LRU Cache (Java)
Problem Design and implement a data structure for Least Recently Used (LRU) cache. It should support ...
【rabbitmq】rabbitmq概念解析--消息确认--示例程序
概述本示例程序全部来自rabbitmq官方示例程序,rabbitmq-demo: 官方共有6个demo,针对不同的语言(如 C#,Java,Spring-AMQP等),都有不同的示例程序: 本示例程 ...
【Spring学习笔记-2.1】Spring的设值注入和构造注入
设值注入: 先通过无参数的构造函数创建一个Bean实例,然后调用对应的setter方法注入依赖关系: 配置文件: <?xml version="1.0" encoding=& ...
.NET使用Task动态创建多任务多线程并行程序计算Redis集群keys计算
Task是一个很好用的多任务处理类,并且通过Task可以对任务进行很好的控制. 下面将通过代码实现Redis集群在使用IServer.keys时通过多任务对多个服务器示例进行并行计算,并对返回key做 ...
P2871 手链
传送这个题的数据限制没有翻译出来,所以有可能产生爆内存现象再此翻译一下:1<=n(物品个数)<=3402,1<=M(总重量)<=12880 (就这两个有点用) 显然这是一个 ...
Java-Runoob-高级教程-实例-方法：06. Java 实例 – 方法覆盖
ylbtech-Java-Runoob-高级教程-实例-方法:06. Java 实例 – 方法覆盖 1.返回顶部 1. Java 实例 - 方法覆盖 Java 实例前面章节中我们已经学习了 Jav ...
LCA最小公共父节点的解题思路
LCA最小公共父节点解法: 1.二叉搜索树: 中序遍历是升序,前序遍历即按序插入建树的序列. 二叉搜索树建树最好用前序+中序,如果用前序建树,最坏情况会退化为线性表,超时. 最近公共祖先甲级: A11 ...
详解http和https的作用与区别
PS: https就是http和TCP之间有一层SSL层,这一层的实际作用是防止钓鱼和加密.防止钓鱼通过网站的证书,网站必须有CA证书,证书类似于一个解密的签名.另外是加密,加密需要一个密钥交换算法, ...
BrowserSync前端同步测试工具
安装教程
Linux 下 MQ 的安装
在WebSphere MQ 7.1版本以前,同时只能有一个产品的安装实例,在UNIX和Linux系统上,/usr/lib,/usr/bin和/usr/include目录下会增加一些软连接,也指向了这个 ...

抓取mooc中国随笔

抓取mooc中国随笔的更多相关文章

随机推荐

热门专题