nodejs爬虫数据存入mysql

node爬虫主要用的是三个插件

request  cheerio mysql

废话不多说直接上代码

const request=require("request")

const cheerio=require("cheerio")

const  mysql=require('mysql')

var connection = mysql.createConnection({  //配置参数，然后添加你的数据库里面的表

  host: 'localhost',

  user: 'root',

  password: 'root',

  database: 'test'

})

connection.connect();  //连接

function show(item){

  request('http://www.1905.com/vod/list/n_1_t_1/o1p'+item+'.html',function(err,res){

      if(err){

          console.log('请求出错');

      }else{

          var $ = cheerio.load(res.body, {decodeEntities: false});

          $('.search-list>div').each(function(){

              var newsTitle = $(this).find('p').text();

              var news1Title = $(this).find('h3').text();

              var code = $(this).find('i').text();

              var newsTime= "";

              var newsUrl= $(this).find('a').attr('href');

              var addSql = "insert into blog(title,time,href,title2,codeNum) values (?,?,?,?,?)";

              var addParmas = [newsTitle, newsTime,newsUrl,news1Title,code];

              connection.query(addSql,addParmas,function(err,data){

                if(err){

                    console.log("数据库连接错误");

                }else{

                  item++;

                  show(item)

                }

              })

          });

      }

  });

}

show(1)

前提是一定要先分析别人网站的页面结构，然后就是如果你没有esc的话，你打开本地的mysql，再test下建立一张blog的表即可

最后的效果是

就这........

对了，就是如果你没有取消mysql的限制的话，应该是只可以导入1000条数据的，如果你想取消限制的话，可以直接如下图点击取消即可

nodejs爬虫数据存入mysql的更多相关文章

python 爬虫数据存入csv格式方法
python 爬虫数据存入csv格式方法命令存储方式:scrapy crawl ju -o ju.csv 第一种方法:with open("F:/book_top250.csv" ...
php+phpspreadsheet读取Excel数据存入mysql
先生成Excel模板,然后导入Excel数据到mysql,每条数据对应图片上传到阿里云 <?php /** * Created by PhpStorm. * User: Administrato ...
Scrapy爬虫实例教程（二）---数据存入MySQL
书接上回实例教程(一) 本文将详细描述使用scrapy爬去左岸读书所有文章并存入本地MySql数据库中,文中所有操作都是建立在scrapy已经配置完毕,并且系统中已经安装了Mysql数据库(有权限操 ...
手把手教你写带登录的NodeJS爬虫+数据展示
其实在早之前,就做过立马理财的销售额统计,只不过是用前端js写的,需要在首页的console调试面板里粘贴一段代码执行,点击这里.主要是通过定时爬取https://www.lmlc.com/s/web ...
关于mapreducer 读取hbase数据存入mysql的实现过程
mapreducer编程模型是一种八股文的代码逻辑,就以用户行为分析求流存率的作为例子 1.map端来说:必须继承hadoop规定好的mapper类:在读取hbase数据时,已经有现成的接口 Tabl ...
web项目数据存入mysql数据库中文乱码问题
刚开始怀疑是项目中编码设置问题,发现在web.xml中已经有过设置:后来dubug显示数据在传输的过程中一切正常,怀疑是数据库编码问题,然后查看mysql编码: show variables like ...
【python 2.7】python读取json数据存入MySQL
同上一篇,只是适配 CentOS+ python 2.7 #python 2.7 # -*- coding:utf-8 -*- __author__ = 'BH8ANK' import json im ...
【python 3.6】python读取json数据存入MySQL（二）
在网上找到一个包含全国各省市经纬度的json文件,也可以通过上次的办法,解析json关键字,构造SQL语句,插入数据库. JSON文件格式如下: [ { "name": " ...
【python 3.6】python读取json数据存入MySQL（一）
整体思路: 1,读取json文件 2,将数据格式化为dict,取出key,创建数据库表头 3,取出dict的value,组装成sql语句,循环执行 4,执行SQL语句 #python 3.6 # -* ...

随机推荐

[No0000C4]TortoiseSVN配置外部对比工具
TortoiseSVN -> Settings Diff Viewer : 选中External->找到外部工具:如BCompare.路径如果有空格的最好用"双引号"括 ...
tensorflow的tile使用
当你需要按照矩阵维度复制数据时候,可以使用tensorflow的tile函数 a1 = tf.tile(a, [2, 2]) 表示把a的第一个维度复制两次,第二个维度复制2次.注意使用tf.nn.so ...
C和C指针小记(九)-指针用法1
1. *p++ 最常用的一个指针的用法,就是在循环中用来迭代. *p++ 共有3步操作: 1.++操作符把p所指向的内存中的值复制一份 2.++操作符把p加1(实际是一个p所指内存单元的大小,这也是编 ...
回归cgi、fastcgi原理，解释、解决异常 fastcgi支持分布式计算的原因
小结: 0.结构图 client-request ---> cgi/fastcgi (interface/server) ---> cgi/fastcgi program/applica ...
Web Deploy远程部署配置图解
原文链接:https://jingyan.baidu.com/album/642c9d34e614de644a46f783.html
10.5-uC/OS-III内部任务（时基任务OS-TickTask()）
几乎所有的实时系统都需要有一个能提供周期性时间的时间源,叫做时基周期或系统周期. uC/OS-III的时基周期处理程序封装在OS_TICK.C文件中. OS_TickTask()任务被uC/OS-II ...
（1.11）SQL优化——mysql提示（hint）
(1.11)mysql hint 关键词:mysql提示 1.SQL提示 (hint)是优化数据库的手段之一,使用它加入一些人为的提示来达到优化操作的目的: 举例: select sql_buffer ...
Git/GitHub基本操作
GitGit是分布式版本控制工具,SVN是集中式版本控制,有单点故障的问题GitHub是Git的代码托管中心,类似的国内有码云,是远程维护库Git的优势大部分操作在本地完成,不需要联网完整性有保证尽可 ...
MSSQL查询收缩和备份进度
--查询当前数据库备份进度 SELECT DB_NAME(er.[database_id]) [DatabaseName],er.[command] AS [CommandType],er.[pe ...
mac-破解2018 webstorm
参考链接:https://blog.csdn.net/pariese/article/details/77540069 后续待整理

nodejs爬虫数据存入mysql

nodejs爬虫数据存入mysql的更多相关文章

随机推荐

热门专题