Python爬虫获得淘宝商品评论

　　自从写了第一个sina爬虫，便一发不可收拾。进入淘宝评论爬虫正题：

　　在做这个的时候，也没有深思到底爬取商品评论有什么用，后来，爬下来了数据。觉得这些数据可以用于帮助分析商品的评论，从而为用户选择商品提供一定的可参考数据。

　　找评论所在真实url:有了前面爬搜狗图片的经验，面对找资料的url这件事，找他的速度是比第一次快了不少。首先进宝贝页面，如图

发现评论与搜狗图片类似，均为动态刷新。因此，F12（开发者选项）>>Notework>>F5(刷新)>>feedRateList（文件名）>>Headers>>复制Request URL

　　去除不必要的字段，获得需要的资料（评论）所在url= https://rate.taobao.com/feedRateList.htm?auctionNumId=39595400262&currentPageNum=1

猜测url地址为商品id，PageNum为评论的所在页数。因此要把所有页的评论遍历一遍。则应取Num的值递增访问，统计评论，直至输出的评论数等于总评为止，Num不再叠加，当然叠加后肯定是404喽。

愉快的代码时间:

import requests

import json

def getCommodityComments(url):

    if url[url.find('id=')+14] != '&':

        id = url[url.find('id=')+3:url.find('id=')+15]

    else:

        id = url[url.find('id=')+3:url.find('id=')+14]

    url = 'https://rate.taobao.com/feedRateList.htm?auctionNumId='+id+'&currentPageNum=1'

    res = requests.get(url)

    jc = json.loads(res.text.strip().strip('()'))

    max = jc['total']

    users = []

    comments = []

    count = 0

    page = 1

    print('该商品共有评论'+str(max)+'条,具体如下: loading...')

    while count<max:

        res = requests.get(url[:-1]+str(page))

        page = page + 1

        jc = json.loads(res.text.strip().strip('()'))

        jc = jc['comments']

        for j in jc:

            users.append(j['user']['nick'])

            comments.append( j['content'])

            print(count+1,'>>',users[count],'\n        ',comments[count])

            count = count + 1

getCommodityComments('https://item.taobao.com/item.htm?id=39595400262&')

来来来，看一下效果：

综上，Python爬虫的关键就在于获取所要爬取资料所在真实url，得到该url后，只需要做相应处理，for循环遍历所有页即可爬取获得资料，重要的资料亦可写进数据库。

Python爬虫获得淘宝商品评论的更多相关文章

Python 爬虫知识点 - 淘宝商品检索结果抓包分析（续一）
通过前一节得出地址可能的构建规律,如下: https://s.taobao.com/search?data-key=s&data-value=44&ajax=true&_ksT ...
Python 爬虫知识点 - 淘宝商品检索结果抓包分析
一.抓包基础在淘宝上搜索“Python机器学习”之后,试图抓取书名.作者.图片.价格.地址.出版社.书店等信息,查看源码发现html-body中没有这些信息,分析脚本发现,数据存储在了g_page_ ...
Python 爬虫知识点 - 淘宝商品检索结果抓包分析（续二）
一.URL分析通过对“Python机器学习”结果抓包分析,有两个无规律的参数:_ksTS和callback.通过构建如下URL可以获得目标关键词的检索结果,如下所示: https://s.taoba ...
Python 爬取淘宝商品数据挖掘分析实战
Python 爬取淘宝商品数据挖掘分析实战项目内容本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 爬取淘宝商品 ...
Python 爬取淘宝商品信息和相应价格
!只用于学习用途! plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html) :获得商品价格和view_pri ...
python 获取淘宝商品信息
python cookie 获取淘宝商品信息 # //get_goods_from_taobao import requests import re import xlsxwriter cok='' ...
利用Python爬虫爬取淘宝商品做数据挖掘分析实战篇，超详细教程
项目内容本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析词云可视化 2. ...
Python爬虫之定时抢购淘宝商品
Python爬虫之定时抢购淘宝商品 import time from selenium import webdriver import datetime class Spider: def __ini ...
python爬虫学习(三)：使用re库爬取"淘宝商品"，并把结果写进txt文件
第二个例子是使用requests库+re库爬取淘宝搜索商品页面的商品信息 (1)分析网页源码打开淘宝,输入关键字“python”,然后搜索,显示如下搜索结果从url连接中可以得到搜索商品的关键字是 ...

随机推荐

vue 构建项目遇到的问题
1.我在打包完成后,打开index.html文件发现地址并没有携带路由. config下的 index.js 中的build命令的配置有一个属性叫assetsPublicPath,它的值为‘/’.意思 ...
C#:获取视频某一帧的缩略图
读取方式:使用ffmpeg读取,所以需要先下载ffmpeg.网上资源有很多. 原理是通过ffmpeg执行一条命令获取视频某一帧的缩略图. 首先,需要获取视频的帧高度和帧宽度,这样获取的缩略图才不会变形 ...
转载:python生成以及打开json、csv和txt文件
原文地址:https://blog.csdn.net/weixin_42555131/article/details/82012642 生成txt文件: mesg = "hello worl ...
robot framework笔记(一)：环境配置（基于python3）+在pycharm中编写及运行robot脚本
(一)使用pip安装robotframework框架和seleniumlibrary库 pip install --upgrade robotframework pip install --upgra ...
mssql-sqlserver入门必备知识收集
一.了解SQL 数据库的应用场景 sql 简介二. 检索数据 SELECT语句检索单个.多及所有列的方法分享检索不同的值限制结果 sqlserver注释编写方法三.排序检索数据 ...
洗礼灵魂，修炼python（73）--全栈项目实战篇（1）——【转载】前提准备之学习ubuntu
本篇是为项目实战做准备,学习Linux是必备的,不然都不好意思叫全栈对吧?下面是一位资深大神写的文章,够详细,我也不用浪费时间再写了原文链接:Ubuntu学习——第一篇内容: 一. Ubuntu简 ...
C#获取日期的星期名称
private string GetWeekName(DayOfWeek week) { string weekName = ""; switch (week) { case Da ...
第九章通过 SMB 共享虚拟机
自 Windows Server 2012 起,微软引入了 SMB 3.0 的概念,通过 SMB 3.0,可以实现很多新的功能,包括我们介绍过的"SMB 多通道",以及将虚拟机 ...
Thinkphp框架中自定义修改success和error页面
Thinkphp框架中自定义修改success和error页面 Thinkphp框架的默认success和error太难看,可以自定义设置,步骤如下: (注意:TP原框架中的success跳转有问题, ...
.net的mvc的fw版本为4.5发布到阿里云【云虚拟主机】上.
注意:云虚拟主机和云服务器(ECS)不是同一个产品,请注意分别. 云服务器ECS: 云虚拟主机: 我用的是云虚拟主机也是第二个,版本是window server 声明:默认,已经把域名[已备案]绑定 ...

Python爬虫 获得淘宝商品评论

Python爬虫 获得淘宝商品评论的更多相关文章

随机推荐

热门专题

Python爬虫获得淘宝商品评论

Python爬虫获得淘宝商品评论的更多相关文章