python爬京东（带GUI）

最近写了个专门爬百度的，后来又想爬京东的，还是采用上次的BeautifulSoup+requests模块

下面直接上代码，看不懂的可以看这篇文章或者注释来学习

#!/usr/bin/env python

# -*- coding: utf-8 -*-

#written by DY

#http://dyblog.tk

#e-mail:duyun888888@qq.com

########import###############

import requests

from bs4 import BeautifulSoup

#from openpyxl import *#写入表格使用，写入txt时报错

import time

from tkinter import *

import tkinter.messagebox

from  tkinter import ttk

########import结束############

#----------全局变量-----------

https = 'https:'

headers = {

    "Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",

    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.16 Safari/537.36",

}#定义头部信息，防止被网站阻止

name = []

price = []

introduct = []

urlss = []

#----------全局变量结束-------

#===============函数区域==============

#--------图形界面函数开始--------

def genxin():

	top = Tk()

	top.title("'%s'在'京东'中查询结果"%E1.get())

	top.geometry("800x600+600+100")

	columns = ("物品名", "价格", "简介", "链接")

	treeview = ttk.Treeview(top, show="headings", columns=columns, height='100')

	treeview.column("物品名", width=200, anchor='center')

	treeview.column("价格", width=50, anchor='center')

	treeview.column("简介", width=200, anchor='center')

	treeview.column("链接", width=50, anchor='center')

	treeview.heading("物品名", text="物品名")

	treeview.heading("价格", text="价格")

	treeview.heading("简介", text="简介")

	treeview.heading("链接", text="链接")

	treeview.pack()

	print(name)

	print(price)

	print(introduct)

	print(urlss)

	for write_ in range(min(len(name),len(price),len(introduct),len(urlss))): # 写入数据

	    treeview.insert('', write_, values=(name[write_], price[write_], introduct[write_], urlss[write_]))

	top.mainloop()

#--------图形界面函数结束--------

def searchstart():#打开页面查找，获取html

	url='https://search.jd.com/Search?keyword='+E1.get()

	url = str(url)

	html = requests.get(url,headers=headers).text#打开链接，获取html

	soup = BeautifulSoup(html, 'html.parser')

	for div in soup.find_all('div',class_="ml-wrap"):#包含价格，销量，商品，页数

		for shangpin in div.find_all('div',class_="goods-list-v2 gl-type-1 J-goods-list"):

			for prices in shangpin.find_all('div',class_="p-price"):#商品价格

				for pricess in prices.find_all('i'):

					if pricess=='':

						pricess='无'

					price.append(pricess.text)

		for shangpin in div.find_all('div',class_="goods-list-v2 gl-type-1 J-goods-list"):#商品

			for name_ in shangpin.find_all('div',class_="p-name p-name-type-2"):

				for titlename in name_.find_all('em'):#简介

					if titlename=='':

						titlename='无'

					introduct.append(titlename.text)

			for name_ in shangpin.find_all('div',class_="p-name p-name-type-2"):

				for introduction in name_.find_all('a',target="_blank"):#商品名

					introduction = introduction.get('title')

					if introduction=='':

						introduction='无'

					name.append(introduction)

			for url in shangpin.find_all('div',class_="p-name p-name-type-2"):

				for urls in url.find_all('a'):

					urlss.append(https+urls['href'])

	print(introduct)

	print(name)

	genxin()

#===============函数区域结束==========

##########图形界面开始#########

root = Tk()

root.title('京东商品 查询')

root.geometry('500x600')

L1 = Label(root, text="商品名： ")

L1.place(x = 5,y = 15)

E1 = Entry(root, bd =2)

E1.place(x = 60,y = 15)

A = Button(root, text ="确定",font=('Arial', 12), width=10, height=1,command=searchstart)

A.place(x = 350,y = 10)#确定按钮

root.mainloop()

###########图形界面结束#########

#written by DY

#http://dyblog.tk

#e-mail:duyun888888@qq.com

如果有不懂的，可以直接留言或者联系duyun888888@qq.com

python爬京东（带GUI）的更多相关文章

python实现的、带GUI界面电影票房数据可视化程序
代码地址如下:http://www.demodashi.com/demo/14588.html 详细说明: Tushare是一个免费.开源的python财经数据接口包.主要实现对股票等金融数据从数据采 ...
Python 实现的、带GUI界面的词云生成器
代码地址如下:http://www.demodashi.com/demo/14233.html 详细说明: "词云"就是数据可视化的一种形式,给出一段文本,根据文本中词语的出现频率 ...
python自带gui插件tkinter使用小结
1.tkinter简介 Tkinter(即 tk interface,简称"Tk")本质上是对 Tcl/Tk 软件包的 Python 接口封装,它是 Python 官方推荐的 GU ...
python爬虫系列之爬京东手机数据
python抓京东手机数据作者:vpoet mail:vpoet_sir@163.com #coding=utf-8 import urllib2 from lxml import etree im ...
用Python爬取分析【某东618】畅销商品销量数据，带你看看大家都喜欢买什么！
618购物节,辰哥准备分析一波购物节大家都喜欢买什么?本文以某东为例,Python爬取618活动的畅销商品数据,并进行数据清洗,最后以可视化的方式从不同角度去了解畅销商品中,名列前茅的商品是哪些?销售 ...
Python爬取南京市往年天气预报，使用pyecharts进行分析
上一次分享了使用matplotlib对爬取的豆瓣书籍排行榜进行分析,但是发现python本身自带的这个绘图分析库还是有一些局限,绘图不够美观等,在网上搜索了一波,发现现在有很多的支持python的绘图 ...
Python3.x：Selenium+PhantomJS爬取带Ajax、Js的网页
Python3.x:Selenium+PhantomJS爬取带Ajax.Js的网页前言现在很多网站的都大量使用JavaScript,或者使用了Ajax技术.这样在网页加载完成后,url虽然不改变但 ...
萌新学习Python爬取B站弹幕+R语言分词demo说明
代码地址如下:http://www.demodashi.com/demo/11578.html 一.写在前面之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这样 ...
python 爬取王者荣耀高清壁纸
代码地址如下:http://www.demodashi.com/demo/13104.html 一.前言打过王者的童鞋一般都会喜欢里边设计出来的英雄吧,特别想把王者荣耀的英雄的高清图片当成电脑桌面 ...

随机推荐

阿里巴巴《Java 开发者手册》+ IDEA编码插件
4月22日,阿里巴巴发布了泰山版<Java 开发手册>,以前以为终极版就真的是终极版了,没想到还是想的太简单了,继终极版之后又发布了详尽版.华山版,这不,泰山版又来了.想想也对,行业一直在 ...
centos7上安装memcached以及PHP安装memcached扩展（二）
开始在 PHP 中使用 Memcached 前, 我们需要确保已经安装了 Memcached 服务,接下来安装 php-memcached 扩展. PHP Memcached 扩展安装第一步:如果 ...
封装find_element
因为find_element_by_id,find_element_by_name底层都是用find_element实现元素查找 #!/usr/bin/env python # -*- coding: ...
Spark文档阅读之一：Spark Overview
Document: https://spark.apache.org/docs/latest/index.html 版本:2.4.5 1. spark的几种执行方式 1)交互式shell:bin/ ...
WeChair项目Alpha冲刺(10/10)
团队项目进行情况 1.昨日进展 Alpha冲刺第十天昨日进展: 前端:安排页面美化,设计实名认证后端:更新dao层代码数据库:修改数据表属性,与后端部署数据库交互 2.今日安排前端:继续 ...
spring Gateway 和注册中心整合环境搭建1
本博客主要是搭建一个gateway的demo,记录了自己踩过的各种坑项目目录 : 注册中心如下网关后端访问的应用网关我们首先来看注册中心的代码 pom.xml <?xml version= ...
JNI通过线程c回调java层的函数
1.参看博客:http://www.jianshu.com/p/e576c7e1c403 Android JNI 篇 - JNI回调的三种方法(精华篇) 2.参看博客: JNI层线程回调Java函数关 ...
Spring声明周期的学习心得
我们首先来看下面的一个案例: 这里是 HelloWorld.java 文件的内容: package com.yiibai; public class HelloWorld { private ...
Python3-shelve模块-持久化字典
Python3中的shelve提供了持久化字典对象和字典基本一个样,只不过数据保存在了文件中,没什么好说的,直接上代码注: 1.打开文件后不要忘记关闭文件 2.键只能是字符串,值可以是任何值 3. ...
Idea配置JRebel插件的详细配置及图解
Idea最新JRebel插件的详细配置及图解地址:https://blog.csdn.net/nyotengu/article/details/80629631#commentBox Ⅰ安装jreb ...

python爬京东（带GUI）

python爬京东（带GUI）的更多相关文章

随机推荐

热门专题