终于盼来了不是前言部分的前言,相当于杂谈,算得上闲扯,我觉得很多东西都是在闲扯中感悟的,比如需求这东西,一个人只有跟自己沟通好了,总结出某些东西了,才能更好的和别人去聊,去说. 今天这篇写的是明白需求,其实更多的是想和大家聊天,只有把这个聊开了,后面的东西做起来才有意义,才有价值,在聊天中,思考中发现价值(化身为话唠了?) 有时候你自以为某些东西很重要,其实那只是站在自己的角度觉得很重要,更需要的是站在别人,站在市场的角度去思考这个问题,特么的到底重不重要. 需求我觉得可以分为两类:自己主动去做…
1.首先是安装python(注意python3.X和python2.X是不兼容的,我们最好用python3.X) 安装方法:安装python 2.安装成功后,再进行我们需要的插件安装.(这里我们需要用到requests和pymssql两个插件re是自带的)注:这里我们使用的是sqlserver所以安装的是pymssql,如果使用的是mysql可以参考:安装mysql驱动 安装插件的方法为 安装pymssql->进入命令行输入命令:pip install pymssql 安装requests->…
要抓取http://www.alexa.cn/rank/baidu.com网站的排名信息:例如抓取以下信息: 需要微信扫描登录 因为这个网站抓取数据是收费,所以就利用网站提供API服务获取json信息: 上面的API KEY值需要花钱买的(注意开通会员的方式不行,必须以10000次查询 49.00 元这种方式,比较坑爹啊) 具体python代码 # coding=utf-8 import json import httplib2 import json import xlrd import xl…
从现成的网站上抓取汽车品牌,型号,车系的数据库记录. 先看成果,大概4w条车款记录 一共建了四张表,分别存储品牌,车系,车型和车款 大概过程: 使用jQuery获取页面中呈现的大批内容 能通过页面一次性获得所需大量数据的,通过jQuery获取原数据,并一条条显示在console面板中.每条我是直接拼接成sql显示. 打开chrome,进到地址http://www.autozi.com/carBrandLetter/.html.按F12点console面板.粘贴下面的内容 $("tr.event_…
App接口爬取数据过程使用抓包工具手机使用代理,app所有请求通过抓包工具获得接口,分析接口反编译apk获取key突破反爬限制需要的工具:夜神模拟器FiddlerPycharm实现过程首先下载夜神模拟器模拟手机也可以用真机,然后下载Fiddler抓取手机APP数据包,分析接口完成以后使用Python实现爬虫程序 Fiddler安装配置过程第一步:下载神器FiddlerFiddler下载完成之后,傻瓜式的安装一下! 第二步:设置Fiddler打开Fiddler, Tools-> Fiddler O…
搬自大神boyXiong的干货! 闲来无事,看看了Python,发现这东西挺爽的,废话少说,就是干 准备搭建环境 因为是MAC电脑,所以自动安装了Python 2.7的版本 添加一个 库 Beautiful Soup ,方法这里说两种  1.在终端输入 pip install BeautifulSoup 2.手动下载包后,终端切换到 解压的文件夹,输入 sudo python setup.py install 下载地址BeautifulSoup 开始写代码吧  先找一个想要抓取东西的网站,这里我…
需求: 某某金融大亨想涉足金融网贷,想给网贷平台取一个名字,那么取什么名字,名字里面包含哪些关键字,在行业内的曝光率会相比较高一些呢? 可以理解为: 你负责某某网贷平台的网络推广工作,如何进一步优化各广告推广平台上的搜索关键词,这些网贷平台的名称都有啥共同点? 其实就是: 想看看各网贷平台名称的高频词汇,给各平台的名称划下重点   找数据: 获取所有网贷平台的平台基本名称数据,这样子才能进行下一步工作 把网贷之家上所有平台的数据找出来,这样就可以了 读取数据: import pymysql im…
数据来源网站http://baidu.lecai.com/lottery/draw/list/50?d=2013-01-01 HTML解析器http://pythonhosted.org/pyquery/ (可以像JQuery那样使用) 源码: import MySQLdb as mysql from pyquery import PyQuery as pq create_table_sql = ''' create table union_lotto( issue int primary ke…
我是把数据放在 mongodb ,然后单独一个脚本作分析,导出 json ,用 c3.js 画图,然后随便写个很简单的页面就好了. 展示在这里: http://107.170.207.236/job_analysis 代码在这里: https://github.com/namco1992/job_analysis…
Web Scraping在大数据时代,一切都要用数据来说话,大数据处理的过程一般需要经过以下的几个步骤    数据的采集和获取    数据的清洗,抽取,变形和装载    数据的分析,探索和预测    数据的展现其中首先要做的就是获取数据,并提炼出有效地数据,为下一步的分析做好准备.数据的来源多种多样,以为我本身是足球爱好者,而世界杯就要来了,所以我就想提取欧洲联赛的数据来做一个分析.许多的网站都提供了详细的足球数据,例如:    网易 http://goal.sports.163.com/   …