Python ===if while for语句 以及一个小小网络爬虫实例
if分支语句
>>> count=89
>>> if count==89:
print count
89 #单分支
>>>
#coding:utf-8
count=int(raw_input('请输入一个数字'))
print count
if count>80:
print '比80大'
else:
if count<80:
print ‘比80小’ #多分支
=======自定义函数 while if else===========
#coding:utf-8
count=int(raw_input('请输入一个数字'))
print count
if count>80:
print '比80大'
else:
print '比80小'
print 'End'
sex=raw_input('请输入您的性别')
def inputsex(sex):
while(sex!='male' and sex!='female'):
print sex
sex=raw_input('请输入性别为male 或者 female')
if sex=='male':
print 'Gentleman!'
else:
if sex=='female':
print 'Lady'
inputsex(sex)
=====if else的关系表达式bool判断 非0即真!=====
#coding:utf-8
if True:
print '1True'
else:
print 'False'
if 0:
print '2True'
else:
print '2False'
if 1:
print '3True'
else:
print '3False'
if 298:
print '4True'
else:
print '4False'
if -2:
print '5True'
else:
print '5False'
1True
2False
3True
4True
5True
If
if (A and B):
if (A or B):
if not A:
=======================while循环体========================
========网络刷浏览量的爬虫=======
#coding:utf-8
import time
import webbrowser
import os
import random
count=random.ranint(2,8)
i=1
j=0
while j<count:
while i<=3:
webbrowser.open_new_tab('www.baidu.com')
i=i+1
time.sleep(3)
else:
os.system('taskkill /F /IM iexplore.exe')
j=j+1
#windows下用taskkill 用的时候上网搜一下
#linux系统下用kill -pid 或者 killall chrome
#ranint就是随机整数
=======for循环语句============
for val in sth. 其中val不用预先声明
For遍历字符串
#coding:utf-8
s1='www.baidu.com'
i=0
for n in s1:
print format(i,'2d'),n
i=i+1
else:
print 'out for'
#format(i,’2d’)使i占两个输出位
For遍历list列表数组
#coding:utf-8
list1=[0,11,45,'dkfjah',12.5] 列表类型
i=0
for val in list1:
print format(i,'2d'),val
i=i+1
也可以直接写成这样
#coding:utf-8
i=1
for val in [11,23,0,'dfadf','国语',12.45]:
print format(i,'2d'),val
i=i+1
将字符串转换成list list(str)
#coding:utf-8
s1='www.baidu.com'
i=1
list1=list(s1)
print list1
for val in list1:
print format(i,'2d'),val
i=i+1
元组 for遍历元组tuple
#coding:utf-8
#用圆括号括起来的是元组,元组中的数据只可读,不可修改。
tup=(1,2,3,4,5) 元组类型
for t in tup:
print t
else:
print 'out tup'
for遍历文件 for val in file.readlines()
#coding:utf-8
#如果所读的文件与此py程序文件所在地址一样,则直接写文件名
for s in open('11.txt','r').readline():
print s
li3=open('11.txt','r').readlines()
for a in open('11.txt','r').readlines():
open('tmp.txt','a+').write(a) #a+是追加写入 r 读 w写 w+如果没有此文件先创建再写入
print a
print len(li3)
#len(li3)输出列表有多长 这里即文章有多少行
#readline()返回字符串 默认返回第一行
#readlines()返回list 默认为文件中所有行的list
#用help(file.readline)查看帮助
Python 爬虫如何获取 JS 生成的 URL 和网页内容?
例如看页面是用Ajax请求一个JSON文件,我就先爬那个页面,获取Ajax所需的参数,然后直接请求JSON页,然后解码,再处理数据并入库。
如果你直接运行页面上所有js(就像浏览器做的那样),然后获取最终的HTML DOM树,这样的性能非常地糟糕,不建议使用这样的方法。因为Python和js性能本身都很差,如果这样做,会消耗大量CPU资源并且最终只能获得极低的抓取效率。
Python ===if while for语句 以及一个小小网络爬虫实例的更多相关文章
- Python 利用Python编写简单网络爬虫实例3
利用Python编写简单网络爬虫实例3 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站“http://bbs.51testing. ...
- Python 利用Python编写简单网络爬虫实例2
利用Python编写简单网络爬虫实例2 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站“http://www.51testing. ...
- python爬虫系列(1)——一个简单的爬虫实例
本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片. 1. 概述 本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片.下载图片的步骤如下: 获取网页html文本内容:分析html中 ...
- Python Socket,How to Create Socket Server? - 网络编程实例
文章出自:Python socket – network programming tutorial by Silver Moon 原创译文,如有版权问题请联系删除. Network programin ...
- [Python] 前程无忧招聘网爬取软件工程职位 网络爬虫 https://www.51job.com
首先进入该网站的https://www.51job.com/robots.txt页面 给出提示: 找不到该页 File not found 您要查看的页已删除,或已改名,或暂时不可用. 请尝试以下操作 ...
- 《Python编程》课程报告 python技术在数据分析中的应用之网络爬虫
摘要:... 2 1 引言 :... 2 1.1课题研究背景和研究现状... 2 1.1.1课题背景和目的... 3 1.1.2研究现状... 4 1.1.2.1语言... 4 1.1 ...
- Python数据抓取(2) —简单网络爬虫的撰写
(一)使用Requests存储网页 Requests 是什么?网络资源(URLs)抓取套件 优点? 改善urllib2的缺点,让使用者以最简单的方式获取网络资源 可以使用REST操作(POST,PUT ...
- 一个使用 asyncio 开发的网络爬虫(译文)
原文地址:https://www.aosabook.org/en/500L/a-web-crawler-with-asyncio-coroutines.html 作者简介 A. Jesse Jiryu ...
- [Python]网络爬虫( 连载:大牛汪海 )
汪海个人博客:http://blog.callmewhy.com/ Python爬虫专栏,汪海专栏 Python爬虫入门教程 简单的介绍如何使用Python的相关模块如urllib2来实现网络爬虫的基 ...
随机推荐
- 给 Xamarin.Form For Windows Phone APP 加个漂亮的 "头"
Windows Phone 是那个1%, 我也是那个1%, 不喜勿喷.WP 向来给 android / ios 的粉们一个最直观的印象: 丑.其实"丑"这个东西会一直下去,而且是个 ...
- 【niubi-job——一个分布式的任务调度框架】----框架设计原理以及实现
引言 niubi-job的框架设计是非常简单实用的一套设计,去掉了很多其它调度框架中,锦上添花但并非必须的组件,例如MQ消息通讯组件(kafka等).它的框架设计核心思想是,让每一个jar包可以相对之 ...
- xsd、wsdl生成C#类的命令行工具使用方法
1.xsd生成C#类命令 示例:xsd <xsd文件路径> /c /o:<生成CS文件目录> <其他参数> 参数说明: /c 生成为cs文件,/d 生成DataSe ...
- poj2752 KMP
需要理解next[]的意义.之前看到大牛的博客,next[]讲的非常清楚. 利用next[],当前位子的前面那一段和next[当前位子]的前面那一段是相同的.又next[next[当前位子]]与nex ...
- 将定时任务cron 解析成中文
在使用定时器 quartz 时,其中的cron 表达式,老板表示作为开发的你能看懂外,其他的非开发同事可能看不懂,要用一个他们能看懂的方式表达出来. 还好我们的项目要求的表达式不是特别的麻烦,所以就写 ...
- Java 关键字 native
native 关键字说明其修饰的方法是一个原生态方法,方法对应的实现不是在当前文件中,而是在用其他语言实现的文件中.Java语言本身不能对操作系统底层进行访问和操作,但是可以通过JNI接口调用其他语言 ...
- Java基础-字面值
在Java源代码中,字面值用于表示固定的值(fixed value).数值型的字面值是最常见的,字符串字面值可以算是一种,当然也可以把特殊的null当做字面值.字面值大体上可以分为整型字面值.浮点字面 ...
- SOM自组织映射网络 教程
概述 SOM是芬兰教授Teuvo Kohonen提出的一种神经网络算法,它提供一种将高维数据在低维空间进行表示的方法(通常是一维或二维).缩减向量维度的过程,叫做向量量化(vector quantis ...
- HDU-1394 Minimum Inversion Number 线段树+逆序对
仍旧在练习线段树中..这道题一开始没有完全理解搞了一上午,感到了自己的shabi.. Minimum Inversion Number Time Limit: 2000/1000 MS (Java/O ...
- Bringing up interface eth0: Error:Connection activation failed:Device not managed by NetworkManager
Just follow the below steps and everything will be ok... 1. Remove Network Manager from startup Se ...