字符串的一些方法!

1.text.endswith(".jpg")        如果字符串是以给定子字符串结尾的,就返回值True。

2. text.upper():         返回一个被转换为全大写字母的字符串的副本。

3.text.lower():        返回一个被转换为全小写字母的字符串副本。

4.text.replace("tomorrow","Tuesday"):       返回一个字符串的副本,其中的某个子字符串全被替换为另一个子字符串。

5.text.strip():         返回一个去除开始空格和结尾空格的字符串副本。

6. text.find("python"):               当找到给定子字符串时,返回子字符串的第一个字符索引值。

7.text.startswith("<HTML>")             如果字符串是以给定子字符串开头的,就返回True。

8.text[a,b]          取出字符串中以a索引值开始到b索引值结束但不包括b索引值所对应的字符的子字符串。

import urllib.request

page=urllib.request.urlopen("http://www.baidu.com")
text=page.read().decode("utf8") print(text)

  

加入取出子字符串的方法之后

import urllib.request

page=urllib.request.urlopen("http://www.baidu.com")
text=page.read().decode("utf8") price=text[234:238]
print(price)

  

其中上图"#293的索引值分别为:234,235,236,237,238但是上述的代码所取出的结果为:

取出给定子字符串后的子字符串

import urllib.request

page=urllib.request.urlopen("http://www.baidu.com")
text=page.read().decode("utf8") where=text.find('="') start_of_price=where+2
end_of_price=start_of_price+4 price=text[start_of_price:end_of_price]
print(price)

  

取出特定字符之后转换为float的类型与4.47进行比较,如果小于4.47就输出:Buy!

import urllib.request

price=99.99

while price>4.47:
page=urllib.request.urlopen("http://www.baidu.com")
text=page.read().decode("utf8") where=text.find('="') start_of_price=where+2
end_of_price=start_of_price+4 price=float(text[start_of_price:end_of_price])
print("Buy!")

  Python的内置时间库

python库文档:time

time.clock()     用秒来表示的当前时间,使用浮点数格式。

time.daylight()      如果你当前不处在夏令时,就返回0.

time.gmtime()      给出UTC时间的当前日期和时刻(不受你所在时区的影响!)。

time.localtime()      给出当前本地时间(这会受到你所在时区的影响)。

time.sleep(secs)     在给定的秒数时间内休息,不做任何事。

time.time()      给出1970年1月1日算起到当前的秒数。

time.timezone()         给出你所在时区和UTC(伦敦)时区之间的相差的小时数。

import urllib.request
import time price=99.99 while price>4.47:
time.sleep(900)
page=urllib.request.urlopen("http://www.baidu.com")
text=page.read().decode("utf8") where=text.find('="') start_of_price=where+2
end_of_price=start_of_price+4 price=float(text[start_of_price:end_of_price])
print("Huy!")

  

总结

s代表字符串。

s[4]    获得s字符串中的第5个字符。

s[6:12]   获得字符串s中的一个子字符串。(直到索引值为12的字符,但是不包括!)

s.find()   用于搜索字符串。

s.upper()     把字符串转化为全大写字母。

float()   把字符串转换成带有十进制小数的数字,也就是浮点数。

+  “加法”  操作符

> “大于”   操作符

urllib。request库用来和web沟通

time 库用于和日期/时间有关的工作!

Python的文本数据的更多相关文章

  1. python处理文本数据

    处理文本数据,主要是通过Seris的str访问.遇到NaN时不做任何处理,保留结果为NaN,遇到数字全部处理为NaN. str是Seris的方法,DataFrame不能直接使用,但是通过索引选择Dat ...

  2. 用python处理文本数据 学到的一些东西

    最近写了一个python脚本,用TagMe的api标注文本,并解析返回的json数据.在这个过程中遇到了很多问题,学到了一些新东西,总结一下. 1. csv文件处理 csv是一种格式化的文件,由行和列 ...

  3. python读取文本数据某一列

    import codecs f = codecs.open('test1 - 副本.txt', mode='r', encoding='utf-8') # 打开txt文件,以'utf-8'编码读取 l ...

  4. Python文本数据互相转换(pandas and win32com)

    (工作之后,就让自己的身心都去休息吧) 今天介绍一下文本数据的提取和转换,这里主要实例的转换为excel文件(.xlsx)转换world文件(.doc/docx),同时需要使用win32api,同py ...

  5. [Python] 糗事百科文本数据的抓取

    [Python] 糗事百科文本数据的抓取 源码 https://github.com/YouXianMing/QiuShiBaiKeText import sqlite3 import time im ...

  6. Python之读写文本数据

    知识点不多 一:普通操作  # rt 模式的 open() 函数读取文本文件 # wt 模式的 open() 函数清除覆盖掉原文件,write新文件 # at 模式的 open() 函数添加write ...

  7. python多种格式数据加载、处理与存储

    多种格式数据加载.处理与存储 实际的场景中,我们会在不同的地方遇到各种不同的数据格式(比如大家熟悉的csv与txt,比如网页HTML格式,比如XML格式),我们来一起看看python如何和这些格式的数 ...

  8. python matplotlib plot 数据中的中文无法正常显示的解决办法

    转发自:http://blog.csdn.net/laoyaotask/article/details/22117745?utm_source=tuicool python matplotlib pl ...

  9. 如何使用 scikit-learn 为机器学习准备文本数据

    欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 文本数据需要特殊处理,然后才能开始将其用于预测建模. 我们需要解析文本,以删除被称为标记化的单词.然后,这些词还需要被编码为整型或浮点型,以用作 ...

随机推荐

  1. IIS7 + mysql + php + wordPress 在win7下部署

    最近在玩WordPress.wiki等开源平台的站点部署.通过一下实践和资料学习,为了以后少走弯路,觉得有必要把这个过程记录下来. 用到的东西: IIS服务: mysql; php; wordpres ...

  2. Pixar Shorts 皮克斯动画短片全集

    [原创短片](Theatrical Shorts)16部 <安德鲁和威利冒险记><顽皮跳跳灯><红色的梦><锡铁小兵><小雪人大行动>< ...

  3. Hibernate反向工程在javaweb下的操作配置

    1.在javaEE下新建项目,在WEB-INF的lib文件夹下添加所用到的jar包. 2.创建Hibernate 主配置文件 文件----新建----其他下的Hibernate目录,如图: 下一步,注 ...

  4. javaweb实验五

    product类: package com.lab;public class Product { private int id;                // 商品编号    private S ...

  5. JPA入门例子(采用JPA的hibernate实现版本)

    (1).JPA介绍: JPA全称为Java Persistence API ,Java持久化API是Sun公司在Java EE 5规范中提出的Java持久化接口.JPA吸取了目前Java持久化技术的优 ...

  6. Excel导出公共函数

    /// <summary> /// 将一组对象导出成EXCEL /// </summary> /// <typeparam name="T">要 ...

  7. 20145337《Java程序设计》第四周学习总结

    20145337<Java程序设计>第四周学习总结 教材学习内容总结 继承与多态 继承 继承,避免多个类间重复定义共同行为 符合DRY(Don't Repeat Yourself)原则,多 ...

  8. 第七周PSP

    团队项目PSP 一:表格     C类型 C内容 S开始时间 E结束时间 I时间间隔 T净时间(mins) 预计花费时间(mins) 讨论 讨论用户界面 8:20 10:34 20 58 68 分析与 ...

  9. PHP获取远程网站的服务器时间

    <?php function get_time($server){ $data  = "HEAD / HTTP/1.1\r\n"; $data .= "Host:  ...

  10. Android WebApp开发使用Genymotion连接Fiddler2/Charles代理调试

    1.       目的 在模拟器的浏览器或app hybrid开发中遇到chrome调试代码为线上代码或者混淆代码时,可以利用fiddler/charles为genymotion配置代理, 可以方便的 ...