Python进阶4---Python的文件IO

文件操作

体存储单元，包括随机存储器（RAM），只读存储器（ROM），以及高速缓存（CACHE）。只不过因为RAM是其中最重要的存储器。

通常所说的内存即指电脑系统中的RAM。RAM要求每时每刻都不断地供电，否则数据会丢失。

如果在关闭电源以后RAM中的数据也不丢失就好了，这样就可以在每一次开机时都保证电脑处于上一次关机的状态，而不必每次都重新启动电脑，重新打开应用程序了。

但是RAM要求不断的电源供应，那有没有办法解决这个问题呢?随着技术的进步，人们想到了一个办法，即给RAM供应少量的电源保持RAM的数据不丢失，这就是电脑的

休眠功能，特别在Win2000里这个功能得到了很好的应用，休眠时电源处于连接状态，但是耗费少量的电能。

文件IO常用操作

打开操作

open的参数

file

mode***

字符流：<_io.TextIOWrapper name='test1' mode='r+' encoding='cp936'>

字节流：<_io.BufferedRandom name='test1'>

注意在windows(cp936:双字节编码)下面以二进制读取文件和在linux(utf-8::三字节编码)下面以二进制读取文件时因为编码格式不同，其读取出来的数据也会不同。

上述原因与文件指针有关！

文件指针***

文件指针，指向当前字节位置

seek无论是在二进制模式下还是在文本模式下，seek指的都是偏移字节！

buffering:缓冲区

-1表示使用缺省大小的buffering，如果是二进制模式，使用io.DEFAULT_BUFFER_SIZE，默认是4096。

缓冲是一个可选的整数，用于设置缓冲策略。传递0以关闭缓冲(仅在二进制模式下允许)，1选择行缓冲(仅在文本模式下可用)，以及整数>1以字节表示固定大小块缓冲区的大小。

二进制文件以固定大小的块缓冲;在许多系统上，缓冲区通常是4096或8192字节长。 

一般来说，默认缓冲区大小是个比较好的选择，除非明确知道，否则不调整它。

一般编程中，明确知道需要写磁盘了，都会手动调用一次flush，而不是等到自动flish或者close的时候。

encoding:编码,仅文本模式下使用

其他参数

read

#文本模式

f = open('tttt','r+')

f.write("magedu")

f.write("妈个教育")

f.seek(0)

print(f.tell())#

print(f.read(7))#   magedu妈

print(f.tell())#

f.close()

#二进制

f = open('tttt','rb+')

f.write(b"magedu")

f.read(7)

print(f.tell())#

f.read(1)

print(f.tell())#

f.close()

行读取

write

close

其他

上下文管理

在Linux中，执行

上下文管理

另一种写法

练习1

#下面是最简单的一种拷贝，但是只是拷贝了原文件的内容！

with open('test.txt',encoding='utf-8') as f1:

    with open('test2.txt','w',encoding='utf-8') as  f2:

        s = f1.read()

        f2.write(s)

练习2

#初步思想:常规统计方法

def wordcount2(file='test2.txt'):

    chars='''~!@#$%^&*()_+{}[]|\\/"';:=.,<>'''

    charset = set(chars)

    with open(file,encoding='utf-8') as f:

        wordcount={}

        for line in f:

            words = line.split()

            # for k,v in zip(words,(1,)*len(words)):同下

            for k,v in map(lambda x:(x,1),words):

                k = k.strip(chars)

                if len(k)<1:

                    continue

                k = k.lower()

                #处理一些特殊的分隔符，如 c:foo ==> c,foo; 3.5.3 ==> 3,5,3; a///b ==> a,b

                start = 0

                for i,value in enumerate(k):#i=1 start=0

                    if value in charset:

                        if start == i:

                            start += 1

                            continue

                        key = k[start:i]

                        wordcount[key] = wordcount.get(k, 0) + 1

                        start = i+1

                else:

                    key = k[start:]

                    wordcount[key] = wordcount.get(k, 0) + 1

    #按照TOP N 排序得到前十的单词

    lst = sorted(wordcount.items(),key=lambda x:x[1],reverse=True)

    for i in range(10):

        print(str(lst[i]))#.strip("'()").replace("'",""))

    return lst

Python进阶4---Python的文件IO的更多相关文章

Python学习（15）文件/IO
目录 Python 文件I/O 打印到屏幕读取键盘输入打开和关闭文件 File对象属性文件定位重命名和删除文件 Python的目录 Python 文件I/O 本章只讲述所有基本的的I/O函数, ...
python进阶之路之文件处理
Python之文件处理 *:first-child { margin-top: 0 !important; } body>*:last-child { margin-bottom: 0 !imp ...
python进阶--打包为exe文件
一.Python打包为EXE文件有不少方案,比较常用的有下面两种方式: 1.使用py2exe 详细介绍:http://www.cnblogs.com/jans2002/archive/2006/09/ ...
python进阶（4）文件操作
文件操作文件操作主要包括对文件内容的读写操作,这些操作是通过文件对象实现的,通过文件对象可以读写文本文件和二进制文件 open(file, mode='r', buffering=-1, encod ...
Python Cookbook3 Python进阶教程 http://python3-cookbook.readthedocs.io/zh_CN/latest/copyright.html
http://python3-cookbook.readthedocs.io/zh_CN/latest/copyright.html
python进阶：Python进程、线程、队列、生产者/消费者模式、协程
一.进程和线程的基本理解 1.进程程序是由指令和数据组成的,编译为二进制格式后在硬盘存储,程序启动的过程是将二进制数据加载进内存,这个启动了的程序就称作进程(可简单理解为进行中的程序).例如打开一个 ...
python 进阶篇 python 的值传递
值传递和引用传递值传递,通常就是拷贝参数的值,然后传递给函数里的新变量,这样,原变量和新变量之间互相独立,互不影响. 引用传递,通常是指把参数的引用传给新的变量,这样,原变量和新变量就会指向同一块内 ...
Python进阶5---StringIO和BytesIO、路径操作、OS模块、shutil模块
StringIO StringIO操作 BytesIO BytesIO操作 file-like对象路径操作路径操作模块 3.4版本之前:os.path模块 3.4版本开始建议使用pathlib模 ...
Python文件IO
Python文件IO 有如下文本内容,文件路径为D:\temp,文件名称为lyric.txt, line1 Look ! line2 If U had one shot line3 One oppor ...

随机推荐

C# 批量删除Word超链接
对于Word文档中包含较多的超链接,如果一个个来删除很花费时间和精力,本篇文章将提供一种可用于批量删除Word中的超链接的方法.这里的超链接可以是页眉页脚处的超链接.正文中的超链接.表格中的超链接.文 ...
js 颜色16进制转RGB方法
//颜色16进制转RGB方法 String.prototype.colorRgb = function(){ var sColor = this.toLowerCase(); //十六进制颜色值的正则 ...
免费下载获取Odoo中文开发指南手册
引言 Odoo是一个强大的商业应用开源平台.在此基础上,构建了一套紧密集成的应用程序,涵盖了从CRM到销售到股票和会计的所有业务领域.Odoo有一个动态和不断增长的社区,不断增加功能.连接器和其他商业 ...
Salesforce 超大量数据导入优化策略
本文参考自以下系列文章: 1 2 3 4 5 6 超大量数据导入优化策略 Salesforce和很多其他系统都可以很好的协作.在协作过程中,数据的导入导出便成为了一个关键的步骤. 当客户的业务量非常大 ...
亿级流量场景下，大型缓存架构设计实现【1】---redis篇
*****************开篇介绍**************** -------------------------------------------------------------- ...
Android studio,第一个生成，调用成功的jni(说多了都是泪）
0x01 序言: 泪从何处说起呢?其实很早以前就用过android studio写过c++,但是,但是一直没有成功生成过so文件,所以心中一直有一个纠结...为什么不成功呢... 直到今天,由于工作的 ...
当我们按下电源键，Android 究竟做了些什么？
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由goo发表于云+社区专栏相信我们对Android系统都不陌生,而Android系统博大精深,被各种各样的智能设备承载的同时,我们会否 ...
Java https ssl证书导入删除
下载并命名例如命名github.cer 放进jre的lib\security下 keytool -delete [OPTION]... 选项: -alias <alias> 要处理的条目 ...
Greenplum扩容
Greenplum支持原有主机扩展Segment个数.新增主机.和混合扩展本文以在已有机器上扩展节点为例 1.可按照hostname:address:port:fselocation:dbid:co ...
使用web3.js监听以太坊智能合约event
传送门: 柏链项目学院使用web3.js监听以太坊智能合约event 当我们在前端页面调用合约时发现有些数据不会立即返回,这时还需要再调用更新数据的函数.那么这样的方法使用起来非常不便,监听ev ...

Python进阶4---Python的文件IO

Python进阶4---Python的文件IO的更多相关文章

随机推荐

热门专题