文件系统和文件

1、文件系统是OS用于明确磁盘或分区上的文件的方法和数据结构---即在磁盘上组织文件的方法;

  • 文件系统模块:os

2、计算机文件(称文件、电脑档案、档案),是存储在某种长期储存设备或临时存储设备中的一段数据流,并且归属于计算机文件系统管理之下;

3、概括来讲:

  • 文件是计算机中由OS管理的具有名字的存储区域;
  • 在Linux系统上,文件被看做是字节序列


python打开文件

1、python内置函数open()用于打开文件和创建文件对象

  • open('/var/log/message.log','r')

2、open方法可以接收三个参数:文件名、模式和缓冲区参数

  • open函数返回的是一个文件对象
  • mode:指定文件的打开模式
  • bufsize:定义输出缓存
  • 0:表示无输出缓存
  • 1:表示使用缓冲
  • 负数:表示使用系统默认设置
  • 正数:表示使用近似指定大小缓冲

文件方法

创建对象后返回的是一个内存地址,通常需要一个变量名来引用这个内存地址


文件的打开模式:

1、简单模式

  • r:只读
  • open('/var/log/message.log','r')    //以只读模式打开文件
  • w:写入      //从文件指针出开始覆盖
  • a:附加      //从文件尾部

2、在模式后使用“+”表示同时支持输入、输出操作

  • 如r+、w+和a+       //比如w+表示读写模式的写操作,本来是写操作,也可以读

3、在模式后附加“b”表示以二进制方式打开

  • 如rb、wb+

文件对象:文本都是字节序列


var_name = open (file_name[mode,[bufsize]])

  • mode:
  • r、w、ad、r+、w+、a+
  • b表示以二进制模式打开文件
  • rb、wb、ab、rb+、wb+、ab+
  • 缓存:
  • 0:禁用,表示不使用缓存
  • 负数:表示使用系统默认的缓存
  • 1:表示使用缓存,只缓冲一行数据
  • 2+:指定缓冲空间大小,整数表示使用大小的缓冲区

如何移动指针

file.seek(offset[whence])

whence:起点(从什么地方开始偏移)

  • 0:从文件头,默认
  • 1:从当前位置
  • 2:从文件尾

offset:偏移量


read表示读多少个字节的,readline表示读行的


flush  刷写缓冲区    close关闭文件

练习:输入1到10之间所有正整数平方的结果写到一个文件

  •        

readlines

  •  

迭代的方式是不会移动指针的,比如next,只是一次返回一个行对象

但是readline却可以移动指针

  •     

truncate    做文件截取

定义保留10个字节                                                                          如果想要截取文件,只保留当前光标所在位置以前的值,把指针以后的值全部删除     

                 


closed   是属性,不是方法,显示文件是否关闭


name    表示列表中保存的文件名


encoding    保存文件的编码格式,如果无显示则是默认编码


mode    获取当前文件打开的模式


newlines     行结束字串


softspace   软空间,其中1表示在输出一段数据后要加上一个空格符,0表示不加

上面writeline写入文件中没有空格

f1.softspace = 1    //可以赋值


python文件对象访问指的是文件,这种文件是非目录以外的其他部分,而目录不可以,目录是文件系统的组成部分,不是文件内容的组成部分,如果要使用目录还要使用文件系统,

跟文件系统打交道,文件系统模块:os

目录:

chdir():         切换工作目录

chroot():       设定当前进程的根目录

listdir():         列出指定目录下的所有文件名

mkdir():         创建指定目录

makedirs():   创建多级目录      os.makedirs('x/y/z')

getcwd():      获取工作目录

rmdir():          删除目录

removedirs():删除多级目录

编程文件系统交互接口API


文件:

mkfifo():创建管道

mknod():创建设备文件    mknod(filename [, mode=0600, device])

remove():删除文件

unlink():删除链接文件

rename():重命名

stat():返回文件的状态信息

symlink():创建符号链接        symlink(src, dst)

utime():更新时间戳

tmpfile():创建并打开(w+b)一个新的临时文件

walk():创建目录树


访问权限相关的

access():检验某个用户或用户组的权限模式

chmod():修改权限

chown():修改属主和属组

umask():设置默认权限模式

access

chmod

chown


文件描述符:

open():底层操作系统的open(),相当于库中的open()函数

read():较底层IO的读操作

write():较底层IO的写操作

设备文件:

makedev():创建设备文件

major():获取主设备号

minor():获取次设备号


import os.path:路径管理:

basename():路径基名

dirname():路径目录名

join():整合文件名

split():分割,返回dirname(),basename()元组

splitext():返回(filename,extension)元组,把文件名和扩展名切割开

join

split

  • 信息:

getatime():返回指定文件最近一次的访问时间

getctime():

getmtime():

getsize():返回文件的大小

  • 查询

exists():判断指定文件是否存在

isabs():判断指定的路径是否为绝对路径

isdir():是否为目录

isfile():是否存在为文件

islink():是否为符号链接

ismount():是否为挂载点

samefile():两个路径是否指向了同一个文件


练习:

判断文件是否存在,存在则打开;让用户通过键盘反复输入多行数据;追加保存至此文件中


使用一种机制,把对象做流式化, 流式化的结果要求是:如果后期再把流式化结果载入回来的时候还是原来的样子;

因此想要保存原有数据的结构,就必须使用流式化工具(扁平化工具)转换成数据流保存在文件中,还可以再读回来,这种功能就叫对象的持久储存;

要实现对象的持久储存,要使用专门的模块来实现。

对象持久存储(模块)

1、把对象储存到文件中的模块

  • pickle
  • marshal

2、数据管理系统

  • DBM接口:把数据存到数据库中(python没有自带能够把数据存到MySQL中的API)

DBM接口仅仅能将数据写道DBM数据库中去,但没有办法实现流式化

3、既能实现流式化又能往数据库中存

  • shaelve模块

基于pickle模块直接将python原生对象存在文件中(这里是将字典存到文件中去)

help(pickle.dump)

dump(obj, file, protocol=None)

使用load模块将将流式化结果还原回来,仍然用字典模式显示

4、Python文件对象及os、os.path和pickle模块(0530)的更多相关文章

  1. Python 文件对象

    Python 文件对象 1) 内置函数 open() 用于打开和创建文件对象 open(name,[,mode[,bufsize]]) 文件名.模式.缓冲区参数 mode: r 只读 w 写入 a 附 ...

  2. Python 文件对象和方法

    Python文件对象和方法 1.打开和关闭文件 Python提供了必要的函数和方法进行默认情况下的文件基本操作,我们可以用file对象做大部分文件操作. open()方法 我们必须先用Python内置 ...

  3. Python(正则 Time datatime os sys random json pickle模块)

    正则表达式: import re #导入模块名 p = re.compile(-]代表匹配0至9的任意一个数字, 所以这里的意思是对传进来的字符串进行匹配,如果这个字符串的开头第一个字符是数字,就代表 ...

  4. python文件对象几种操作模式区别——文件操作方法详解

    文件对象的字节模式/b模式(以utf-8编码为例) 读操作 写操作 指针操作 ASCII字节 返回bytes/字节类型的Ascii 写入bytes类型字节 例如:b'This is ascii' 使用 ...

  5. Python文件对象方法

    使用open()函数创建一个文件对象,这里是可以在这个对象上调用的函数的列表 - 编号 方法名称 描述 1 file.close() 关闭文件,无法读取或写入关闭的文件. 2 file.flush() ...

  6. Python文件对象的访问模式

  7. (原创)Python文件与文件系统系列(5)——stat模块

    stat模块中定义了许多的常量和函数,可以帮助解释 os.stat().os.fstat().os.lstat()等函数返回的 st_result 类型的对象. 通常使用 os.path.is*() ...

  8. 关于python 文件操作os.fdopen(), os.close(), tempfile.mkstemp()

    嗯.最近在弄的东西也跟这个有关系,由于c基础渣渣.现在基本上都忘记得差不多的情况下,是需要花点功夫才能弄明白. 每个语言都有相关的文件操作. 今天在flask 的例子里看到这样一句话.拉开了文件操作折 ...

  9. Python自动化运维之4、格式化输出、文件对象

    Python格式化输出: Python的字符串格式化有两种方式: 百分号方式.format方式 百分号的方式相对来说比较老,而format方式则是比较先进的方式,企图替换古老的方式,目前两者并存.[P ...

随机推荐

  1. MapReduce的map个数调节 与 Hadoop的FileInputFormat的任务切分原理

    在对日志等大表数据进行处理的时候需要人为地设置任务的map数,防止因map数过小导致集群资源被耗光.可根据大表的数据量大小设置每个split的大小. 例如设置每个split为500M: set map ...

  2. Linux基础命令---uniq

    uniq 将文件中重复出现的行删除,结果送到标准输出或者指定文件.在使用uniq指令之前,必须使用sort对内容进行排序,否则没有效果.如果没有选项,则将匹配的行合并到第一个匹配项. 此命令的适用范围 ...

  3. selenium-java web自动化测试工具抓取百度搜索结果实例

    selenium-java web自动化测试工具抓取百度搜索结果实例 这种方式抓百度的搜索关键字结果非常容易抓长尾关键词,根据热门关键词去抓更多内容可以用抓google,百度的这种内容容易给屏蔽,用这 ...

  4. JustOj 2043: N!

    题目描述 输出N的阶乘.(注意时间限制150ms&&注意不能打表后输出,赛后我们会检查代码,如有发现,该位同学总分记0分处理) 打表的定义:在本地主机预先计算出了每个值对应的答案,并把 ...

  5. Linux CPU使用率含义及原理

    相关概念 在Linux/Unix下,CPU利用率分为用户态.系统态和空闲态,分别表示CPU处于用户态执的时间,系统内核执行的时间,和空闲系统进程执行的时间. 下面是几个与CPU占用率相关的概念. CP ...

  6. 前端框架VUE----webpack打包工具的使用

    在这里我仅仅的是对webpack做个讲解,webpack这个工具非常强大,解决了我们前端很繁琐的一些工具流程繁琐的事情.如果感兴趣的同学,还是看官网吧. 中文链接地址:https://www.webp ...

  7. python之运算符与基本数据类型

    1.开发工具:IDE pycharm(推荐).eclipse 2.运算符 结果是值 算数运算 a = 10 * 10 赋值运算 a = a + 1    a+=1 结果是布尔值 比较运算 a = 1 ...

  8. cms STW 的两个阶段

    CMS在初始标记和重复标记阶段会停顿

  9. Java动态菜单添加

    自己做出来的添加数据库配置好的动态菜单的方法 private void createMenu() {  IMenuDAO dao = new MenuDAOImpl();  String sql1 = ...

  10. java jdbc->mycat->oracle SqlException异常中文信息乱码解决

    mycat字符集gbk oracle字符集gbk 原jdbc连接串: base.jdbc.url=jdbc:mysql://127.0.0.1:3306/XXX?useUnicode=true& ...