Python读取文件数据

1题目要求：

　　文本文件有这些数据，需要的只有其中的5个属性，如下颜色标记

　　像以下的数据达到75万组：

1product/productId: B0000UIXZ4

2product/title: Timex Link USB Watch

3product/price: unknown

4review/userId: A14MVG2I9PS6NZ

5review/profileName: B. Kuiper "Wah"

6review/helpfulness: 0/0

7review/score: 5.0

8review/time: 1275091200

9review/summary: Best geek weapon ever...but no longer made?

10review/text: This watch serves as my brain and now, my brain is no lo

2基于Python进行粗略读取

　　代码如下：没有对输出进行处理，只是简单筛选

　　fo.write();写入文件的的时候注意的地方：3.X与2.X的写入文件的类型不同

写入错误：

TypeError: a bytes-like object is required, not 'str'

-------------------------------------------------------------

btest.decode('utf-8')    #结果'abcde'

strtest.encode('utf-8')    #结果b'abc'

need = ['product/productId:','product/price:','review/helpfulness:','review/score:','review/time:']

fo = open("C:\\Users\\Five\\Desktop\\新建文件夹\\python2.txt", "wb")

for line in open("C:\\Users\\Five\\Desktop\\新建文件夹\\Watches.txt"):

	flag = 0;

	for i in range(0,5):

		if line.find(need[i])==0:flag =1;break;

	if flag==1:fo.write((line+' ').encode('utf-8'));

fo.close();

　　读取文件的方式有以下：

f = open("foo.txt")             # 返回一个文件对象

line = f.readline()             # 调用文件的 readline()方法

while line:

    ....

    line = f.readline()

----------------------------------------------------

for line in open("foo.txt"):

----------------------------------------------------

f = open("c:\\1.txt","r")

lines = f.readlines()#读取全部内容

for line in lines

    print line

3基于C语言的详细读取

　　读取并处理的结果如下：

　　预备知识读取的方式

  fp=fopen("python.txt","r");

  fscanf(fp,"%s",&s);

  printf("%s\n",s);

里面是按空格分开来读取的。

 下面是按行读取的

--------------------------------------

  fgets(s,1028*8,fp);

fgets(s,1028*8,fp)读取的长度比=实际+1（换行符分界）

  printf("%s",s);

----------------------------------------

  fscanf(fp,"%[^\n]",&s);

-------------------------------

　　打开方式详细如下：

对于文件使用方式有以下几点说明：

1) 文件使用方式由r,w,a,t,b，+六个字符拼成，各字符的含义是：

r(read): 读

w(write): 写

a(append): 追加

t(text): 文本文件，可省略不写

b(banary): 二进制文件

+: 读和写

意义

“rt” 只读打开一个文本文件，只允许读数据

“wt” 只写打开或建立一个文本文件，只允许写数据

“at” 追加打开一个文本文件，并在文件末尾写数据

“rb” 只读打开一个二进制文件，只允许读数据

“wb” 只写打开或建立一个二进制文件，只允许写数据

“ab” 追加打开一个二进制文件，并在文件末尾写数据

“rt+” 读写打开一个文本文件，允许读和写

“wt+” 读写打开或建立一个文本文件，允许读写

“at+” 读写打开一个文本文件，允许读，或在文件末追加数据

“rb+” 读写打开一个二进制文件，允许读和写

“wb+” 读写打开或建立一个二进制文件，允许读和写

“ab+” 读写打开一个二进制文件，允许读，或在文件末追加数据

　　处理的结果：(对于product/price: unknown 这一类未知的置为0处理)

B000NLZ4A2 0 0/0 4.0 1260230400

B000NLZ4A2 0 0/0 4.0 1216339200

B000NLZ4A2 0 1/2 5.0 1245024000

B000AIO6RA 0 3/3 5.0 1122422400

B000AIO6RA 0 0/0 4.0 1207958400

B000NLZ4AM 0 2/2 4.0 1250208000

B000NLZ4AM 0 2/2 5.0 1244764800

B000NLZ4AM 0 2/2 5.0 1243296000

B000NLZ4AM 0 1/1 4.0 1235952000

B000NLZ4AM 0 0/0 5.0 1236816000

B000F70V0M 0 1/1 5.0 1189468800

B000F70V0M 0 0/0 4.0 1244678400

B000F70V0M 0 0/0 5.0 1204502400

B000F70V0M 0 0/0 5.0 1201478400

......

......

......以上只是一部分数据

　　详细代码如下：

#include<stdio.h>

#include<string.h>

void getValue(char s[],char temp[]){

      int end = strlen(s);

      int start =0;

      int i =0,j=-1;

      char c;

      for(i=end-2;s[i]!=' ';i--){

            temp[++j]= s[i];

      }

    //  printf("\n");

      temp[j+1]='\0';

      for(i=0;i<=j;){

              c=temp[i];

              temp[i]=temp[j];

              temp[j]=c;

              i++;j--;

      }

}

int main(){

  FILE *fr,*fw;

  int data,count;

  long int sum=0;

  char s[100000];//读取一行数据

  char temp[20];//截取空格后面的Value

  char s1[20],s2[20],s3[20],s4[20],s5[20];//需要的5个属性Value

  char unknow[]="unknown";

  char zero[]="0";

  fr=fopen("Watches.txt","r");

  fw=fopen("p.txt","wt");

  count=1;

  while(fgets(s,1028*80,fr)!=NULL){

       //  printf("%s",s);

         if(count!=11)

               getValue(s,temp);

         if(count==1)

                strcpy(s1,temp);

         else if(count==3){

                strcpy(s2,temp);

                if(strcmp(s2,unknow)==0)

                     strcpy(s2,zero);

         }

         else if(count==6)

                strcpy(s3,temp);

         else if(count==7)

                strcpy(s4,temp);

         else if(count==8)

                strcpy(s5,temp);

         if(count==11){

                fprintf(fw,"%s %s %s %s %s\n",s1,s2,s3,s4,s5);

                count=0;

         }

         sum++;

         count++;

         fflush(fw);

         printf("%ld\n",sum);

  }

  printf("%ld",sum);

  fclose(fw);

  printf("press any key to end!\n");

  getchar();

  return 0;

}

Python读取文件数据的更多相关文章

python操作txt文件中数据教程[3]-python读取文件夹中所有txt文件并将数据转为csv文件
python操作txt文件中数据教程[3]-python读取文件夹中所有txt文件并将数据转为csv文件觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 python操作txt文件中 ...
Windows下Python读取GRIB数据
之前写了一篇<基于Python的GRIB数据可视化>的文章,好多博友在评论里问我Windows系统下如何读取GRIB数据,在这里我做一下说明. 一.在Windows下Python为什么无法 ...
Python读取JSON数据，并解决字符集不匹配问题
今天来谈一谈Python解析JSON数据,并写入到本地文件的一个小例子. – 思路如下从一个返回JSON天气数据的网站获取到目标JSON数据串使用Python解析出需要的部分写入到本地文件,供其 ...
python 读取文件read.csv报错 OSError: Initializing from file failed
小编在用python 读取文件read.csv的时候报了一个错误 OSError: Initializing from file failed 初始化文件失败检查了文件路径,没问题那应该是我文 ...
python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib
python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib ...
python 读取excel数据并将测试结果填入Excel
python 读取excel数据并将测试结果填入Excel 读取一个Excel中的一条数据用例,请求接口,然后返回结果并反填到excel中.过程中会生成请求回来的文本,当然还会生成一个xml文件.具体 ...
python读取文件首行和最后一行
python读取文件最后一行两种方式 1)常规方法:从前往后依次读取步骤:open打开文件. 读取文件,把文件所有行读入内存. 遍历所有行,提取指定行的数据. 优点:简单,方便缺点:当文件大了以后 ...
【python】python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence
python读取文件报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte ...
python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence
python读取文件时提示"UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal m ...

随机推荐

Android获取视频音频的时长的方法
android当中获取视频音频的时长,我列举了三种. 1:获取视频URI后获取cursor cursor.getLong(cursor.getColumnIndexOrThrow(MediaStore ...
JAVA常见算法题(二十)
package com.xiaowu.demo; /** * * 打印出如下图案(菱形) * * * * @author WQ * */ public class Demo20 { public st ...
[置顶] python3 django models保存filefiled字段统一目录、不修改文件名的方法
最经编写一个model时处理filefiled,使用post_form.save()进行新增和编辑文件保存位置不统一,如果出现重复文件名重复的话,上传文件名会被改名. 现有代码如下: models.p ...
util.select.js
ylbtech-JavaScript-util: util.select.js 筛选工具 1.A,JS-效果图返回顶部 1.B,JS-Source Code(源代码)返回顶部 1.B.1, m.y ...
ISP图像处理算法之---Demosaic
目前市场上主流传感器为Coms传感器,sensor出来的的数据格式为bayer数据格式,这种格式,每个像素点只有三个颜色通道中的一个,如图1所示 ...
Scrapy的介绍和用法
转载:https://www.toutiao.com/i6493421606306578958/ Scrapy是爬虫必须学会的一个框架!他确实很难搞的透彻!今天就不给大家全部介绍了!还是介绍其中的Cr ...
13.1Springboot 之静态资源路径配置
Spring 静态资源路径是指系统可以直接访问的路径,且路径下的所有文件均可被用户直接读取. 在Springboot中默认的静态资源路径有:classpath:/META-INF/resources/ ...
HTML5 Canvas 奔跑的小狗
效果如上图,共六个图像切换,形成小狗动态奔跑效果.完整代码和图片请从 https://files.cnblogs.com/files/xiandedanteng/runningDog.rar 下载. ...
【Javascript 基础】使用数组
Javascript 数组的工作方式与大多数编程语言的数组类似. <!DOCTYPE html> <html lang="en"> <head> ...
有关CGRectGetMinX,CGRectGetMidX,CGRectGetMaxX图解
CGRect size = CGRectMake(20, 20, 400, 400); //矩形中最小x值 ,size.x CGRectGetMinX(size) = 20; //矩形中最小y值 ,s ...

Python读取文件数据

Python读取文件数据的更多相关文章

随机推荐

热门专题