63.当当网txt数据按行切割与合并

获取文件有多少行

 //获取文件有多少行

 int getN(char *path)

 {

     FILE *pf = fopen(path, "r");

     if (pf==NULL)

     {

         return -;

     }

     else

     {

         int i = ;

         while (!feof(pf))

         {

             char str[] = {  };

             fgets(str, , pf);

             i++;

         }

         fclose(pf);

         return i;

     }

 }

宏定义行数
```
 //数据的行数

 #define N 13180820
```

文件按行切割

 //文件切割

 void space(char *path, int num)

 {

     char ** pathes = malloc(sizeof(char*)*num);

     for (int i = ; i < num;i++)

     {

         pathes[i] = malloc(sizeof(char) * );

         //格式化处理文件名

         sprintf(pathes[i], "dangdangwang%d.txt", i + );

     }

     //打开文件

     FILE *pf = fopen(path, "r");

     if (pf == NULL)

     {

         return -;

     }

     else

     {

         //如果能被整除

         if (N%num == )

         {

             for (int i = ; i <  num;i++)

             {

                 //写入文件

                 FILE *pfw = fopen(pathes[i], "w");

                 for (int j = ; j < N / num; j++)

                 {

                     char str[] = {  };

                     //读取一行写入一行

                     fgets(str, , pf);

                     fputs(str, pfw);

                 }

                 fclose(pfw);

             }

         }

         else

         {

             for (int i = ; i < num - ; i++)

             {

                 //写入文件

                 FILE *pfw = fopen(pathes[i], "w");

                 //处理前面n-1个

                 for (int j = ; j < N / (num-); j++)

                 {

                     char str[] = {  };

                     //读取一行写入一行

                     fgets(str, , pf);

                     fputs(str, pfw);

                 }

                 fclose(pfw);

             }

             {

                 //处理剩下的

                 //写入

                 FILE *pfw = fopen(pathes[num-], "w");

                 for (int j = ; j < N %(num-); j++)

                 {

                     char str[] = {  };

                     //读取一行写入一行

                     fgets(str, , pf);

                     fputs(str, pfw);

                 }

                 fclose(pfw);

             }

         }

         fclose(pf);

     }

 }

文件合并

 //合并文件

 void merge(char *newpath,int n)

 {

     char ** pathes = malloc(sizeof(char*)*n);

     for (int i = ; i < n; i++)

     {

         pathes[i] = malloc(sizeof(char) * );

         sprintf(pathes[i], "dangdangwang%d.txt", i + );

     }

     //写入文件

     FILE *pf = fopen(newpath, "w");

     if (pf == NULL)

     {

         return -;

     }

     else

     {

         //依次读取每个文件

         for (int i = ; i < n;i++)

         {

             FILE *pfr = fopen(pathes[i], "r");

             while (!feof(pfr))

             {

                 char str[] = {  };

                 //读取一行写入一行

                 fgets(str, , pfr);

                 fputs(str, pf);

             }

             fclose(pfr);

         }

         fclose(pf);

     }

 }

测试函数

 void main()

 {

     //int num = getN(path);

     //printf("%d", num);获取行数

     int  num;

     scanf("%d", &num);

     //分割

     space(path, num);

     //合并

     merge(newpath, num);

     system("pause");

 }

完整代码:

 #define  _CRT_SECURE_NO_WARNINGS

 #include <stdio.h>

 #include <stdlib.h>

 char *path = "dangdangwang.txt";

 char *newpath = "dangdangwangN.txt";

 //数据的行数

 #define N 13180820

 //获取文件有多少行

 int getN(char *path)

 {

     FILE *pf = fopen(path, "r");

     if (pf==NULL)

     {

         return -;

     }

     else

     {

         int i = ;

         while (!feof(pf))

         {

             char str[] = {  };

             fgets(str, , pf);

             i++;

         }

         fclose(pf);

         return i;

     }

 }

 //文件切割

 void space(char *path, int num)

 {

     char ** pathes = malloc(sizeof(char*)*num);

     for (int i = ; i < num;i++)

     {

         pathes[i] = malloc(sizeof(char) * );

         //格式化处理文件名

         sprintf(pathes[i], "dangdangwang%d.txt", i + );

     }

     //打开文件

     FILE *pf = fopen(path, "r");

     if (pf == NULL)

     {

         return -;

     }

     else

     {

         //如果能被整除

         if (N%num == )

         {

             for (int i = ; i <  num;i++)

             {

                 //写入文件

                 FILE *pfw = fopen(pathes[i], "w");

                 for (int j = ; j < N / num; j++)

                 {

                     char str[] = {  };

                     //读取一行写入一行

                     fgets(str, , pf);

                     fputs(str, pfw);

                 }

                 fclose(pfw);

             }

         }

         else

         {

             for (int i = ; i < num - ; i++)

             {

                 //写入文件

                 FILE *pfw = fopen(pathes[i], "w");

                 //处理前面n-1个

                 for (int j = ; j < N / (num-); j++)

                 {

                     char str[] = {  };

                     //读取一行写入一行

                     fgets(str, , pf);

                     fputs(str, pfw);

                 }

                 fclose(pfw);

             }

             {

                 //处理剩下的

                 //写入

                 FILE *pfw = fopen(pathes[num-], "w");

                 for (int j = ; j < N %(num-); j++)

                 {

                     char str[] = {  };

                     //读取一行写入一行

                     fgets(str, , pf);

                     fputs(str, pfw);

                 }

                 fclose(pfw);

             }

         }

         fclose(pf);

     }

 }

 //合并文件

 void merge(char *newpath,int n)

 {

     char ** pathes = malloc(sizeof(char*)*n);

     for (int i = ; i < n; i++)

     {

         pathes[i] = malloc(sizeof(char) * );

         sprintf(pathes[i], "dangdangwang%d.txt", i + );

     }

     //写入文件

     FILE *pf = fopen(newpath, "w");

     if (pf == NULL)

     {

         return -;

     }

     else

     {

         //依次读取每个文件

         for (int i = ; i < n;i++)

         {

             FILE *pfr = fopen(pathes[i], "r");

             while (!feof(pfr))

             {

                 char str[] = {  };

                 //读取一行写入一行

                 fgets(str, , pfr);

                 fputs(str, pf);

             }

             fclose(pfr);

         }

         fclose(pf);

     }

 }

 void main()

 {

     //int num = getN(path);

     //printf("%d", num);获取行数

     int  num;

     scanf("%d", &num);

     //分割

     space(path, num);

     //合并

     merge(newpath, num);

     system("pause");

 }

63.当当网txt数据按行切割与合并的更多相关文章

Python爬虫库Scrapy入门1--爬取当当网商品数据
1.关于scrapy库的介绍,可以查看其官方文档:http://scrapy-chs.readthedocs.io/zh_CN/latest/ 2.安装:pip install scrapy 注意这 ...
scrapy获取当当网中数据
yield 1. 带有 yield 的函数不再是一个普通函数,而是一个生成器generator,可用于迭代 2. yield 是一个类似 return 的关键字,迭代一次遇到yield时就返回yiel ...
java爬虫，爬取当当网数据
背景:女票快毕业了(没错!我是有女票的!!!),写论文,主题是儿童性教育,查看儿童性教育绘本数据死活找不到,没办法,就去当当网查询下数据,但是数据怎么弄下来呢,首先想到用Python,但是不会!!百 ...
【转】java爬虫，爬取当当网数据
背景:女票快毕业了(没错!我是有女票的!!!),写论文,主题是儿童性教育,查看儿童性教育绘本数据死活找不到,没办法,就去当当网查询下数据,但是数据怎么弄下来呢,首先想到用Python,但是不会!!百 ...
scrapy项目3：爬取当当网中机器学习的数据及价格（spider类）
1.网页解析当当网中,人工智能数据的首页url如下为http://category.dangdang.com/cp01.54.12.00.00.00.html 点击下方的链接,一次观察各个页面的ur ...
网络爬虫之定向爬虫：爬取当当网2015年图书销售排行榜信息（Crawler）
做了个爬虫,爬取当当网--2015年图书销售排行榜 TOP500 爬取的基本思想是:通过浏览网页,列出你所想要获取的信息,然后通过浏览网页的源码和检查(这里用的是chrome)来获相关信息的节点,最后 ...
转当当网资深DBA：DB运维四大现代化的实现
位好,今天我的主题是 <DB运维的四个现代化> ,看标题就能明白,是关于DBA自动化运维平台的事情.http://dbaplus.cn/news-21-855-1.html 主要是分享下我 ...
python爬虫06 | 你的第一个爬虫，爬取当当网 Top 500 本五星好评书籍
来啦,老弟我们已经知道怎么使用 Requests 进行各种请求骚操作也知道了对服务器返回的数据如何使用正则表达式来过滤我们想要的内容 ... 那么接下来我们就使用 requests 和 re ...
Python 东方财富网-股市行情数据抓取
东方财富网股市行情数据抓取: http://quote.eastmoney.com/center/gridlist.html#hs_a_board 请求数据未入库处理,其中数据只存入数据文本,未做存 ...

随机推荐

[Poi] Build a Vue App with Poi
Poi uses the Vue babel presets by default, so there is no additional install required to get up-and- ...
Linux能ping通IP，ping不通域名
今天碰到个问题, 能ping通IP地址, ping不通域名, 一直以为是 DNS解析服务器的问题, 找了半天. 问题不在这里. [root@www postfix]# cat /etc/resolv. ...
jfinal文件上传与下载
import com.alibaba.fastjson.JSONObject; import com.jfinal.core.Controller; import com.jfinal.ext.kit ...
.vscode folder
https://stackoverflow.com/questions/32964920/should-i-commit-the-vscode-folder-to-source-control Che ...
如何判断自己IP是内网IP还是外网IP
tcp/ip协议中,专门保留了三个IP地址区域作为私有地址,其地址范围如下: 10.0.0.0/8:10.0.0.0-10.255.255.255 172.16.0.0/12:172.16.0.0- ...
jquery ajax中支持哪些返回类型以及js中判断一个类型常用的方法？
1 jquery ajax中支持哪些返回类型在JQuery中,AJAX有三种实现方式:$.ajax() , $.post , $.get(). 预期服务器返回的数据类型.如果不指定,jQuery 将自 ...
RandomStringUtils生成随机数
org.apache.commons.lang.RandomStringUtils; //产生5位长度的随机字符串,中文环 ...
Codeforces 344A Magnets
Description Mad scientist Mike entertains himself by arranging rows of dominoes. He doesn't need dom ...
Linux下搭建iSCSI共享存储详细步骤(服务器模拟IPSAN存储)
一.简介 iSCSI(internet SCSI)技术由IBM公司研究开发,是一个供硬件设备使用的.可以在IP协议的上层运行的SCSI指令集,这种指令集合可以实现在IP网络上运行SCSI协议,使其能够 ...
Linux下java/bin目录下的命令集合
Linux下JAVA命令(1.7.0_79) 命令详解参数列表示例重要程度资料 appletviewer Java applet 浏览器.appletviewer 命令可在脱离万维网浏览器环 ...

63.当当网txt数据按行切割与合并

63.当当网txt数据按行切割与合并的更多相关文章

随机推荐

热门专题