php 大文件读取
当你需要处理一个5G的文件里面的数据时,你会怎么做,将文件里面的内容全部读取到一个数组里面去? 显然这种做法对小文件是没有问题的,但是对于大文件还是不行的
这时就需要用到 yield 了 ,注意这是php5.5之后才有的
1.首先我们看一个基本的代码
<?php
function aa($number){
for($i=0;$i<$number;$i++){
$data[] = $i.'-'.time();
}
return $data;
} $result = aa(5);
foreach($result as $value){
sleep(1);//这里停顿1秒
echo $value.'<br />';
}
这是一个正常的代码,我们将传入的数据当做一个很大的数据(虽然目前是5),结果为
0-1555485328
1-1555485328
2-1555485328
3-1555485328
4-1555485328
(1)很明显,我们执行的循序是,先将for里面的全部执行完(因为时间戳都是一样的),然后再执行foreach这个函数。5条是没有问题的,但是如果是五百万条呢,会不会太大,占用太多资源
2.我们再看优化之后的
<?php
function aa($number){
for($i=0;$i<$number;$i++){
yield $i.'-'.time();
}
} $result = aa(5);
foreach($result as $value){
sleep(1);//这里停顿1秒
echo $value.'<br />';
}
利用yield 返回数据,我们再看一下结果
0-1555485647
1-1555485648
2-1555485649
3-1555485650
4-1555485651
(2)我们可以发现,程序会先从for里面拿出一个值,然后利用这个值来进行foreach,当这次循环完了后,再自动去for里面取第二个值。可以发现,只是时间变了,结果内容完全是一样的
像这样一个值一个值的处理,不管你数据有多大,我始终只处理一个值。就很大程度上优化了代码 ,节约了资源
我们来运行一个实例,读取一个txt文件
<?php
function read($path){
$file = fopen($path, "r");
//输出文本中所有的行,直到文件结束为止。
while(! feof($file))
{
yield fgets($file)."<br>";//fgets()函数从文件指针中读取一行
}
fclose($file);
} $a = read('test.txt');
foreach ($a as $val){
echo $val;
}
输出:
第1行
第2行
第3行
第4行
第5行
第6行
第7行
第8行
第9行
第10行
第11行
输出的结果和没用yiled是一样的,看不出来,我们加一个时间戳,并停顿一秒试一下
a, 不用yield
<?php
function read($path){
$file = fopen($path, "r");
//输出文本中所有的行,直到文件结束为止。
while(! feof($file))
{
$data[] = fgets($file).time()."<br>";//fgets()函数从文件指针中读取一行
}
return $data;
fclose($file);
} $a = read('test.txt');
foreach ($a as $val){
sleep(1);
echo $val;
}
结果:
第1行 1555488162
第2行 1555488162
第3行 1555488162
第4行 1555488162
第5行 1555488162
第6行 1555488162
第7行 1555488162
第8行 1555488162
第9行 1555488162
第10行 1555488162
第11行1555488162
b.用yield
<?php
function read($path){
$file = fopen($path, "r");
//输出文本中所有的行,直到文件结束为止。
while(! feof($file))
{
yield fgets($file).time()."<br>";//fgets()函数从文件指针中读取一行
}
fclose($file);
} $a = read('test.txt');
foreach ($a as $val){
sleep(1);
echo $val;
}
结果:
第1行 1555487737
第2行 1555487738
第3行 1555487739
第4行 1555487740
第5行 1555487741
第6行 1555487742
第7行 1555487743
第8行 1555487744
第9行 1555487745
第10行 1555487746
第11行1555487747
(3)发现虽然结果一样,但是他们的执行过程是不一样的。
php 大文件读取的更多相关文章
- linux大文件读取
在生产环境中有时候可能会遇到大文件的读取问题,但是大文件读取如果按照一般的手法.如cat这种都是对io的一个挑战,如果io扛得住还好,如果扛不住 造成的后果,如服务器内存奔溃,日志损坏 方法一: se ...
- python大文件读取
python大文件读取 https://stackoverflow.com/questions/8009882/how-to-read-a-large-file-line-by-line-in-pyt ...
- TCP协议传输大文件读取时候的问题
TCP协议传输大文件读取时候的问题 大文件传不完的bug 我们在定义的时候定义服务端每次文件读取大小为10240, 客户端每次接受大小为10240 我们想当然的认为客户端每次读取大小就是10240而把 ...
- Java解决大文件读取的内存问题以及文件流的比较
Java解决大文件读取的内存问题以及文件流的比较 传统方式 读取文件的方式一般是是从内存中读取,官方提供了几种方式,如BufferedReader, 以及InputStream 系列的,也有封装好的如 ...
- PHP大文件读取操作
简单的文件读取,一般我们会使用 file_get_contents() 这类方式来直接获取文件的内容.不过这种函数有个严重的问题是它会把文件一次性地加载到内存中,也就是说,它会受到内存的限制.因此,加 ...
- 大文件读取方法(C#)
之前都是用StreamReader.ReadLine方法逐行读取文件,自从.NET4有了File.ReadLines这一利器,就再也不用为大文件发愁了. File.ReadLines在整个文件读取到内 ...
- C基础 大文件读取通过标准库
引言 - 问题的构建 C大部分读取文件的时候采用fgetc, 最近在使用过程中发现性能不是很理想.都懂得fgetc每次只能读取一个字符, IO操作太频繁. 所以性能低. 本文希望通过标准库函数frea ...
- dart 大文件读取
dart 中不可避免会出现文件读取的情况, 甚至是很大的文件, 比如 200M 的文件 如果一次性读入内存,虽然也行得通, 但是如果在 flutter 中开启个 200M 大小的字节数组, 一不小心可 ...
- C#大文件读取和查询--内存映射
笔者最近需要快速查询日志文件,文件大小在4G以上. 需求如下: 1.读取4G左右大小的文件中的指定行,程序运行占用内存不超过500M. 2.希望查询1G以内容,能控制在20s左右. 刚开始觉得这个应该 ...
随机推荐
- leetcode867
vector<vector<int>> transpose(vector<vector<int>>& A) { vector<vector ...
- Struts2处理逻辑的方式
1.可以统一写一个action 对应方法名处理不同逻辑 2.也可以分别写Action 分别处理不同的逻辑
- 微信小程序中出现Invoking Page() in async task.问题
在做项目中需要让页面跳到外网,用到了<web-view src=""> </web-view>组件,需要新建一个文件放这个组件,调接口的时候链接连到这个页面 ...
- 【294】◀▶ Python 字符串说明
目录: 一.Python访问字符串中的值 二. Python 转义字符 三.Python 字符串运算符 参考:Python 字符串 一.Python访问字符串中的值 Python不支持单字符类型, ...
- CentOs登陆输入root作为用户名
- 在zookeeper集群的基础上,搭建solrCloud
1 将在window中部署的单机版solr上传到node-01中 cd /export/software/ rz 选择资料中的solr.zip进行上传(此zip就是 solr的简单部署:在tomca ...
- Leetcode:ZigZag Conversion分析和实现
问题的大意就是将字符串中的字符按锯齿状(倒N形)垂直由上向下放置,最后水平从左向右读取.比如 ABCDEFGHIJKLMN,4表示 A G M B F H ...
- bootstrap设计网站中添加代码高亮插件
这款插件的名字叫做google-code-prettify 使用该插件之前的效果: 使用插件之后的效果: 接下来说步骤: (1)下载两个文件 http://codecloud.sinaapp.com/ ...
- mybatis 框架 的应用之三(操作两张没有关联的表,存在主键和外键关系)
#注意:要配置开启多条语句操作,否则会报错( org.apache.ibatis.exceptions.PersistenceException) lf-driver=com.mysql.jdbc.D ...
- PCL 常用小知识
时间计算 pcl中计算程序运行时间有很多函数,其中利用控制台的时间计算 首先必须包含头文件 #include <pcl/console/time.h> #include <pcl/c ...