php 大文件读取
当你需要处理一个5G的文件里面的数据时,你会怎么做,将文件里面的内容全部读取到一个数组里面去? 显然这种做法对小文件是没有问题的,但是对于大文件还是不行的
这时就需要用到 yield 了 ,注意这是php5.5之后才有的
1.首先我们看一个基本的代码
<?php
function aa($number){
for($i=0;$i<$number;$i++){
$data[] = $i.'-'.time();
}
return $data;
} $result = aa(5);
foreach($result as $value){
sleep(1);//这里停顿1秒
echo $value.'<br />';
}
这是一个正常的代码,我们将传入的数据当做一个很大的数据(虽然目前是5),结果为
0-1555485328
1-1555485328
2-1555485328
3-1555485328
4-1555485328
(1)很明显,我们执行的循序是,先将for里面的全部执行完(因为时间戳都是一样的),然后再执行foreach这个函数。5条是没有问题的,但是如果是五百万条呢,会不会太大,占用太多资源
2.我们再看优化之后的
<?php
function aa($number){
for($i=0;$i<$number;$i++){
yield $i.'-'.time();
}
} $result = aa(5);
foreach($result as $value){
sleep(1);//这里停顿1秒
echo $value.'<br />';
}
利用yield 返回数据,我们再看一下结果
0-1555485647
1-1555485648
2-1555485649
3-1555485650
4-1555485651
(2)我们可以发现,程序会先从for里面拿出一个值,然后利用这个值来进行foreach,当这次循环完了后,再自动去for里面取第二个值。可以发现,只是时间变了,结果内容完全是一样的
像这样一个值一个值的处理,不管你数据有多大,我始终只处理一个值。就很大程度上优化了代码 ,节约了资源
我们来运行一个实例,读取一个txt文件
<?php
function read($path){
$file = fopen($path, "r");
//输出文本中所有的行,直到文件结束为止。
while(! feof($file))
{
yield fgets($file)."<br>";//fgets()函数从文件指针中读取一行
}
fclose($file);
} $a = read('test.txt');
foreach ($a as $val){
echo $val;
}
输出:
第1行
第2行
第3行
第4行
第5行
第6行
第7行
第8行
第9行
第10行
第11行
输出的结果和没用yiled是一样的,看不出来,我们加一个时间戳,并停顿一秒试一下
a, 不用yield
<?php
function read($path){
$file = fopen($path, "r");
//输出文本中所有的行,直到文件结束为止。
while(! feof($file))
{
$data[] = fgets($file).time()."<br>";//fgets()函数从文件指针中读取一行
}
return $data;
fclose($file);
} $a = read('test.txt');
foreach ($a as $val){
sleep(1);
echo $val;
}
结果:
第1行 1555488162
第2行 1555488162
第3行 1555488162
第4行 1555488162
第5行 1555488162
第6行 1555488162
第7行 1555488162
第8行 1555488162
第9行 1555488162
第10行 1555488162
第11行1555488162
b.用yield
<?php
function read($path){
$file = fopen($path, "r");
//输出文本中所有的行,直到文件结束为止。
while(! feof($file))
{
yield fgets($file).time()."<br>";//fgets()函数从文件指针中读取一行
}
fclose($file);
} $a = read('test.txt');
foreach ($a as $val){
sleep(1);
echo $val;
}
结果:
第1行 1555487737
第2行 1555487738
第3行 1555487739
第4行 1555487740
第5行 1555487741
第6行 1555487742
第7行 1555487743
第8行 1555487744
第9行 1555487745
第10行 1555487746
第11行1555487747
(3)发现虽然结果一样,但是他们的执行过程是不一样的。
php 大文件读取的更多相关文章
- linux大文件读取
在生产环境中有时候可能会遇到大文件的读取问题,但是大文件读取如果按照一般的手法.如cat这种都是对io的一个挑战,如果io扛得住还好,如果扛不住 造成的后果,如服务器内存奔溃,日志损坏 方法一: se ...
- python大文件读取
python大文件读取 https://stackoverflow.com/questions/8009882/how-to-read-a-large-file-line-by-line-in-pyt ...
- TCP协议传输大文件读取时候的问题
TCP协议传输大文件读取时候的问题 大文件传不完的bug 我们在定义的时候定义服务端每次文件读取大小为10240, 客户端每次接受大小为10240 我们想当然的认为客户端每次读取大小就是10240而把 ...
- Java解决大文件读取的内存问题以及文件流的比较
Java解决大文件读取的内存问题以及文件流的比较 传统方式 读取文件的方式一般是是从内存中读取,官方提供了几种方式,如BufferedReader, 以及InputStream 系列的,也有封装好的如 ...
- PHP大文件读取操作
简单的文件读取,一般我们会使用 file_get_contents() 这类方式来直接获取文件的内容.不过这种函数有个严重的问题是它会把文件一次性地加载到内存中,也就是说,它会受到内存的限制.因此,加 ...
- 大文件读取方法(C#)
之前都是用StreamReader.ReadLine方法逐行读取文件,自从.NET4有了File.ReadLines这一利器,就再也不用为大文件发愁了. File.ReadLines在整个文件读取到内 ...
- C基础 大文件读取通过标准库
引言 - 问题的构建 C大部分读取文件的时候采用fgetc, 最近在使用过程中发现性能不是很理想.都懂得fgetc每次只能读取一个字符, IO操作太频繁. 所以性能低. 本文希望通过标准库函数frea ...
- dart 大文件读取
dart 中不可避免会出现文件读取的情况, 甚至是很大的文件, 比如 200M 的文件 如果一次性读入内存,虽然也行得通, 但是如果在 flutter 中开启个 200M 大小的字节数组, 一不小心可 ...
- C#大文件读取和查询--内存映射
笔者最近需要快速查询日志文件,文件大小在4G以上. 需求如下: 1.读取4G左右大小的文件中的指定行,程序运行占用内存不超过500M. 2.希望查询1G以内容,能控制在20s左右. 刚开始觉得这个应该 ...
随机推荐
- peerconnection_client分析笔记
Windows版本的peerconnection_client demo是一个win32程序,入口函数为main.cc里面的wWinMain,程序整体流程就从这个入口函数下手开始分析. 1.peer ...
- love 玫瑰花
<!doctype html> <html> <head> <title>Love</title> <meta charset=&qu ...
- JavaWeb之JSP入门
JSP原理及执行过程 流程图分析 用户发起请求,用户通过浏览器访问jsp页面,浏览器将HTTP协议的请求部分发送到服务端. 服务端获取请求部分,分析请求,发现本次的请求的的是jsp页面,jsp引擎按照 ...
- libevent源码深度剖析三
libevent源码深度剖析三 ——libevent基本使用场景和事件流程 张亮 1 前言 学习源代码该从哪里入手?我觉得从程序的基本使用场景和代码的整体处理流程入手是个不错的方法,至少从个人的经验上 ...
- Unity ios、android、pc一键打包(一)
http://www.cnblogs.com/miaoshujiang/p/5289223.html http://blog.csdn.net/ynnmnm/article/details/36774 ...
- SpringBoot13 利用mybatis-plus自动生成entity、dao、service、controller
1 环境配置 = 2 新建一个新的springboot项目 2.1 选择一些必要的依赖 web jpa mysql <?xml version="1.0" encoding= ...
- 2-javascript::笔记
0.位置: HTML 中的脚本必须位于 <script> 与 </script> 标签之间. 脚本可被放置在 HTML 页面的 <body> 和 <head& ...
- suse10配置SSH无密码登录的方法
RSH配置(集群中的每台机器执行以下操作) 1.因SUSE LINUX不自带RSH-SERVER服务,所以首先要去从www.rpmfind.net 下载rsh-server服务的RPM包. 然后切换到 ...
- 特征不同取值/区间下 label 的均值曲线
def two_plot(df, feat, tick_label=None, rotate_tick=60): print('\n### 不同取值/区间下 label 的均值曲线') fig, ax ...
- integer encoding vs 1-hot (py)
https://github.com/szilard/benchm-ml/issues/1 glouppe commented on 7 May 2015 Thanks for the benchma ...