phpoffice 读取超大execl

2024-09-03

PHP读取超大的excel文件数据的方案

场景和痛点说明今天因为一个老同学找我,说自己公司的物流业务都是现在用excel处理,按月因为数据量大,一个excel差不多有百万数据,文件有接近100M,打开和搜索就相当的慢联想到场景:要导入数据,可能excel数据量很大,这里利用常用的一些方法比如phpexcel会常有时间和内存限制问题下面我们就利用一个利用流处理的类库SpreadsheetReader来做大excel的读取编写过程说明关键具体在代码里注释代码 <?php /** * Created by PhpStorm.

PHP读取超大文件的实例代码

数据量大带来的问题就是单个文件很大,能够打开这个文件相当不容易,记事本就不要指望了,果断死机去年年底的各种网站帐号信息的数据库泄漏,很是给力啊,趁机也下载了几个数据库,准备学学数据分析家来分析一下这些帐号信息.虽然这些数据信息都已经被“整理”过的,不过自己拿来学习也挺有用的,毕竟有这么大的数据量. 数据量大带来的问题就是单个文件很大,能够打开这个文件相当不容易,记事本就不要指望了,果断死机.用MSSQL的客户端也打不开这么大的SQL文件,直接报内存不足,原因据说是MSSQL在读取数据的

java中利用RandomAccessFile读取超大文件

超大文件我们使用普通的文件读取方式都很慢很卡,在java中为我提供了RandomAccessFile函数,可以快速的读取超大文件并且不会感觉到卡哦,下面看我的一个演示实例. 服务器的日志文件往往达到400多M,简单的文件读取实在太慢,太占用机器资源. 特别是如果你需要5分钟就扫描一次日志文件,来统计一些即时数据.比如刚才10分钟的来访客户(大型网站用户统计系统例如51.la 会经常用到吧.)即时扫描大数据文件中的一部分显得非常之重要.本文讲述了如果使用java的RandomAccessFile方

使用POI读取/创建Execl(.xlsx)文件

最近项目中用到了解析Execl表格的功能,在网上百度了一下自己写了一个小Demo.由于项目中使用的是Execl2007,就是后缀为.xlsx的,所以只研究了解析和创建Execl2007的文件,解析Execl2007和Execl2003有一定的区别,大家在解析的时候要注意. 一下是Demo中用到的jar包(可能有几个包用不到,懒得删了):

php导出超大csv导出方法，读取超大文件或者接受超大数组，防止内存溢出

基本思路就是,知道总数之后分割成2万一个数组进行查询,最后独立写入csv,避免数据过大导致溢出速度还不错,在php7下,机器I5 8G内存,128G,SSD,52W多条,大概也就30秒,出来整个文件38.2M $per = 10000; 37秒 $per = 20000; 34秒 $per = 30000; 的时候速度最快29秒左右 $per = 40000;30-31秒所以建议在30000步幅,比较好,我的环境是windows 32位,64位或许会更好建议导入文件过多就zip压缩之后再下

node 读取超大Excel 文件，提取数据

之前是用 node-xlsx 来处理excel文件,主要是读取数据或者根据数据生成excel文件.不过,node-xlsx 似乎无法处理超大的excel(100MB以上),例如: var xlsx = require('node-xlsx'); var sheets = xlsx.parse('./test.xlsx'); //获取所有sheets 文件中有一个sheet的体积比较大,得到的是一个空的数组,估计是因为内存加载不进去.想要解决这个问题,似乎只有一种方法,就是用stream的方式

读取超大Excel（39万行数据）

有个学长需要处理Excel数据,Excel数据共有39W,将数据读取后处理并导出数据.最开始尝试了 NPOI ,发现NPOI 并不能完成该项任务,随后尝试引用的com组件:Microsoft.Office.Interop.Excel.dll 读取EXCEL文件 . 最终 ,也以失败告终.最终,采用将Excel 转为CSV 格式读取. 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文

PHP读取超大日志文件

打开一个17G的日志文件,都不吃力,除了占cpu之外,内存占用不多,如果直接fopen根本打不开注:它是逐行读取的 foreach( glob( ngx_log. "/*.log" ) as $file ) { $log = new SplFileObject($file); foreach( $log as $line ){ $ipnum = getip($line); if( $ipnum ) { $ips[ $ipnum ] = (int)$ips[ $ipnum ] + 1;

php读取超大文件fseek

function readMaxFile($fp , $start = 0) { $tag = "\n"; $i = 0; $content = ''; while($i < 20) { if (feof($fp)) { return 0; } fseek($fp, $start, SEEK_SET); $res = fread($fp, 1); $content .= $res; if (substr($content, -strlen($tag)) == $tag) { $i

自己写的一个读取execl的帮助类

目标:读取execl的第一个sheet,并传入不需要读取的表头的行数,返回该execl里所有数据的list 解析共有2种:1.DOM 2.SAX import java.io.File; import java.io.IOException; import java.io.InputStream; import java.text.DecimalFormat; import java.util.ArrayList; import java.util.Iterator; import j

java 读取execl文件

java 中读取execl文件是必要功能,下面说下几种读取方式 1.jxl (支持2003 不支持 2007 貌似最新版支持) /** * 规则设置的模板导入 * @param file * @param exportDefindColum * @param exportDefindRemark * @param exportDefineid * @return * @throws Exception */ public List rea

[转] JAVA读取excel数据（插入oracle数据库）

原文地址:http://blog.csdn.net/zczzsq/article/details/16803349 本实例做的是读取execl(只能读取.xls的execl,即只能读取03版的),如果是.xlsx类型的话手工转化一下即可,应用的jar包是apache的poi系类的jar包和ojdbc14.jar的数据库连接包. poi的jar报的官方下载地址:http://poi.apache.org/ 还需要说明是对execl的读取java可以通过横坐标和纵坐标读取到execl的每个单元格,

高性能JSON工具-FastJson处理超大JSON文本

使用阿里开源类库FastJson,当需要处理超大JSON文本时,需要Stream API,在fastjson-1.1.32版本中开始提供Stream API.文档参考GitHub:https://github.com/alibaba/fastjson/wiki/Stream-api /** * 在遇到超大JSON文本数据时使用 * @param jsonStr 超长JSON字符串数据 * @return * @throws IOException */ public static List<Ab

java+反射+多线程+生产者消费者模式+读取xml(SAX)入数据库mysql-【费元星Q9715234】

java+反射+多线程+生产者消费者模式+读取xml(SAX)入数据库mysql-[费元星Q9715234] 说明如下,不懂的问题直接我[费元星Q9715234] 1.反射的意义在于不将xml tag写死在sax 的代码中,直接配置到一个bean就可以了. 2.多线程分工明确,线程各做各的任务,生产者只用了一个线程,使用多线程没有意义,瓶颈在IO 3.SAX读取超大文件的性能较好,dom等均不佳. 4.总的瓶颈在DB的入库,可以使用insert ,好一点使用spring 预编译,保证全数据的入库

[C#]_[使用微软OpenXmlSDK (OpenXmlReader)读取xlsx表格] 读取大数据量100万条数据Excel文件解决方案

1.OpenXmlSDK是个很好的类库,可惜只能通过C#调用,C#的童鞋又福气了. 2.服务端程序由于没法安装office,所以这个对asp.net网站来说是最理想的库了.需要.net 4.0版本以上. 3.以流形式,sax模型读取大文件. using System; using System.Collections.Generic; using System.Linq; using System.Text; using DocumentFormat.OpenXml; using Docum

利用NPOI导出数据到Execl

相信很多童鞋都开发过Execl的导入导出功能,最近产品中无论是后台数据分析的需要,还是前端满足用户管理的方便,都有Execl导入导出的维护需求产生. 以前做这个功能,如果是web,利用HttpContext.Current.Response.ContentType ="application/ms-excel";就可以导出html数据表格到execl中,这种方法的问题就是编码格式的兼容性太差,用Mac OS之类的 office打开直接乱码给你看.或者是调用office的COM组件,或宏

PHP读取大文件的几种方法

场景:PHP读取超大文件,例如1G的日志文件,我这里使用的是400M的access.log文件 1.使用file直接读取 <?php $starttime=microtime_float(); ini_set('memory_limit', '-1'); $file = 'testfile.txt'; $data = file($file); $line = $data[count($data) - 1000]; $endtime=microtime_float(); echo count($d

php--->查询超大文件（12G）

今天遇到一个要在一个12G日志中查询数据的需求,手中暂时没有查询这种超大文件的工具,于是自己写了一个程度来读这个超大文件其整体思路就是一行一行地去读取超大文件中的数据,然后将拿出的一行数据做相应的查询,一直到最后一行. github源码:https://github.com/Frankltf/readbigfile2

Linux下如何查看高CPU占用率线程

转于:http://www.cnblogs.com/lidabo/p/4738113.html 目录(?)[-] proc文件系统 proccpuinfo文件 procstat文件 procpidstat文件 procpidtasktidstat文件系统中有关进程cpu使用率的常用命令 ps 命令 top命令单核情况下Cpu使用率的计算基本思想总的Cpu使用率计算计算方法某一进程Cpu使用率的计算计算方法实验数据某一线程Cpu使用率的计算计算方法实验数据多核情况下cpu使

查看线程linux cpu使用率

Linux下如何查看高CPU占用率线程 LINUX CPU利用率计算转 http://www.cnblogs.com/lidabo/p/4738113.html目录(?)[-] proc文件系统 proccpuinfo文件 procstat文件 procpidstat文件 procpidtasktidstat文件系统中有关进程cpu使用率的常用命令 ps 命令 top命令单核情况下Cpu使用率的计算基本思想总的Cpu使用率计算计算方法某一进程Cpu使用率的计算计算方法实验数据

phpoffice 读取超大execl

热门专题