CSV工具类
分享自己昨天写的CSV工具类,
主要实现解析CSV格式,
直接上代码
#region private
/// <summary>
/// 从sr当前位置解析一个栏位
/// </summary>
private void JXLW(StringReader sr)
{
//判断首个字符是否为"
)
{
char c = (char)sr.Read();
this._jxcharindex++;
this._lwcharstartindex = this._jxcharindex;
//判断此位置字符是否为特殊字符
if (this._teshuchar.Contains(c))
{
if (c != '"')
{
if (c == ',')
{
//表示栏位为空
this._lwcharendindex = this._jxcharindex;
return;
}
else
{
//栏位第一个不为"Name就是有异常了
throw new Exception(
string.Format("解析异常,栏位首字符为不是\"的特殊字符,异常出现在字符:{0},索引:{1}",
c.ToString(), this._jxcharindex));
}
}
this._lwhasyhcount++;
this._lwyhstart = true;
}
else
{
this._lwyhstart = false;
}
//根据栏位是否"开头查找结尾啊
if (this._lwyhstart)
{
JXYHStartLW(sr);
}
else
{
JXUnYHStartLW(sr);
}
}
else
{
//这尼玛栏位中没有字符啊
}
}
/// <summary>
/// 解析引号开始的栏位
/// </summary>
/// <param name="sr"></param>
private void JXYHStartLW(StringReader sr)
{
//找,
)
{
char c = (char)sr.Read();
this._jxcharindex++;
if (this._teshuchar.Contains(c))
{
if (c == ',')
{
== )
{
//则正常结束
this._lwcharendindex = this._jxcharindex;
return;
}
else
{
//继续找下一个,
JXYHStartLW(sr);
return;
}
}
else if (c == '"')
{
this._lwhasyhcount++;
}
else if (c == '\r')
{
== )
{
//已到栏位结尾
#region 栏位后一个是否为\n
, ).FirstOrDefault();
if (nextc == '\n')
{
sr.Peek();
sr.Read();
this._jxcharindex++;
}
#endregion
//则正常结束
;
this._lineend = true;
return;
}
else
{
//继续找下一个,
JXYHStartLW(sr);
return;
}
}
else if (c == '\n')
{
== )
{
//已到栏位结尾
//则正常结束
this._lwcharendindex = this._jxcharindex;
this._lineend = true;
return;
}
else
{
//继续找下一个,
JXYHStartLW(sr);
return;
}
}
else
{
//抛出异常
throw new Exception(
string.Format("解析异常,包含特殊字符的栏位,没有使用双引号括住!,异常字符:{0}索引:{1}",
c.ToString(), this._jxcharindex));
}
}
else
{
continue;
}
}
}
/// <summary>
/// 解析非引号开始的栏位
/// </summary>
/// <param name="sr"></param>
private void JXUnYHStartLW(StringReader sr)
{
//找,
)
{
char c = (char)sr.Read();
this._jxcharindex++;
if (this._teshuchar.Contains(c))
{
if (c == ',')
{
== )
{
//则正常结束
this._lwcharendindex = this._jxcharindex;
return;
}
else
{
throw new Exception("解析异常,包含\"的栏位,双引号不成对!");
}
}
else if (c == '"')
{
throw new Exception("解析异常,栏位未使用\"包裹,但栏位中解析到\"字符!");
}
else if (c == '\r')
{
#region 栏位后一个是否为\n
, ).FirstOrDefault();
if (nextc == '\n')
{
sr.Peek();
sr.Read();
this._jxcharindex++;
}
#endregion
//则正常结束
;
this._lineend = true;
return;
}
else if (c == '\n')
{
//则正常结束
this._lwcharendindex = this._jxcharindex;
this._lineend = true;
return;
}
else
{
//抛出异常
throw new Exception(
string.Format("解析异常,包含特殊字符的栏位,没有使用双引号括住!,异常字符:{0}索引:{1}",
c.ToString(), this._jxcharindex));
}
}
else
{
continue;
}
}
}
#endregion
/// <summary>
/// 解析CSV文本
/// 会补齐与解析到的最长列,以空在最后补齐
/// </summary>
/// <returns></returns>
public IEnumerable<IEnumerable<string>> Parse()
{
if (string.IsNullOrEmpty(this._csvTxt))
{
throw new Exception("传入的csv字符串不能为空!");
}
List<List<string>> lss = new List<List<string>>();
using (StringReader sr = new StringReader(this._csvTxt))
{
List<string> ls = new List<string>();
;
< this._csvTxt.Length)
{
if (this._lineend)
{
#region 行结束
lss.Add(ls);
ls = new List<string>();
this._rownum++;
this._lineend = false;
;
#endregion
}
this._lwnum++;
this._lwjxcomplete = false;
;
;
//开始解析
JXLW(sr);
this._lwjxcomplete = true;
//结束索引等于0时
== this._csvTxt.Length)
{
//csv字符串已到结尾
?
: this._lwcharendindex;
}
ls.Add(this._csvTxt.Substring(this._lwcharstartindex,
this._lwcharendindex - this._lwcharstartindex));
}
if (ls.Any())
{
lss.Add(ls);
}
}
#region 整理,与最长的补齐,在最后补空
var maxcount = lss.Max(d => d.Count);
List<List<string>> lss1 = new List<List<string>>();
; i < lss.Count; i++)
{
var item = lss[i];
if (item.Count != maxcount)
{
//补齐
; j < maxcount - item.Count; j++)
{
item.Add("");
}
}
lss1.Add(item);
}
#endregion
return lss1;
}
直接调用Parse方法即可将csv文本解析为IEnumerable<IEnumerable<string>>类型。
剩下的结合C#神器-Linq就ok了。
完整代码请访问:https://coding.net/u/huawu/p/HXXCommonLibrary/git/blob/master/HXXTools/Tools/CSVTools.cs
代码昨天写的,只测试了简单的解析,不保证能用于生产环境,
测试项目:https://coding.net/u/huawu/p/HXXCommonLibrary/git/tree/master/TestProject/CSVTestProject
如有问题,请联系我,邮箱:h_xuxu@sina.com
Q:245112656
CSV工具类的更多相关文章
- [Unity工具]CSV工具类
参考链接: https://www.cnblogs.com/lulianqi/p/6385503.html http://blog.csdn.net/paul342/article/details/2 ...
- 【转载】 C#工具类:Csv文件转换类
CSV是逗号分隔值格式的文件,其文件以纯文本形式存储表格数据(数字和文本).CSV文件由任意数目的记录组成,记录间以某种换行符分隔:每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号 ...
- 写文件的工具类,输出有格式的文件(txt、json/csv)
import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import java.io. ...
- 支持各种特殊字符的 CSV 解析类 (.net 实现)(C#读写CSV文件)
CSV是一种十分简洁的数据结构,在DOTNET平台实际使用中发现微软官方并没有提供默认的方法,而网上好多例子发现实现并不严谨甚至一些含有明显错误,所以后面自己实现了一个读写工具类,这里发出来希望方便后 ...
- Jacob工具类使用文件互转服务 word转html html转excel word转pdf excel转pdf ppt转pdf
前提条件 必须安装MS office 1.jdk使用jdk1.8 2.jacob.dll放在..\jdk1.8\jre\bin目录下 3.eclipse的jre版本要和jdk一致,window-&g ...
- 排名前 16 的 Java 工具类
在Java中,工具类定义了一组公共方法,这篇文章将介绍Java中使用最频繁及最通用的Java工具类.以下工具类.方法按使用流行度排名,参考数据来源于Github上随机选取的5万个开源项目源码. 一. ...
- commons-lang3-3.2.jar中的常用工具类的使用
这个包中的很多工具类可以简化我们的操作,在这里简单的研究其中的几个工具类的使用. 1.StringUtils工具类 可以判断是否是空串,是否为null,默认值设置等操作: /** * StringUt ...
- 排名前16的Java工具类
原文:https://www.jianshu.com/p/9e937d178203 在Java中,工具类定义了一组公共方法,这篇文章将介绍Java中使用最频繁及最通用的Java工具类.以下工具类.方法 ...
- ThinkPHP Http工具类(用于远程采集 远程下载) phpSimpleHtmlDom采集类库_Jquery筛选方式 使用phpQuery轻松采集网页内容http://www.thinkphp.cn/extend/541.html
[php]代码库 view sourceprint? <?php // +------------------------------------------------------------ ...
随机推荐
- ODBC
ODBC是80年代末90年代初出现的技术,它为编写关系数据库的客户软件提供了统一的接口.ODBC只提供单一的API,可用于处理不同数据库的客户应用程序.使用ODBC API的应用程序可以与任何具有OD ...
- swift2.0 字符串,数组,字典学习代码
swift 2.0 改变了一些地方,让swift变得更加完善,这里是一些最基本的初学者的代码,里面涉及到swift学习的最基本的字符串,数组,字典和相关的操作.好了直接看代码吧. class View ...
- 【转】IntelliJ IDEA2016.1 + maven 创建java web 项目
最近开始使用idea 来写java项目了,这个很流行,相比Eclipse方便了很多.功能多了,相对应的使用的复杂度也较高了,因为网上很多的使用和创建项目的简单教程,都是基于老版本的,每个新版本都有不一 ...
- JavaScript中国象棋程序(8) - 进一步优化
在这最后一节,我们的主要工作是使用开局库.对根节点的搜索分离出来.以及引入PVS(Principal Variation Search,)主要变例搜索. 8.1.开局库 这一节我们引入book.js文 ...
- java集合框架04——LinkedList和源码分析
上一章学习了ArrayList,并分析了其源码,这一章我们将对LinkedList的具体实现进行详细的学习.依然遵循上一章的步骤,先对LinkedList有个整体的认识,然后学习它的源码,深入剖析Li ...
- Ionic2中集成第三方控件Sweetalert
Ionic2混合开发,入坑系列:Ionic2中集成第三方控件Sweetalert 注:Sweetalert2已经可以直接从npm中下载安装 npm install --save sweetalert2 ...
- Regular Expression(正则表达式)之邮箱验证
正则表达式(regular expression, 常常缩写为RegExp) 是一种用特殊符号编写的模式,描述一个或多个文本字符串.使用正则表达式匹配文本的模式,这样脚本就可以轻松的识别和操作文本.其 ...
- Laravel控制器和视图
控制器,rawSQL,Model controller.php <?php namespace App\Http\Controllers; use Illuminate\Http\Request ...
- php调去存储过程
第一步,mysql端建存储过程 DELIMITER $$create procedure mintime()beginselect min(year(htime)) as minnian,max(ye ...
- 基于 socket.io, 简单实现多平台类似你猜我画 socket 数据传输
一.前言 socket.io 实现了实时双向的基于事件的通讯机制,是基于 webSocket 的封装,但它不仅仅包括 webSocket,还对轮询(Polling)机制以及其它的实时通信方式封装成了通 ...