C语言读取写入CSV文件 [一]基础篇
本系列文章目录
什么是CSV?
CSV 是一种以纯文本形式存储的表格数据,具体介绍如下(来自维基百科):
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。
简单的说,CSV 是一种通用的、相对简单的表格文件格式,最广泛的应用就是在不同程序之间转移表格数据。值得注意的是,CSV 并没有一种单一的、定义明确的格式(虽然有一个 RFC 4180 的标准),一般地,CSV 文件具有如下特征:
- 纯文本,使用某个特定的字符集保存,例如 ASCII、Unicode 等
- 由一条条记录组成,一般每一行代表一条记录
- 每条记录被分隔符划分为不同的字段,最常见的分隔符是逗号,毕竟其中文名叫逗号分隔值:)
- 每条记录相同的字段序列
因为CSV 并没有一种单一的、定义明确的格式,因此下面的内容以最常见的格式为例,即逗号(,)分隔字段,换行符(\n)分隔记录。
C 语言写入 CSV 文件
首先我们来了解如何写入一个 CSV 文件,下面是示例代码:
// 1-1.c
#include <stdio.h>
#include <stdlib.h>
int main()
{
FILE *fp = fopen("tmp.csv", "w+");
if (fp == NULL) {
fprintf(stderr, "fopen() failed.\n");
exit(EXIT_FAILURE);
}
fprintf(fp, "ID,Name,Points\n");
fprintf(fp, "1,qwe,1.1\n");
int id = 2;
char *name = "asd";
float point = 2.2;
fprintf(fp, "%d,%s,%f\n", id, name, point);
fclose(fp);
return 0;
}
上述代码中,首先便是打开一个 CSV 文件,若打开失败,那么则报告出错结束程序。接下来便是向打开的 CSV 文件写入内容:
fprintf(fp, "ID,Name,Points\n");
常见的CSV文件的分隔符是逗号(,),被分隔符分开的字段会位于不同的列。在上述语句中,ID、Name、Points 被分隔符分开,因此这个CSV文件共有3列,分别是ID、Name、Points。
CSV文件是由一条条记录组成的,常见划分不同记录的符号是换行符(\n)。在上述语句中,ID、Name、Points 分别属于同一行上的不同三列,很显然,这条记录是表头。
接下来的 fprintf(fp, "1,qwe,1.1\n"); 语句写入的记录为 1、qwe、1.1,分为三列,正好对应于 ID=1、Name=qwe、Points=1.1。前一条语句采用了直接写入,但很多时候我们的值是变化的,幸运的是,CSV的写入同样支持格式化写入,代码如下:
int id = 2;
char *name = "asd";
float point = 2.2;
fprintf(fp, "%d,%s,%f\n", id, name, point);
最后写入的记录为 2(ID)、asd(Name)、2.2(Points)。运行程序,查看 CSV 文件内容,结果为:

C 语言读取 CSV 文件
示例程序如下:
// 1-2.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main()
{
FILE *fp = fopen("tmp.csv", "r");
if (fp == NULL) {
fprintf(stderr, "fopen() failed.\n");
exit(EXIT_FAILURE);
}
char row[80];
char *token;
while (fgets(row, 80, fp) != NULL) {
printf("Row: %s", row);
token = strtok(row, ",");
while (token != NULL) {
printf("Token: %s\n", token);
token = strtok(NULL, ",");
}
}
fclose(fp);
return 0;
}
首先要打开将要读取的CSV文件,这一步和写入一样,不再赘述。
while (fgets(row, 80, fp) != NULL) {
printf("Row: %s", row);
// other code
}
因为CSV文件是一个纯文本文件,因此我们可以使用 fgets 函数一行一行地进行读取,这样读取得到的便是CSV文件中一条条记录。接下来要做的就是将不同字段从记录中分隔出来:
token = strtok(row, ",");
while (token != NULL) {
printf("Token: %s\n", token);
token = strtok(NULL, ",");
}
char* strtok(char *restrict str, const char *restrict delim) 函数可以把字符串 str 按照给定的分隔符 delim 进行分隔,如果要解析仍是之前同一个字符串时,需要把 str 设为 NULL。因此 token = strtok(row, ","); 这条语句会尝试用逗号(,)来分割刚刚读取得到的记录,同时使用一个 while (token != NULL) 循环来不断进行分割,直到无法分隔为止,这样就得到每个字段的值。
程序运行输出的结果如下:
$ clang 1-2.c -o 1-2
$ ./1-2
Row: ID,Name,Points
Token: ID
Token: Name
Token: Points
Row: 1,qwe,1.1
Token: 1
Token: qwe
Token: 1.1
Row: 2,asd,2.200000
Token: 2
Token: asd
Token: 2.200000
最后总结一下,CSV 文件和普通文件一样,无论读写都需要先打开文件。而后写入或读取时所用的函数和普通文件没有区别,唯一需要注意的是,CSV 文件通过特定的分隔符来区分字段和记录:
- 用换行符(\n)来区分记录,一条记录会占据CSV文件的一行
- 用逗号(,)来区分一条记录中的不同字段,每个字段会单独占据一列
如果想要了解进阶的 C 语言读写 CSV 文件的有关内容,欢迎接着阅读进阶篇:
C语言读取写入CSV文件 [一]基础篇的更多相关文章
- 009-Go 读取写入CSV文件
package main import( "encoding/csv" "fmt" "os" "strconv" ) t ...
- pandas 读写excel 操作(按索引和关键字读取行和列,写入csv文件)
pandas读写excel和csv操作总结 按索引读取某一列的值 按关键字读取某一列的值 按关键字查询某一行的值 保存成字典并写入新的csv import pandas as pd grades=pd ...
- python读取和写入csv文件
读取csv文件: def readCsv(): rows=[] with file(r'E:\py\py01\Data\system.csv','rb') as f: reads=csv.reader ...
- python之读取和写入csv文件
写入csv文件源码: #输出数据写入CSV文件 import csv data = [ ("Mike", "male", 24), ("Lee&quo ...
- python在不同情况下写入csv文件
情况一(解法一):将列表存储为csv文件.列表的每一项代表csv文件的一行. 列表中的每一项包含多个属性.list=[[属性1,属性2,属性3,……],[属性1,属性2,属性3,……],[属性1,属性 ...
- 写入.csv文件
#include "stdafx.h" #include "WriteCsv.h" CString m_strData;//写入记录的一条数据 CString ...
- 读取gzmt.csv文件,计算均值及概率
问题: 读取gzmt.csv文件所有数据,选取收盘价格(倒数第二列),计算20天均值,权重取成交量(选做:时间权重为半衰期为15天):将该均值修剪为超过600的都设置为1000,并打印出该均值超过55 ...
- 利用Python写入CSV文件的方法
第一种:CSV写入中文 #! /usr/bin/env python # _*_ coding:utf- _*_ import csv csvfile = file('test.csv', 'wb') ...
- python3写入csv文件时中文为乱码
今天修改李万的爬虫时把页面上的中文写入csv文件时,中文总是乱码.通过上网搜索得到解决.解决的办法是打开文件是需加参数 encoding='utf-8-sig' .感谢博客园的菜鸟Alex.他相关博客 ...
随机推荐
- CS学习资料百度云链接
CS学习资料百度云链接 [0]Springboot微服务开发天气预报系统视频教程https://pan.baidu.com/s/1joz7flyztCq8oklBlsz8dQ提取密码:cpz7 [1] ...
- 使用jQuery 中的显示与隐藏动画效果实现折叠下拉菜单的收缩和展开,在页面的列表中有若干项,列表的每项中有一个二级列表,二级列表默认为隐藏状态。点击列表的项,切换二级列表的显示或隐藏状态
查看本章节 查看作业目录 需求说明: 使用jQuery 中的显示与隐藏动画效果实现折叠下拉菜单的收缩和展开,在页面的列表中有若干项,列表的每项中有一个二级列表,二级列表默认为隐藏状态.点击列表的项,切 ...
- HTML网页设计中 link 和 @import 的区别
页面中使用CSS的方式主要有3种:行内添加定义style属性值,页面头部内嵌调用和外面链接调用,其中外面引用有两种:link和@import.外部引用CSS两种方式link和@import的方式分别是 ...
- 编写Java程序,用套接字编程模拟实现银行认证过程
需求说明: 某银行一核心服务器部署了一个资金交易来往的系统,为了防止黑客入侵窃取数据,该银行专门开发了一款负责安全认证的智能机器人守护服务器,对外来访问做多重身份认证.现在要求你用套接字编程模拟实现这 ...
- 「影院售票系统」 · Java Swing + MySQL JDBC开发
目录 文档说明: 一.语言和环境 二.实现功能 三.数据库设计 四.具体要求及推荐实现步骤 五.注意事项 六.评分标准 实现代码: 一.数据库: 二.Java Swing: com.ynavc.Bea ...
- playwright--自动化(三): 跳过检测 使用正常谷歌 指定用户数据 下载文件
首先上一个被拷贝的惨不忍睹 上一个是滑块验证[https://www.cnblogs.com/carl-/p/15761861.html] 还是前两天做一个商城后台爬虫,限制用户缓存,不能用谷歌开发版 ...
- 分布式链路追踪自从用了SkyWalking,睡得真香!
本篇文章介绍链路追踪的另外一种解决方案Skywalking,文章目录如下: 什么是Skywalking? 上一篇文章介绍了分布式链路追踪的一种方式:Spring Cloud Sleuth+ZipKin ...
- linux 之 误删openssl文件夹重装openssl
背景 使用 scp.ssh 都报错 error while loading shared libraries: libcrypto.so.1.0.0: cannot open shared objec ...
- js 调用同级的 iframe 方法
有两个 iframe <iframe id="a"> <script> function food(a){ return a+1; } </scrip ...
- VMware桥接模式连接局域网和互联网
第一步:确认本地网关地址 第二步选择桥接模式: 我比较幸运,桥接到"自动",就已经连接成功.不用逐个试错. 修改 ifcfg-ens33 和 新建 ifcfg-br0 [root@ ...