split 命令

最近下游一直说我供给的文件存在乱码，下游定位到了具体哪一条。

一个250w的数据量，有一条数据有问题。几百兆的文件用note去搜索。

我使用用notepad++后，发现根本打不开。

于是只能先拆分后用notepad++打开。。。。。再用显示所有字符告诉下游。我们大数据提供的数据没有乱码。

$ split --help

Usage: split [OPTION]... [INPUT [PREFIX]]

Output fixed-size pieces of INPUT to PREFIXaa, PREFIXab, ...; default

size is 1000 lines, and default PREFIX is 'x'.  With no INPUT, or when INPUT

is -, read standard input.

Mandatory arguments to long options are mandatory for short options too.

  -a, --suffix-length=N   generate suffixes of length N (default 2)

      --additional-suffix=SUFFIX  append an additional SUFFIX to file names

  -b, --bytes=SIZE        put SIZE bytes per output file

  -C, --line-bytes=SIZE   put at most SIZE bytes of lines per output file

  -d, --numeric-suffixes[=FROM]  use numeric suffixes instead of alphabetic;

                                   FROM changes the start value (default 0)

  -e, --elide-empty-files  do not generate empty output files with '-n'

      --filter=COMMAND    write to shell COMMAND; file name is $FILE

  -l, --lines=NUMBER      put NUMBER lines per output file

  -n, --number=CHUNKS     generate CHUNKS output files; see explanation below

  -u, --unbuffered        immediately copy input to output with '-n r/...'

      --verbose           print a diagnostic just before each

                            output file is opened

      --help     display this help and exit

      --version  output version information and exit

SIZE is an integer and optional unit (example: 10M is 10*1024*1024).  Units

are K, M, G, T, P, E, Z, Y (powers of 1024) or KB, MB, ... (powers of 1000).

CHUNKS may be:

N       split into N files based on size of input

K/N     output Kth of N to stdout

l/N     split into N files without splitting lines

l/K/N   output Kth of N to stdout without splitting lines

r/N     like 'l' but use round robin distribution

r/K/N   likewise but only output Kth of N to stdout

GNU coreutils online help: <http://www.gnu.org/software/coreutils/>

For complete documentation, run: info coreutils 'split invocation'

是不是感觉特别不懂，不着急我们继续分析。

-b：值为每一输出档案的大小，单位为 byte。

-C：每一输出档中，单行的最大 byte 数。

-d：使用数字作为后缀。

-l：值为每一输出档的列数大小。

PREFIX:代表前导符，可作为切割文件的前导文件。

1.使用split命令将100KB的date.file文件分割成大小为10KB的小文件：

split -b 10k date.file

ls

结果：

date.file xaa xab xac xad xae xaf xag xah xai xaj

2.文件被分割成多个带有字母的后缀文件，如果想用数字后缀可使用-d参数，同时可以使用-a length来指定后缀的长度：

split -b 10k date.file -d -a 

 ls

结果：

date.file x000 x001 x002 x003 x004 x005 x006 x007 x008 x009

3.为分割后的文件指定文件名的前缀：

split -b 10k date.file -d -a  split_file

 ls

结果：

date.file split_file000 split_file001 split_file002 split_file003 split_file004 split_file005 split_file006 split_file007 split_file008 split_file009

4.使用-l选项根据文件的行数来分割文件，例如把文件分割成每个包含1000行的小文件：

split -l  date.file

那文件合并呢？

linux命令：
比如 cat 1.wav 2.wav 3.wav > all.wav 就是直接把1.wav 2.wav 3.wav 合并成all.wav
注意1.wav 2.wav 3.wav的顺序，all.wav是按照这个顺序合并的。

split 命令的更多相关文章

linux大文件分割 split命令
inux split 命令功能说明:切割文件. 语法:split [--help][--version][-][-b ][-C ][-l ][要切割的文件][输出文件名] 补充说明:split可将 ...
Linux下的split 命令（将一个大文件根据行数平均分成若干个小文件）
将一个大文件分成若干个小文件方法例如将一个BLM.txt文件分成前缀为 BLM_ 的1000个小文件,后缀为系数形式,且后缀为4位数字形式先利用 wc -l BLM.txt 读出 BL ...
按行切割大文件（linux split 命令简版）
按行切割大文件(linux split 命令简版) #-*- coding:utf-8 -*- __author__ = 'KnowLifeDeath' ''' Linux上Split命令可以方便对大 ...
Linux split命令详解
Linux split命令 Linux split命令用于将一个文件分割成数个.该指令将大文件分割成较小的文件,在默认情况下将按照每1000行切割成一个小文件. 将输入内容拆分为固定大小的分片并输出到 ...
linux常用命令：split 命令
split是linux下常用的分割文件命令.Linux下文件分割可以通过split命令来实现,而用cat进行文件合并.而分割可以指定按行数分割和按大小分割两种模式. 1.命令格式: split [OP ...
split命令详解
基础命令学习目录首页原文链接:https://blog.csdn.net/lkforce/article/details/71547313 Linux中的文件,特别是日志文件,特别大了不好打开,可以 ...
Linux：split命令详解
split 可以将一个大文件分割成很多个小文件,有时需要将文件分割成更小的片段,比如为提高可读性,生成日志语法 split(选项)(file)PREFIX 选项 -b:值为每一输出档案的大小,单位为 ...
Linux常用命令（6/26）——dd命令和split命令
dd:用指定大小的块拷贝一个文件,并在拷贝的同时进行指定的转换. 以可选块长度复制文件,默认情况下从标准输入设备输出到标准输出设备.复制过程中,还可以对文件进行一些转换. dd命令可以指定block的 ...
Linux split命令实例
曾经是否想要把一个大文件分割成多个小文件?比如一个5gb日志文件,我们需要把它分成多个小文件,这样我们才有可能使用普通的文本编辑器读取它.有时我们需要传输20gb的大文件到另一台服务器,这就需要我们把 ...
linux切割文件【split命令详解】
linux查看帮助 [tomcat-nohup]$ split --help 用法:split [选项]... [输入 [前缀]] 将输入内容拆分为固定大小的分片并输出到"前缀aa" ...

随机推荐

Linux 中账户管理
账户管理涉及到三个文件: 1./etc/passwd yy@ubuntu:~$ head -n 3 /etc/passwdroot:x:0:0:root:/root:/bin/bashdaemon:x ...
IIS写权限漏洞和XFF刷票原理
IIS写权限漏洞 PUT写入漏洞此漏洞主要是因为服务器开启了webdav的组件导致的 1.扫描漏洞,yes,可以PUT: 2.用老兵的工具上传一句话文件test.txt,然后move改名为shell ...
[xpath] text()和string()区别
质区别 text()是一个node test,而string()是一个函数,data()是一个函数且可以保留数据类型.此外,还有点号(.)表示当前节点. 使用要点 XML例子: <book> ...
hive_UDTF函数
hive的UDTF函数是可以输入一行数据然后输出多行多列(可以是单行/单列)的函数 public class Tex extends GenericUDTF { /** * 对传入的参数进行初始化 * ...
sublime text3 注册码 (Version 3.0)
-– BEGIN LICENSE -– TwitterInc 200 User License EA7E-890007 1D77F72E 390CDD93 4DCBA022 FAF60790 61AA ...
.Net Core Web应用加载读取Json配置文件
⒈添加Json配置文件并将“复制到输出目录”属性设置为“始终复制” { "Logging": { "LogLevel": { "Default&quo ...
FullPage.js全屏插件文档及使用方法
简介 fullPage.js是一个基于jQuery的全屏滚动插件,它能够很方便.很轻松的制作出全屏网站下载地址下载地址相关示例:基于fullpage.js实现的360全屏滑动效果支持功能支持 ...
Postman之简单使用
前提:已获得接口文档 / 抓包数据 1.启动Postman 直接在这个页面输入数据(不用管其他的地方!!!) 2.按照接口文档填入注意蓝色框中的数据请求方式:POST(几乎都是使用POST/GET ...
快速幂(Fast_Power)
定义快速幂顾名思义,就是快速算某个数的多少次幂. 其时间复杂度为 O(log2N), 与朴素的O(N)相比效率有了极大的提高. 以下以求a的b次方来介绍原理把b转换成2进制数该2进制数第i位的权为 ...
C# 面向对象1(类和对象的概念)
1.面向过程-->面向对象面向过程:面向的是完成这件事儿的过程,强调的是完成这件事儿的动作. 2.面向过程的思想: 以上的,需求一更改,会导致不同的方法,一一去更改. 3.面向对象的思想:找个 ...

split 命令

split 命令的更多相关文章

随机推荐

热门专题