在linux中分割大文件,比如一个5gb日志文件,需要把它分成多个小文件,分割后以利于普通的文本编辑器读取。

  有时,需要传输20gb的大文件,Linux培训

教程件到另一台服务器,也需要把它分割成多个文件,这样便于传输数据。

  以下通过五个不同的例子,来讲解Linux下分割大文件的方法,供大家参考。

  例1、以每个文件1000行分割

  split命令分割文件成每个文件1000行,并且文件名依次为 [前缀]aa,[前缀]ab, [前缀]ac等,默认的前缀是X,每个文件的行数为1000行。

  命令:

  复制代码代码如下:

  $ split mylog -l 1000

  $ wc -l *

  4450 mylog

  1000 xaa

  1000 xab

  1000 xac

  1000 xad

  450 xae

  例2、以每个文件20MB分割

  分割文件为多个20MB的文件,附带-b选项。

  命令:

  复制代码代码如下:

  $ split -b 20M logdata

  $ ls -lh | tail -n +2

  -rw------- 1 sathiyasathiya 102M Jul 25 18:47 logdata

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xaa

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xab

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xac

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xad

  -rw------- 1 sathiyasathiya 20M Jul 25 19:20 xae

  -rw------- 1 sathiyasathiya 1.6M Jul 25 19:20 xaf

  例3、以每个文件50MB指定前缀分割

  使用–bytes选项把文件分割成多个50MB的文件,–bytes类似-b选项,在第二个参数指定前缀。

  命令:

  复制代码代码如下:

  $ split --bytes=50M logdatamydatafile

  $ ls -lh

  total 204M

  -rw------- 1 sathiyasathiya 102M Jul 25 18:47 logdata

  -rw------- 1 sathiyasathiya 50M Jul 25 19:23 mydatafileaa

  -rw------- 1 sathiyasathiya 50M Jul 25 19:23 mydatafileab

  -rw------- 1 sathiyasathiya 1.6M Jul 25 19:23 mydatafileac

  例4、基于行数分割文件

  使用-l选项指定行数来把文件分割成多个行数相同的文件。

  命令:

  复制代码代码如下:

  $ wc -l testfile

  2591 testfile

  $ split -l 1500 testfileimportantlog

  $ wc -l *

  1500 importantlogaa

  1091 importantlogab

  2591 testfile

  例5、以数字后缀命名分割文件

  使用-d选项可以指定后缀为数字,如00,01,02..,而不是aa,ab,ac。

  命令:

  复制代码代码如下:

  $ split -d testfile

  $ ls

  testfile x00 x01 x02

  可用选项

  复制代码代码如下:

  短选项 长选项 选项描述

  -b –bytes=SIZE SIZE 值为每一输出档案的大小,单位为 byte。

  -C –line-bytes=SIZE 每一输出档中,单行的最大 byte 数。

  -d –numeric-suffixes 使用数字作为后缀。

  -l –lines=NUMBER NUMBER 值为每一输出档的列数大小。</p> <p>短选项 长选项 选项描述

  -b –bytes=SIZE SIZE 值为每一输出档案的大小,单位为 byte。

  -C –line-bytes=SIZE 每一输出档中,单行的最大 byte 数。

  -d –numeric-suffixes 使用数字作为后缀。

  -l –lines=NUMBER NUMBER 值为每一输出档的列数大小。

Linux培训教程 linux系统下分割大文件的方法的更多相关文章

  1. Linux培训教程 linux磁盘分区详解

    在学习 Linux 的过程中,安装 Linux 是每一个初学者的第一个门槛.在这个过程中间,最大的困惑莫过于给硬盘进行分区.虽然,现在各种发行版本的 Linux 已经提供了友好的图形交互界面,但是很多 ...

  2. Linux培训教程 linux下修改用户权限的方法

    一般我们日常碰到要修改用户权限的,往往是要么修改一下用户的gorupid,通过上面命令可以改;要么是把普通用户改成具有超级权限的用户,这个一般自己不能直接改,只能是root或有root权限的用户才能帮 ...

  3. Linux培训教程 linux中nl命令使用介绍

    nl命令在linux系统中用来计算文件中行号.nl 可以将输出的文件内容自动的加上行号!其默认的结果与 cat -n 有点不太一样, nl 可以将行号做比较多的显示设计,包括位数与是否自动补齐 0 等 ...

  4. linux下使用split 来分割大文件

    linux下使用split 来分割大文件 2010-07-27 15:46:27|  分类: 技术文稿 |  标签:split  分割  linux   |字号 订阅   平常都是使用ssh来进行远程 ...

  5. Linux培训教程 Git在linux下的使用

       *初始化git仓库,使用gitinit命令 *添加文件到git仓库分两步: 1.使用git add filename ;可分多次使用,添加多个文件到暂存区 2.使用git commit -m “ ...

  6. Linux系统下查看某文件修改的时间戳

    Linux系统下查看某文件修改的时间戳查看文件时间戳命令:stat awk.txt File: `awk.txt' Size: 20              Blocks: 8          I ...

  7. Linux系统下运行.sh文件

    在Linux系统下运行.sh文件有两种方法,比如我在root目录下有个vip666.sh文件 #chmod +x *.sh的文件名 #./*.sh的文件名 第一种(这种办法需要用chmod使得文件具备 ...

  8. linux下执行.sh文件的方法和语法

    linux下执行.sh文件的方法    .sh文件就是文本文件,如果要执行,需要使用chmod a+x xxx.sh来给可执行权限.       是bash脚本么   可以用touch test.sh ...

  9. [转帖]Linux下批量替换文件内容方法

    Linux下批量替换文件内容方法 https://www.cnblogs.com/fjping0606/p/4428850.html 刚才用到的命令 原作者写的挺好的记录一下 以后 用. 1:查找fi ...

随机推荐

  1. 小型自动化运维工具pssh和传输工具rsync

    一.简单介绍 1.pssh全称是parallel-ssh,基于Python编写的并发在多台服务器上批量执行命令的工具.包括pssh,pscp,prsync,pnuke和pslurp.该项目包括pssh ...

  2. Logistic回归基础篇之梯度上升算法

    代码示例: import numpy as np import matplotlib.pyplot as plt def loadDataSet(): dataMat = [];labelMat = ...

  3. ubuntu分区建议总结

    本文为转载别人的内容,结合了其他内容,进行分区的总结.其中主要是分区表格,对于ubuntu安装时,进行分区非常有用. 无论是安装Windows还是Linux操作系统,硬盘分区都是整个系统安装过程中最为 ...

  4. 应用安全 - 中间件 - Tomcat - 漏洞 - 汇总

    管理后台弱口令 CVE-2019-0232 Date 类型 任意代码执行 影响版本 Apache Tomcat .M1 to Apache Tomcat to Apache Tomcat to 前置条 ...

  5. yum源迁移(思路具体操作之后加)

    准备工作,有一台能联网的机器装有liunx系统 首先在联网机器下载yum系列包(yum命令如果不存在的话只能通过安装包的形式进行安装这里不考虑yum命令不存在情况) 修改配置文件使得yum命令只下载不 ...

  6. kafka语句示例

    1.从http://kafka.apache.org/下载kafka安装包:2.tar zxvf kafka_2.8.0.tar.gz,修改配置文件conf/server.properties:bro ...

  7. Linux MFS分布式文件系统介绍和安装

    MFS分布式文件系统 mooseFS(moose 驼鹿)是一款网络分布式文件系统.它把数据分散在多台服务器上,但对于用户来讲,看到的只是一个源.MFS也像其他类unix文件系统一样,包含了层级结构(目 ...

  8. JS中的 map, filter, some, every, forEach, for in, for of 用法总结和区别

    JS中的 map, filter, some, every, forEach, for in, for of 用法总结和区别  :https://blog.csdn.net/hyupeng1006/a ...

  9. Codeforces 1140F Extending Set of Points (线段树分治+并查集)

    这题有以下几个步骤 1.离线处理出每个点的作用范围 2.根据线段树得出作用范围 3.根据分治把每个范围内的点记录和处理 #include<bits/stdc++.h> using name ...

  10. springmvc中的数据传递

    import javax.servlet.http.HttpServletRequest; import org.springframework.stereotype.Controller; impo ...