# cat history |awk '{print $2,$3,$4,$5,$6,$7,$8.$9,$10}' # tail -n 13 history 215 systemctl stop 216 systemctl stop xinetd 217 systemctl stop firewalld 218 systemctl disable firewalld 219 vim neokylin.repo 220 yum install -y *tigervnc* 221 vncserver…
实例cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100 统计文件中出现次数最多的前10个单词 使用linux命令或者shell实现:文件words存放英文单词,格式为每行一个英文单词(单词可以重复),统计这个文件中出现次数最多的前10个单词. cat words.txt | sort | uniq -c | sort -k1,1nr | head -10 主要考察对sort.uniq命令…
1.查看某一段时间的日志 #cat hdfs-audit.log | sed -n '/2018-04-11 10:00:00/,/2018-04-11 10:01:00/ p' | more   ---直接使用时间段 #cat hdfs-audit.log | sed -n '/2018-04-11 09:[0-9][0-9]/,/2018-04-11 10:[0-9]:[0-9]/p' | more   ---使用正则表达式 #sed查看log时间段(sed -n '/开始/,/结束/p'…
grep Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并匹配行打印出来. 命令语法: usage: grep [-abcDEFGHhIiJLlmnOoqRSsUVvwxZ] [-A num] [-B num] [-C[num]] [-e pattern] [-f file] [--binary-files=value] [--color=when] [--context[=num]] [--directories=action] [--label] [--l…
如下图所示,想把含有‘-nan’字符串的行提取出来 则用到awk函数,命令行如下: awk '{if($3!="-nan"){print $3}}' CHB_vs_ITU.weir.fst > CHB_vs_ITU1.fst # !=表示不匹配 效果如下图: 注:上述只提取第三列,如果想提取所有不匹配的行的所有列,则将$3改为$0 awk '{if($3!="-nan"){print $0}}' CHB_vs_ITU.weir.fst > CHB_vs_…
 摘要 Linux命令是基于文本格式输入输出的一种程序,依照Unix哲学中强调的程序功能简单,输入宽松,输出严谨,各种程序组合能够具有更强大的功能,而具有这样的灵活性的主要原因是Linux规定程序的输入输出必须坚持文件流格式.即文本格式,而这就是Linux系统的核心之中的一个. 对于Bash,即Shell的一种.为如今主流Linux发行版本号默认的命令行解释器,是一种功能强大的工具.能够实现对Linux支持的程序命令的组合.从而实现强大功能.类似于Window系统的bat文件,Bash具有更…
//建测试表 create table dept( deptno number(3) primary key, dname varchar2(10), loc varchar2(13) ); create table employee_info( empno number(3), deptno number(3), ename varchar2(10), sex char(1), phone number(11), address varchar2(50), introduce varchar2…
创建表空间和表ORACLE物理上是由磁盘上的以下几种文件:数据文件和控制文件和LOGFILE构成的oracle中的表就是一张存储数据的表.表空间是逻辑上的划分.方便管理的.数据表空间 (Tablespace)         存放数据总是需要空间, Oracle把一个数据库按功能划分若干空间来保存数据.当然数据存放在磁盘最终是以文件形式,所以一盘一个数据表空间包含一个以上的物理文件数据表         在仓库,我们可能有多间房子,每个房子又有多个货架,每架又有多层. 我们在数据库中存放数据,最…
前言: 众所周知,关联规则挖掘是数据挖掘中重要的一部分,如著名的啤酒和尿布的问题.今天要学习的是经典的关联规则挖掘算法--Apriori算法 一.算法的基本原理 由k项频繁集去导出k+1项频繁集. 二.算法流程 1.扫描事务数据库,找出1项集,并根据最小支持度计数,剪枝得出频繁1项集.k=1. 2.由频繁k项集进行连接步操作,形成候选的k+1项集,并扫描数据库,得出每一项的支持度计数,并根据最小支持度计数,剪枝得到频繁k+1项集. 迭代的进行第2步直到频繁k项集是空的. 3.由频繁项集构造关联规…
在进行测试文件导入的时候,发现内存占用很大,如下所示: [root@python ~]# vmstat 1 -S M 3 procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu----- r b swpd free buff cache si so bi bo in cs us sy id wa st 0 0 0 196 0 730 0 0 50 6 13 8 0 0 100 0 0 0 0 0 19…