博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Linux中cut,sort,uniq和wc的用法
阅读量:7223 次
发布时间:2019-06-29

本文共 965 字,大约阅读时间需要 3 分钟。

一.cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。

1.语法格式为:
cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file]
2.使用说明
cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。
如果不指定 File 参数,cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一。
3.主要参数
-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。

二.sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出.

-u : 它的作用很简单,就是在输出行中去除重复行。
-r : sort默认的排序方式是升序,如果想改成降序,就加个-r就搞定了。
-o : 把sort的标准输出到原文件中去。
-n : 以数值来进行排序。
你有没有遇到过10比2小的情况。我反正遇到过。出现这种情况是由于排序程序将这些数字按字符来排序了,排序程序会先比较1和2,显然1小,所以就将10放在2前面喽。这个时候就要用到-n选项了。
-t : 指定分隔符
-k : 指定分隔符后,指定列数。
-f : 忽略大小写

三.uniq命令可以去除排序过的文件中的重复行,因此uniq经常和sort合用。也就是说,为了使uniq起作用,所有的重复行必须是相邻的。

-i :忽略大小写字符的不同;
-c :进行计数,显示文件中每行连续出现的次数。
-u :只显示唯一的行
-d : 显示文件中连续重复出现的行。
注意:uniq通常和sort一起使用,因为uniq去重的前提是重复的行必须是相邻的,所以在使用时,先用sort进行排序,然后再使用uniq。

四.wc统计文件里面有多少单词,多少行,多少字符。

-l :仅列出行;
-w :仅列出多少字(英文单字);
-m :多少字符;

转载于:https://blog.51cto.com/13120271/2327404

你可能感兴趣的文章
SCU 3132(博弈)
查看>>
正则表达式
查看>>
delete archivelog all 无法彻底删除归档日志?
查看>>
Redis五大数据类型
查看>>
大型分布式网站架构技术总结
查看>>
矩阵求导与投影梯度相关问题
查看>>
SVN
查看>>
C语言编程写的一个http下载程序(王德仙)2012-04-08
查看>>
CCF201409-3 字符串匹配(100分)
查看>>
UVALive2203 UVa10042 Smith Numbers【质因数分解+素数判定+数位之和】
查看>>
Project Euler Problem 9: Special Pythagorean triplet
查看>>
HDU5701 中位数计数【中位数】
查看>>
Python 深浅拷贝 (Shallow copy and Deep copy in Python)
查看>>
Axure
查看>>
屏幕截取工具
查看>>
C语言第七次作业---要死了----
查看>>
Jquery事件绑定冲突
查看>>
偶现bug如何处理?
查看>>
yum命令简介
查看>>
【Udacity】朴素贝叶斯
查看>>