Linux中cut,sort,uniq和wc的用法-白红宇

Linux中cut,sort,uniq和wc的用法

阅读量：7223 次

发布时间：2019-06-29

本文共 965 字，大约阅读时间需要 3 分钟。

一.cut是一个选取命令，就是将一段数据经过分析，取出我们想要的。一般来说，选取信息通常是针对“行”来进行分析的，并不是整篇信息分析的。

1.语法格式为：

cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file]

2.使用说明

cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。

如果不指定 File 参数，cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一。

3.主要参数

-b ：以字节为单位进行分割。这些字节位置将忽略多字节字符边界，除非也指定了 -n 标志。

-c ：以字符为单位进行分割。

-d ：自定义分隔符，默认为制表符。

-f ：与-d一起使用，指定显示哪个区域。

二.sort将文件的每一行作为一个单位，相互比较，比较原则是从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出.

-u : 它的作用很简单，就是在输出行中去除重复行。

-r : sort默认的排序方式是升序，如果想改成降序，就加个-r就搞定了。

-o : 把sort的标准输出到原文件中去。

-n : 以数值来进行排序。

你有没有遇到过10比2小的情况。我反正遇到过。出现这种情况是由于排序程序将这些数字按字符来排序了，排序程序会先比较1和2，显然1小，所以就将10放在2前面喽。这个时候就要用到-n选项了。

-t : 指定分隔符

-k : 指定分隔符后，指定列数。

-f : 忽略大小写

三.uniq命令可以去除排序过的文件中的重复行，因此uniq经常和sort合用。也就是说，为了使uniq起作用，所有的重复行必须是相邻的。

-i ：忽略大小写字符的不同；

-c ：进行计数，显示文件中每行连续出现的次数。

-u ：只显示唯一的行

-d : 显示文件中连续重复出现的行。

注意：uniq通常和sort一起使用，因为uniq去重的前提是重复的行必须是相邻的，所以在使用时，先用sort进行排序，然后再使用uniq。

四.wc统计文件里面有多少单词，多少行，多少字符。

-l ：仅列出行；

-w ：仅列出多少字(英文单字)；

-m ：多少字符；

转载于:https://blog.51cto.com/13120271/2327404

你可能感兴趣的文章