Linux中使用cut命令来提取文本的用法指南

乐清SEO_开发应用_linux_ 乐清SEO2021-04-09 转载自:

有时我们经常会遇到这样一些问题：有一页电话号码薄，上面按顺序规则地写着人名、家庭住址、电话、备注等，此时我们只想取出所有人的名字和其对应的电话号码，你有几种方法可以实现呢？

确实这种纵向定位的方式用常规办法难以实现，这时，cut就可以大显身手了。
What’s cut?
子曰：cut命令可以从一个文本文件或者文本流中提取文本列。

命令用法：
cut -b list [-n] [file ...]
cut -c list [file ...]
cut -f list [-d delim][-s][file ...]

参数：
-b, --bytes=LIST
    输出这些字节
-c, --characters=LIST
    输出这些字符
-d, --delimiter=DELIM
    使用 DELIM 取代 TAB 做字段(field) 分隔符
-f, --fields=LIST
    输出这些字段
-n
    (忽略)
-s, --only-delimited
    不显示没有分隔符的行
--output-delimiter=STRING
    使用 STRING 作为输出分隔符, 缺省 (的输出分隔符) 为输入分隔符
--help
    显示帮助信息, 然后结束
--version
    显示版本信息, 然后结束

使用且只使用 -b, -c 或 -f 中的一个选项. LIST 由一个范围 (range) 或逗号隔开的多个范围组成. 范围是下列形式之一:

N
    第 N 个字节, 字符或字段, 从 1 计数起
N-
    从第 N 个字节, 字符或字段直至行尾
N-M
    从第 N 到第 M (并包括第M) 个字节, 字符或字段
-M
    从第 1 到第 M (并包括第M) 个字节, 字符或字段

如果没有指定文件 FILE, 或 FILE 是 -, 就从标准输入读取数据.

示例：

复制代码代码如下:

[root@localhost ~]# cat /etc/passwd | cut -b 1 |head -5 #输出文件的第一个字节
r
b
d
a
l

复制代码代码如下:

[root@localhost ~]# cat /etc/passwd | cut -c 1-4 |head -5 #输出文件的前四个字符
root
bin:
daem
adm:
lp:x

复制代码代码如下:

[root@localhost ~]# cat /etc/passwd | cut -f1 -d ':' |head -5 #以:分割文件，输出第一个字段
root
bin
daemon
adm
lp

复制代码代码如下:

# cat a.txt
ssss affff dddd fe fsc
rrr f adfa eer ddd

复制代码代码如下:

# cat a.txt |cut -f1,3 -d $'\t' #1，3列
ssss dddd
rrr adfa