百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Linux 使用shell进行逐行文本求和

gudong366 2025-07-18 16:30 3 浏览

如果我们要计算一个文本文件中某一列数字的总和,给出一个文件如下:

touch test.txt

1 3
2 4
3 5
4 7

使用之前提到的awk指令,可以使用以下方式:

awk '{s+=$2} END {print s}' test.txt
19

使用这种方式可以得到我们想要的结果,但是我们还可以使用另外一种方式:即使用shell脚本进行逐行处理。

接下来我们来剖析使用shell 脚本逐行处理文本求和

touch test.sh

#!/bin/bash
sum=0
cat test.txt | while read line
do
		temp_num=$(echo "$line" | cut -d ' ' -f 2)
		sum=$(( $sum + $temp_num ))
done
echo "we get sum:$sum"                    
$ chmod +x test.sh
$ ./test.sh
$ we get sum:0

得到的结果是0,显然是错误的

从脚本中分析,在cat test.txt 之后将数据通过管道传递到while循环中,而while 循环的执行结果都是在一个子shell中,一旦这个子shell退出后,它里面的执行结果就会被释放。

我们在Linux中可以安装shellcheck 工具,用于检查shell 脚本的正确性,以Ubuntu为例:

sudo apt-get install shellcheck
$ shellcheck 2.sh

In 2.sh line 3:
cat test.txt | while read line
    ^------^ SC2002: Useless cat. Consider 'cmd < file | ..' or 'cmd file | ..' instead.
                     ^--^ SC2162: read without -r will mangle backslashes.


In 2.sh line 6:
    sum=$(( $sum + $temp_num ))
    ^-^ SC2030: Modification of sum is local (to subshell caused by pipeline).
            ^--^ SC2004: $/${} is unnecessary on arithmetic variables.
                   ^-------^ SC2004: $/${} is unnecessary on arithmetic variables.


In 2.sh line 9:
echo "we get sum:$sum"
                 ^--^ SC2031: sum was modified in a subshell. That change might be lost.

For more information:
https://www.shellcheck.net/wiki/SC2030 -- Modification of sum is local (to ...
https://www.shellcheck.net/wiki/SC2031 -- sum was modified in a subshell. T...
https://www.shellcheck.net/wiki/SC2162 -- read without -r will mangle backs...

不使用管道命令的情况下,继续进行尝试

!/bin/bash                                                                                     
sum=0
for line in $(cat test.txt)
do
    echo "we get line: $line"
    temp_num=$(echo "$line" | cut -d ' ' -f 2)
    sum=$(( $sum + $temp_num ))
done
echo "we get sum:$sum"

得到以下结果:

$ ./2.sh
we get line: 1
we get line: 3
we get line: 2
we get line: 4
we get line: 3
we get line: 5
we get line: 4
we get line: 7
we get sum:29!/bin/bash                                                                                     
IFS=#39;\n'
sum=0
for line in $(cat test.txt)
do
    echo "we get line: $line"
    temp_num=$(echo "$line" | cut -d ' ' -f 2)
    sum=$(( $sum + $temp_num ))
done
echo "we get sum:$sum"

从结果中可以看出,如果文本中存在空格或者tab等,读取的时候遇到空格,tab,或者换行就会停止读取了。

预期的目的应该是遇到换行才停止读取,为了达到这个目的,可以通过IFS设置以下标记,在shell脚本的开头加上:

IFS=#39;\n'
!/bin/bash                                                                                     
IFS=#39;\n'
sum=0
for line in $(cat test.txt)
do
    echo "we get line: $line"
    temp_num=$(echo "$line" | cut -d ' ' -f 2)
    sum=$(( $sum + $temp_num ))
done
echo "we get sum:$sum"

得到的结果如下:

$ ./2.sh
we get line: 1 3
we get line: 2 4
we get line: 3 5
we get line: 4 7
we get sum:19

这样得到的结果就是正确的


让我们尝试再换一种方式:

!/bin/bash                                                                                     
sum=0
while read line
do
    echo "line $line"
    temp_num=$(echo "$line" | cut -d ' ' -f 2)
    sum=$(( $sum + $temp_num ))
done < test.txt
echo "we get sum: $sum"

这种方式也可以得到正确的结果

当然,我们也可以读取指定的某一个数列,使用以下这种方式:

!/bin/bash                                                                                     
sum=0
while read col1 col2
do
    echo "get num: $col2"
    sum=$(( $sum + $col2 ))
done < "test.txt"
echo "we get sum: $sum"

其中col1, col2就分别代表第一列,第二列,使用的时候,可以直接使用对应列的内容。


通过加上-r参数可以处理每一行中的转义字符

while read -r line

最后

在使用shell脚本进行逐行处理文本时,需要注意以下几种情况:

  • 行文本中有空格,tab
  • 行文本中有转义字符
  • 可以使用shellcheck 工具提前对shell脚本进行检查,纠正错误

相关推荐

linux sed系列 第四篇:sed工业实战——日志处理与数据清洗

“掌握了sed的编程能力后,我们如同装备精良的工匠,终于可以踏入真实的工业战场。本篇将聚焦sed在日志分析、数据合规化、多文件批处理等场景中的应用,看它如何在海量数据中游刃有余,展现文本处理的...

Linux下sed的简单使用(linux中sed是什么意思)

1、sed简介stremeditor流编辑器,它是一项Linux指令,功能同awk类似,差别在于,sed简单,对列处理的功能要差一些,awk的功能复杂,对列处理的功能比较强大,sed编辑器是一行一...

linux基础命令之date命令(linux中的date)

date命令主要用于显示或者设置系统时间语法格式:date参数对象使用date命令时,最好先使用date--help命令查看支持哪些参数,有些小型Linux系统下的date命令,只支持一些基本参...

Ubuntu linux 常用命令(ubuntu常用的50个命令)

使用dpkg命令来安装.deb包。sudodpkg-i~/example.deb如果在安装过程中遇到依赖问题,可以使用以下命令来修复:sudoapt-getinstall-f将flut...

Linux基础命令-sed命令(linux教程:sed命令的用法)

Sed全名streameditor流编辑器,它是一个强大的文本处理工具,它可以从文件中接受输入,也可以接受来自标准输入流的输入,它擅长取行。Sed的用途非常广泛,包括:1)文本替换2)选择性的输...

linux sed系列 第二篇:sed进阶技巧——地址定位与正则表达式

“上一篇我们掌握了sed的基础替换,如同获得了第一把钥匙。现在,让我们更进一步,学习如何精准锁定目标行,如同拥有了导航地图,让每一次操作都直击要害!”地址定位的四种维度sed的强大,很大程度上源...

火狐Firefox浏览器140发布:手动Unload标签页、优化翻译体验等

IT之家6月24日消息,Mozilla在发布版本139不到一个月后,推出了最新的开源网页浏览器Firefox140。新版本增加了手动Unload标签页的功能,优化了垂直标签页的调...

Linux 基本正则表达式及扩展正则表达式功能举例

在Linux中,正则表达式(RegularExpression)是一种强大的模式匹配工具,用于在文本中查找、匹配和处理特定模式的字符串。Linux支持两种类型的正则表达式:基本正则表达式(Basic...

linux下find命令的经典26个使用示例

简介find命令是基于unix的操作系统中常用的工具之一。顾名思义,它在目录层次结构中查找文件和目录。用户可以传递不同的参数,并根据文件的名称、扩展名、类型、大小、权限、修改时间、所有者、组等搜索文件...

linux运维中特殊符号的应用与实践

路径位置类的特殊符号(1)、波浪线(~)在linux系统的命令行中,~表示用户的家目录,超级用户为/root,普通用户为/home。假设我当前目录在usr/local下[root@xrylocal]...

开源框架log4cpp实战(开源gui框架)

1.Log4cpp使用Log4cpp中主要包含Category(种类),Appender(附加器),Layout(布局),Priorty(优先级),NDC(嵌套的诊断上下文)。Category、App...

Linux find命令详解(linux find -l)

一、命令介绍Linuxfind命令是类unix操作系统中最重要和最常用的命令行实用程序之一。find命令用于根据指定的条件搜索和定位与参数匹配的文件和目录列表。find命令提供了广泛的选项,允许用户...

Linux运维:单引号与双引号的使用(linux 单引号和双引号)

1、单引号的使用单引号可以将它中间的所有任意字符还原为字面意义,实现屏蔽Shell元字符的功能。注意不可以在两个单引号中间单独插入一个单引号,单引号必须成对出现。示例1:定义一个变量,并输出变量的...

Linux技巧:find 命令用法详细说明,看完会有收获

在Linux命令中,find是比较复杂难用的命令。使用该命令搜索文件时,常常发现自己找了一些例子能用,但稍微改一下条件,就搜不到想要的结果。下面会以一些实例来说明使用find命令的关键要点和...

Linux Shell中单引号、双引号、反引号的解释

1、单引号('')单引号所见即所得,直接显示单引号里的内容。即单引号里的任何字符都会原样输出,单引号字符串中的变量是无效的。比如下面的例子,单引号所见即所得。2、双引号("...