频道导航

sed – Linux shell命令按行长度过滤文本文件

2020-02-07 Linux 前端之家

前端之家收集整理的这篇文章主要介绍了sed – Linux shell命令按行长度过滤文本文件，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我有一个30gb磁盘映像的borked分区(想想dd if = / dev / sda1 of = diskimage)我需要从中恢复一些文本文件.像最重要的数据雕刻工具只能处理具有良好定义标题的文件,即不是纯文本文件,因此我已经回到了我的好朋友字符串上.

strings diskimage> diskstrings.txt生成了一个3GB的文本文件,其中包含一堆字符串,大多数是无用的东西,与我真正想要的文本混合在一起.

大多数残酷往往是长长的,不间断的乱码.我感兴趣的东西保证小于16kb,所以我要按行长度过滤文件.这是我用来做的Python脚本：

infile  = open ("infile.txt","r");
outfile = open ("outfile.txt","w");
for line in infile:
    if len(line) < 16384:
        outfile.write(line)
infile.close()
outfile.close()

这有效,但供将来参考：是否有任何神奇的单行咒语(想想awk,sed)会按行长度过滤文件？

解决方法

awk '{ if (length($0) < 16384) print }' yourfile >your_output_file.txt

将打印短于16千字节的行,如您自己的示例所示.

或者,如果你喜欢Perl：

perl -nle 'if (length($_) < 16384) { print }' yourfile >your_output_file.txt

上一篇：linux – Web服务器安全性过度杀伤下一篇：Linux：读取文件需要多少磁盘I / O

猜你在找的Linux相关文章

文件查找---find

文件查找（find） 1 find 简单的说，就是实时查找指定的内容或条件。特点：最新、最快、最...

作者：Sunzz 时间：2024-09-28

非交互式添加分区

非交互式添加分区方法一添加/deb/sdb 下的分区，其实位置为1到1000M，第二个分区位置为1...

作者：Sunzz 时间：2024-09-28

编译安装httpd

编译安装httpd 1 去官网下载源码包为避免非法软件，一定要去官网下载http://www.apache.o...

作者：Sunzz 时间：2024-09-28

磁盘分区-gdisk用法

gdisk用法 gdisk - InteractiveGUIDpartitiontable (GPT) manipulator GPTfdisk (akagdisk...

作者：Sunzz 时间：2024-09-28

Linux常用快捷按键

1 一定用快捷键这里简单的说下几个常用的快捷按键。 1.1 移动光标快捷键 Crtl + a 光...

作者：Sunzz 时间：2024-09-28

文件的压缩与解压

文件的压缩与解压常用命令和参数 1 gzip -c 将压缩或解压的结果输出至标准输出 -d 解压缩...

作者：Sunzz 时间：2024-09-28

合并 CentOS 6.8 的两个ISO镜像

合并 CentOS 6.8 的两个ISO镜像 1、创建相关目录：说明： /mnt/dvd1和/mnt/dvd2 用于挂载...

作者：Sunzz 时间：2024-09-28

常用的文件查看命令

常用的文件查看命令 1 cat 常用参数 -n 显示行号 -E 显示行尾结束符 $ -b 显示非空行编号 ...

作者：Sunzz 时间：2024-09-28

mount 1 挂载mount 基本概念挂载：将额外文件系统与根文件系统现存的目录建立起关联关系，...

作者：Sunzz 时间：2024-09-28

部署DNS服务

DNS，全称Domain Name System，即域名解析系统。 DNS功能主机名到IP地址的映射有两种方式...

作者：Sunzz 时间：2024-09-28

编程分类

Linux Windows CentOS Ubuntu Nginx WebService Scala Memcache Apache Redis Docker Bash Azure Tomcat LNMP Shell 数据结构服务器运维网络安全

最新文章