如何使用 pdfgrep 从终端搜索 PDF 文件 | Linux 中国
2018-01-20 00:00
1171 查看
顾名思义,pdfgrep 是一个可以在不打开文件的情况下搜索 PDF 中的文本的小命令行程序。它非常快速 —— 比几乎所有 PDF 浏览器提供的搜索更快。-- Bruno Edoh
本文导航◈ 安装26%◈ 测试运行38%◈ 其它62%◈ 总结85%编译自 | https://www.maketecheasier.com/search-pdf-files-pdfgrep/
作者 | Bruno Edoh
译者 | geekpi诸如 grep[1] 和 ack-grep[2] 之类的命令行工具对于搜索匹配指定正则表达式[3]的纯文本非常有用。但是你有没有试过使用这些工具在 PDF 中搜索?不要这么做!由于这些工具无法读取PDF文件,因此你不会得到任何结果。它们只能读取纯文本文件。顾名思义,pdfgrep[4] 是一个可以在不打开文件的情况下搜索 PDF 中的文本的小命令行程序。它非常快速 —— 比几乎所有 PDF 浏览器提供的搜索更快。
对于其他发行版,只要在包管理器[5]里输入 “pdfgrep” 查找,它就应该能够安装它。万一你想浏览其代码,你也可以查看项目的 GitLab 页面[6]。测试运行现在你已经安装了这个工具,让我们去测试一下。
◈
pdfgrep search红色高亮显示所有遇到单词 “queue” 的地方。在命令中加入
推荐文章< 左右滑动查看相关文章 >点击图片、输入文章 ID 或识别二维码直达
原文链接请访问“原文链接”获得可点击的文内链接、全尺寸原图和相关文章。
本文导航◈ 安装26%◈ 测试运行38%◈ 其它62%◈ 总结85%编译自 | https://www.maketecheasier.com/search-pdf-files-pdfgrep/
作者 | Bruno Edoh
译者 | geekpi诸如 grep[1] 和 ack-grep[2] 之类的命令行工具对于搜索匹配指定正则表达式[3]的纯文本非常有用。但是你有没有试过使用这些工具在 PDF 中搜索?不要这么做!由于这些工具无法读取PDF文件,因此你不会得到任何结果。它们只能读取纯文本文件。顾名思义,pdfgrep[4] 是一个可以在不打开文件的情况下搜索 PDF 中的文本的小命令行程序。它非常快速 —— 比几乎所有 PDF 浏览器提供的搜索更快。
grep和
pdfgrep的最大区别在于
pdfgrep对页进行操作,而
grep对行操作。
grep如果在一行上找到多个匹配项,它也会多次打印单行。让我们看看如何使用该工具。安装对于 Ubuntu 和其他基于 Ubuntu 的 Linux 发行版来说,这非常简单:
sudo apt install pdfgrep
对于其他发行版,只要在包管理器[5]里输入 “pdfgrep” 查找,它就应该能够安装它。万一你想浏览其代码,你也可以查看项目的 GitLab 页面[6]。测试运行现在你已经安装了这个工具,让我们去测试一下。
pdfgrep命令采用以下格式:
pdfgrep [OPTION...] PATTERN [FILE...]
◈
OPTION是一个额外的属性列表,给出诸如
-i或
--ignore-case这样的命令,这两者都会忽略匹配正则中的大小写。◈
PATTERN是一个扩展正则表达式。◈
FILE如果它在相同的工作目录就是文件的名称,或文件的路径。我对 Python 3.6 官方文档运行该命令。下图是结果。
pdfgrep search红色高亮显示所有遇到单词 “queue” 的地方。在命令中加入
-i选项将会匹配单词 “Queue”。请记住,当加入
-i时,大小写并不重要。其它
pdfgrep有相当多的有趣的选项。不过,我只会在这里介绍几个。◈
-c或者
--count:这会抑制匹配的正常输出。它只显示在文件中遇到该单词的次数,而不是显示匹配的长输出。◈
-p或者
--page-count:这个选项打印页面上匹配的页码和页面上的该匹配模式出现次数。◈
-m或者
--max-count[number]:指定匹配的最大数目。这意味着当达到匹配次数时,该命令停止读取文件。所支持的选项的完整列表可以在 man 页面或者
pdfgrep在线文档[7]中找到。如果你在批量处理一些文件,不要忘记,
pdfgrep可以同时搜索多个文件。可以通过更改
GREP_COLORS环境变量来更改默认的匹配高亮颜色。总结下一次你想在 PDF 中搜索一些东西。请考虑使用
pdfgrep。该工具会派上用场,并且节省你的时间。via: https://www.maketecheasier.com/search-pdf-files-pdfgrep/作者:Bruno Edoh[9] 译者:geekpi 校对:wxy本文由 LCTT 原创编译,Linux中国 荣誉推出LCTT 译者geekpi ? ?共计翻译:638 篇贡献时间:1547 天
推荐文章< 左右滑动查看相关文章 >点击图片、输入文章 ID 或识别二维码直达
原文链接请访问“原文链接”获得可点击的文内链接、全尺寸原图和相关文章。
相关文章推荐
- 如何使用 pdfgrep 从终端搜索 PDF 文件
- 如何使用 pdfgrep 从终端搜索 PDF 文件
- 如何在 Ubuntu 上使用 ZFS 文件系统 | Linux 中国
- [Linux][Mac]如何使用SSH登陆远程Linux服务器&使用SCP下载远程终端文件
- linux中文件搜索相关的locate,find,whereis与which,grep的使用
- Linux中使用grep命令搜索文件名及文件内容的方法
- 如何在使用 scp 命令时递归地排除文件 | Linux 中国
- 如何使用 GNU Stow 来管理从源代码安装的程序和点文件 | Linux 中国
- bzgrep命令_Linux bzgrep 命令用法详解:使用正则表达式搜索.bz2压缩包中文件
- linux 下查找、搜索文件筛选使用 grep 实例演示 带截图
- 如何监控Linux文件系统事件:inotify使用指南(1)
- 使用grep搜索目录树中文件的指定内容
- 使用grep搜索文件内容——快捷、方便
- Linux下使用Grep命令回复误删文件
- Linux如何搜索文件的方法
- 搜索文件夹内的所有文件里包含某字符串的linux命令(grep)
- linux终端下,使用ls时,显示的文件颜色,都表示什么含义,在哪里可以查看和修改
- 使用ext3grep恢复linux下ext3文磁盘格式下误删除文件
- linux grep搜索命令的使用方法
- linux 每日学一点《使用grep恢复被删文件内容》