wkhtmltopdf:一个 Linux 中将网页转成 PDF 的智能工具
2015-08-04 00:00
976 查看
wkhtmltopdf 是一个开源、简单而有效的命令行 shell 程序,它可以将任何 HTML (网页)转换为 PDF 文档或图像(jpg、png 等)。
wkhtmltopdf 是用 C++ 编写的,并在 GNU/GPL (通用公共许可证)下发布。它使用 WebKit 渲染引擎将 HTML 页面转换为 PDF 文档且不会丢失页面的质量。这是一个用于实时创建和存储网页快照的非常有用且可信赖的解决方案。
使用 WebKit 引擎将任意 HTML 网页转换为 PDF 文件。
添加页眉和页脚的选项
目录生成 (TOC) 选项。
提供批量模式转换。
通过绑定 libwkhtmltox 来支持 PHP 或 Python。
在本文中,我们将介绍如何在 Linux 系统下使用 tar 包来安装 wkhtmltopdf。
在 64 位 Linux 系统中:
wkhtmltopdf 是用 C++ 编写的,并在 GNU/GPL (通用公共许可证)下发布。它使用 WebKit 渲染引擎将 HTML 页面转换为 PDF 文档且不会丢失页面的质量。这是一个用于实时创建和存储网页快照的非常有用且可信赖的解决方案。
wkhtmltopdf 的功能
开源并且跨平台。使用 WebKit 引擎将任意 HTML 网页转换为 PDF 文件。
添加页眉和页脚的选项
目录生成 (TOC) 选项。
提供批量模式转换。
通过绑定 libwkhtmltox 来支持 PHP 或 Python。
在本文中,我们将介绍如何在 Linux 系统下使用 tar 包来安装 wkhtmltopdf。
安装 Evince (PDF 浏览器)
让我们在 Linux 系统中安装 evince (一个 PDF 阅读器)来浏览 PDF 文件。$ sudo yum install evince [RHEL/CentOS and Fedora]$ sudo dnf install evince [On Fedora 22+ versions]$ sudo apt-get install evince [On Debian/Ubuntu systems]
下载 wkhtmltopdf 源码文件
使用 wget 命令根据你的 Linux 架构来下载 wkhtmltopdf 源码文件,或者你也可以在 wkhtmltopdf 下载页下载最新的版本(目前最新的稳定版是 0.12.4)在 64 位 Linux 系统中:
$ wget http://download.gna.org/wkhtmltopdf/0.12/0.12.4/wkhtmltox-0.12.4_linux-generic-amd64.tar.xz[/code]在 32 位 Linux 系统中:$ wget http://download.gna.org/wkhtmltopdf/0.12/0.12.4/wkhtmltox-0.12.4_linux-generic-i386.tar.xz[/code]在 Linux 中安装 wkhtmltopdf
使用 tar 命令解压文件到当前目录中。为了能从任意路径执行程序,将 wkhtmltopdf 安装到------ On 64-bit Linux OS ------$ sudo tar -xvf wkhtmltox-0.12.4_linux-generic-amd64.tar.xz ------ On 32-bit Linux OS ------$ sudo tar -xvzf wkhtmltox-0.12.4_linux-generic-i386.tar.xz/usr/bin目录下。$ sudo cp wkhtmltox/bin/wkhtmltopdf /usr/bin/如何使用 wkhtmltopdf?
我们会看到如何将远程的 HTML 页面转换成 PDF 文件、验证信息、使用 evince 在 GNOME 桌面中浏览创建的文件。将 HTML 网页转成 PDF 文件
要将任意 HTML 页面转换成 PDF,运行下面的命令。它会在当前目录下将页面转换成 10-Sudo-Configurations.pdf。示例输出:# wkhtmltopdf http://www.tecmint.com/sudoers-configurations-for-setting-sudo-in-linux/ 10-Sudo-Configurations.pdfLoading pages (1/6)Counting pages (2/6)Resolving links (4/6)Loading headers and footers (5/6)Printing pages (6/6)Done浏览生成的 PDF 文件
为了验证创建的文件,使用下面的命令。示例输出:$ file 10-Sudo-Configurations.pdf10-Sudo-Configurations.pdf: PDF document, version 1.4浏览生成的 PDF 文件细节
要浏览生成的文件信息,运行下面的命令。示例输出:$ pdfinfo 10-Sudo-Configurations.pdfTitle: 10 Useful Sudoers Configurations for Setting 'sudo' in LinuxCreator: wkhtmltopdf 0.12.4Producer: Qt 4.8.7CreationDate: Sat Jan 28 13:02:58 2017Tagged: noUserProperties: noSuspects: noForm: noneJavaScript: noPages: 13Encrypted: noPage size: 595 x 842 pts (A4)Page rot: 0File size: 697827 bytesOptimized: noPDF version: 1.4浏览创建的文件
在桌面中使用 evince 查看最新生成的 PDF 文件。示例截图:$ evince 10-Sudo-Configurations.pdf
在我的 Linux Mint 17 中看起来很棒。
在 PDF 中浏览网页给 PDF 创建页面的 目录(Table Of Content )(TOC)
要创建一个 PDF 文件的目录,使用 toc 选项。示例输出:$ wkhtmltopdf toc http://www.tecmint.com/sudoers-configurations-for-setting-sudo-in-linux/ 10-Sudo-Configurations.pdf要查看已创建文件的 TOC,再次使用 evince。Loading pages (1/6)Counting pages (2/6)Loading TOC (3/6)Resolving links (4/6)Loading headers and footers (5/6)Printing pages (6/6)Done示例截图:$ evince 10-Sudo-Configurations.pdf
看一下下面的图。它上看去比上面的更好。
在 PDF 中创建网页的目录wkhtmltopdf 选项及使用
更多关于 wkhtmltopdf 的使用及选项,使用下面的帮助命令。它会显示出所有可用的选项。$ wkhtmltopdf --help
作者简介:
我是 Ravi Saive,TecMint 的创建者。一个爱在网上分享的技巧和提示的电脑极客和 Linux 专家。我的大多数服务器运行在名为 Linux 的开源平台上。请在 Twitter、 Facebook 和 Google+ 等上关注我。
via: http://www.tecmint.com/wkhtmltopdf-convert-website-html-page-to-pdf-linux/
相关文章推荐
- 在Linux下如何修改Mysql的用户(root)的密码
- Linux的一些命令
- CentOS下打包
- 虚ip设置
- Linux下时间同步
- Linux命令
- Linux C/C++编程手册查阅方法
- Linux资源管理之cgroups简介
- linux tar命令
- linux编程常用的函数
- linux学习笔记 - 文档权限与目录配置
- 教你如何用Kali Linux制作windows 10安装优盘
- CentOS6下安装MySQL数据库服务
- linux 线程学习之条件变量
- Linux互通SSH免密码访问
- 关于重装系统后,Windows和Linux双系统只能进入一个的问题
- 扩展虚拟机内系统centos6.6硬盘空间
- Linux 开关中断系列函数探究
- Unix/linux进程及线程间同步技术总结【学习总结,请勿吐槽。。。】
- Linux写时拷贝技术(copy-on-write)