R语言简单处理pdf神器——qpdf包
qpdf是一个在不读取PDF内容的前提下进行pdf页面操作的package,能够方便的实现PDF页面的合并、拆分、压缩。
# qpdf package
qpdf包提供了PDF文件保守的内容转换,如拆分、合并和压缩。这个包直接使用了qpdf的c++ API接口,不需要任何命令行工具,qpdf不会从PDF文件中读取实际内容。 该包总共提供了以下5个函数,所有函数均不会对原始文件产生任何影响:
# pdf_split
**描述:**将一个pdf文件拆分成许多个单页,一页一个新pdf文件 用法:pdf_split(input, output = NULL, password = NULL)
# pdf_length
**描述:**提取单个pdf文件的页数信息 用法:pdf_length(input, password = NULL)
# pdf_subset
**描述:**提取单个pdf文件的特定页 用法:pdf_subset(input, pages = 1, output = NULL, password = NULL)
# pdf_combine
**描述:**多个pdf顺序合并 用法:pdf_combine(input, output = NULL, password = NULL)
# pdf_compress
**描述:**pdf文件压缩和线性化 用法:pdf_compress(input, output = NULL, linearize = FALSE, password = NULL)
# 参数汇总
参数名 | 含义 |
---|---|
input | 输入文件路径 |
output | 输出文件路径 |
password | 文件密码 |
pages | 需要提取的子页页码(vector类型) |
linearize | 是否将pdf线性化 |
上次更新: 2024/03/11, 23:50:27