[不知发在这个版面是否合适,若不合适请转移]
从某些数据库上下的pdf文献,往往尺寸很大,比如APS上下载一篇关EAM的文章
http://prola.aps.org/abstract/PRB/v29/i12/p6443_1
由于文件里是图像,而不是文本内容,所以仅11页,尺寸却达2.46M。储存、传输都不方便。这里介绍一下减小尺寸的办法。
我这里用的是acrobat3D v8.1,首先打开那个pdf,主菜单选Document-OCR Text Recoginition-Recognize Text Using OCR
对话框中,选All pages,Primary OCR Language:English,PDF Output Style:Searchable Image,Downsample:Lowest(600dpi),然后OK
acrobat对文档内容进行OCR识别,变成了可检索的文本形式,这时可以先保存一下,看到文件已变成1.79MB,说明OCR识别除了本职功能,还有减小文件尺寸的功效。
然后Document-Reduce File Size,由于一般都用的7.0以上阅读器,所以选7.0及以上。看看存完的新文件,已减小为368KB。若选8.0及以上并不会使文件更小。
如果再压缩成rar,还可以减小到336KB,但意义不大了
从2.46MB减小到336KB,成效明显,而且显示质量没有任何损失,文本还顺便变成了可检索、复制的形式。
顺序很关键,如果先Reduce File Size,再OCR,结果是2.46MB->940KB->832KB
acrobat还有个功能,Document-Optimize Scanned PDF,也可以减小尺寸,但对于这类文字很干净清晰的pdf文件,功效甚微,而且使显示质量下降。