雙層PDF格式文件是一種具有多層結構的PDF格式文件,是PDF文件衍生的一種文件,其特點是:文件既可以是文本型的(比如由word生成的文件),也可以是圖像型的,既可以100%保留原始版面效果,又便于建立索引數據庫,進行科學的管理。
很多時候我們發現,明明PDF文件是掃描版的,卻可以復制其中的文字(偶爾會有錯字),這是怎么回事呢?原來這是PDF制作的一種技術,叫“雙層PDF”。
雙層PDF格式文件是一種具有多層結構的PDF格式文件,是PDF文件衍生的一種文件,文件既可以是文本型的(比如由word生成的文件),也可以是圖像型的(比如由掃描生成的文件,包含圖像層),且其位置上下一一對應。制作過程中,資料通過掃描儀快速錄入后,經過去污、糾偏和OCR識別,上層是原始圖像,下層是識別結果,然后可以直接生成可以檢索的PDF文件。這樣既可以100%保留原始版面效果,又便于建立索引數據庫,進行科學的管理。