博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
双层pdf怎么制作(可以复制里面文字)纸质书如何制作扫描图片书签目录?
阅读量:6865 次
发布时间:2019-06-26

本文共 878 字,大约阅读时间需要 2 分钟。

双层PDF格式文件是一种具有多层结构的PDF格式文件,是PDF文件衍生的一种文件,其特点是:文件既可以是文本型的(比如由word生成的文件),也可以是图像型的,既可以100%保留原始版面效果,又便于建立索引数据库,进行科学的管理。

很多时候我们发现,明明PDF文件是扫描版的,却可以复制其中的文字(偶尔会有错字),这是怎么回事呢?原来这是PDF制作的一种技术,叫“双层PDF”。
双层PDF格式文件是一种具有多层结构的PDF格式文件,是PDF文件衍生的一种文件,文件既可以是文本型的(比如由word生成的文件),也可以是图像型的(比如由扫描生成的文件,包含图像层),且其位置上下一一对应。制作过程中,资料通过扫描仪快速录入后,经过去污、纠偏和OCR识别,上层是原始图像,下层是识别结果,然后可以直接生成可以检索的PDF文件。这样既可以100%保留原始版面效果,又便于建立索引数据库,进行科学的管理。

双层PDF格式文件是一种具有多层结构的PDF格式文件,是PDF文件衍生的一种文件,其特点是:文件既可以是文本型的(比如由Word生成的文件),也可以是图像型的,既可以100%保留原始版面效果,又便于建立索引数据库,进行科学的管理。

很多时候我们发现,明明PDF文件是扫描版的,却可以复制其中的文字,这是怎么回事呢?原来这是PDF制作的一种技术,叫“双层PDF”。

那么,要如何制作双层PDF文档呢?

以下示例是福昕高级PDF编辑器,标准版或者企业版都可以的哦。

①你需要有一份扫描件PDF,或图片型的PDF文档:

②需要一款有OCR文字识别功能的PDF编辑软件,如福昕高级PDF编辑器。

操作如下,点击转换--OCR--当前文件。

注意:选择OCR引擎,要选择“可检索文件的图像”

通过OCR文字识别,上层是原始图像,下层是识别结果,然后可以直接生成可以检索的PDF文件。这样既可以100%保留原始版面效果。

如果没有软件,也可要选择PDFJIA服务,备注好需求即可。

转载于:https://blog.51cto.com/14224054/2402797

你可能感兴趣的文章
ASP.NET MVC之国际化(十一)
查看>>
Swift析构器
查看>>
★路由递归查询方法及相关图…
查看>>
SpringMvc入门
查看>>
scrapy 登录
查看>>
上海往事之看房子
查看>>
SQL Server使用规范
查看>>
高性能mysql主存架构
查看>>
《Programming WPF》翻译 第7章 3.笔刷和钢笔
查看>>
[20160906]修改口令在内存中.txt
查看>>
解剖SQLSERVER 第九篇 OrcaMDF现在能通过系统DMVs显示元数据(译)
查看>>
基于.net开发chrome核心浏览器【六】
查看>>
政务云系统——亿网软通“互联网+”政务云解决方案
查看>>
C# Process.Kill() 拒绝访问(Access Denied) 的解决方案
查看>>
RSA加密解密及RSA签名和验证
查看>>
把自定义的demuxer加入ffmpeg源码
查看>>
当空间数据遇上机器学习,城市的颜值有了新的度量方法
查看>>
如何解决RK3168或者RK系列MASKROM的问题
查看>>
通过扩展让ASP.NET Web API支持W3C的CORS规范
查看>>
商汤、旷视们“闯入”安防圈,传统安防巨头们怎么评价这些AI新贵?
查看>>