0%

从0到1搭建个人知识库系统 ·(二)纸质文档电子化

摘要:书籍扫描,应对知识资源类型的复杂性考验。

更好的图文阅读体验:点这里

这里记录了作者LEGALGEEK整合已有技术及解决方案,从零搭建个人知识库系统的思路与步骤流程,作者采用小册的形式,陆续在公众号 [法务产品设计] 推送,供具有近似需求的同学参考。

本篇是整体解决方案的第二篇 · 纸质文档的电子化路径,主要分享作者为统一个人知识资源形态所进行的尝试。其核心内容包含四个层次:

  • 1、何种情况下需要将文档电子化

  • 2、从纸质图书到高清PDF的步骤与工具

  • 3、更进一步:文件OCR与目录处理

  • 4、反思:优缺点及可能的替代方案

🍌 解决什么问题

假设你下定决心,要构建一套完美的个人知识库系统,将不得不面对知识资源类型的复杂性考验。

其中,你可能会望着自己书架上按斤衡量的图书发呆:这些玩意儿如何进入我的知识库?

你可能想到了一个妙计:纸质书就用来收藏吧,我再找个电子版的放到电脑里。

对于一些畅销书,你或许可以通过购买电子书、高超的搜索技术,或者万能的某宝实现你的想法,但是可能有一些尴尬仍然无法避免:

  • a. 正规渠道购买的电子书,往往采用加密格式,限制颇多,例如只能使用特定的软硬件查看。

  • b. 网上的盗版PDF资源,质量无法保证,例如大大的水印,高糊的分辨率,且面临道德瑕疵与版权风险。

  • c. 有一些书只通过纸质媒体发行,且版权保护工作十分到位,各处都没有电子版。

这时侯你可能想到另外一条路径:我是否有办法将自有文档以某种方式扫描成电子版?

在一些情况下,你可以用照相机或者手机App来解决这个问题,但尴尬依然挥之不去:

  • d. 超过200页的图书,拍照和调整就成为一个体力活;

  • e. 我该怎么压着书,才能让拍出来的文档不变形?

这些都是作者曾经历的困扰,也是本解决方案要满足的一个 “痛点”,接下是作者当前实现电子书自由的具体方法。

🍽 操作流程与工具

最近手头新到货了一本吴军老师的《计算之魂》,这里以这本近400页的图书为例,完整走一遍作者当前使用的文档电子化操作流程。

步骤一:给书拍照

目的:在书籍面目全非之前留个纪念

工具:相机

步骤二:拆书

目的:每50页拆成一组备用

工具:防割垫板、小刀

步骤三:裁边

目的:去除书脊以方便扫描

工具:大裁纸刀,作者使用的是 [ 可得优 13050]

步骤四:扫描

目的:扫描文档并生成PDF

工具:高速扫描仪,作者使用的是 [ 富士通ix1600 ]

步骤五:OCR

目的:使得PDF文字内容可复制可搜索

工具:带有OCR功能的软件,作者使用的是 [ DEVONthink3 ]

步骤六:编辑目录

目的:为PDF文件添加导航目录

工具:PDF编辑器,作者使用的是 [ PDF Expert ]

步骤七:入库

目的:放进资料管理软件特定目录,方便查找和全文搜索

工具:文档/知识管理系统,作者使用的是 [ DEVONthink3 ]

🤔 方案反思

😄 主要优点

1、初步实现了个人文档的 “信息化” ,数据放在电脑、云端、手机,可随时取用。

2、省去一个书架,搬家减轻负担。

🥲 主要缺点

1、工具费钱 ( 但钱换来了时间和自由,它们以另外一种方式陪伴着我 )

2、考验动手能力(虽然不难,但因人而异)

🤪 替代方案

1、如果你家楼下恰好有一家打印店,或许可以把书直接丢给老板,然后付钱取货。

2、某宝有寄书代扫描服务,不过没用过。

3、太麻烦了,纸质书其实也挺好…

如果你有更好的想法或者工具,可在公众号【法务产品设计】留言反馈。