摘要:从零搭建个人知识库系统的思路与步骤流程·之一
更好的图文阅读体验:点这里
这里记录了作者 LEGALGEEK 整合已有技术及解决方案,从零搭建个人法律知识库系统的思路与步骤流程,自本期开始,将采用小册的形式,陆续推送,供具有近似需求的同学参考。
知识库构建方案大纲
👇
一、需求痛点(WHY)
(一)知识来源的多入口现状
🍉 开放领域知识:
- 搜索引擎所收录的一切,例如:Google
🍋 隐秘的角落:
1、需购买的垂直领域数据库,例如:北大法宝、法信
2、未被电子化的领域书籍,例如:《民事审判参考》
3、被出版商垄断的学术资源,例如:中国知网论文
4、被巨头视作私产的内容孤岛,例如:微信公众号文章
5、以信息流形态存在的知识,例如:资讯订阅类应用
6、个人总结的笔记、档案资料,例如:学习笔记、资料摘要
(二)有效管理知识的多技能要求
😅 1、调教搜索引擎的能力
🤣 2、购买多个数据库、出版物的财力
🥲 3、良好的记忆力与文档收集整理习惯
🤪 4、整合多渠道信息的耐心
二、解决方案(HOW)
(一)可行性:个人非商业使用
🛵 1、利用自动化程序批量获取公开资料
🚜 2、对已购买资源的所有权范围内使用
🚠 3、基于个人研究目的的合理使用
✈️ 4、对个人档案资料的全面处理
(二)可能性:成熟解决方案
🐭 1、公开数据自动化爬取方案
🦋 2、互联网信息流剪藏方案
🦄 3、纸质资料电子化方案
🦑 4、聚合入口设计方案
(三)设计原则:让知识被索引
🖨 1、电子化,改变知识载体物理属性
🎏 2、标签化,进行知识分类的基础
🧬 3、索引化,可被实时检索的前提
🧰 4、集约化,成本与体验的平衡
(四)整体架构 (见后续推文)
(五)详细设计(见后续推文)
END