
告别纸质文档:Docker安装Paperless-ngx无纸化文档管理系统,支持OCR全文搜索与自动归档
每次整理家里那堆“纸山”——发票、合同、快递单据,我都头疼不已。上次找装修合同,翻了三个文件袋,折腾半小时才找到,那一刻我心想:要是这些纸能直接“变身”为可搜索的电子版就好了。
后来我终于在 GitHub 上发现了这款神器——Paperless-ngx,足足有 20.2K Star!它可不是简单扫个电子版,用 OCR 识别后,输个 “2024 物业费” 就能秒定位文件;不管是 Word、Excel 还是 PDF,甚至老存档的扫描件,都能贴标签分类,比文件夹层层嵌套清爽太多,像有个随叫随到的私人档案员。
后来我把它部署在了 NAS 上,过程中踩过些小坑,也摸清了所有细节 —— 所以这次整理的图文教程,从环境准备到 Docker Compose 部署,再到中文 OCR 配置和企业环境使用规划,每一步都写得明明白白。哪怕你是刚玩 NAS 的新手,跟着做也能搞定。要是你也想告别 “翻文件” 的麻烦,用私有化部署实现无纸化管理,咱这篇教程能帮你少走不少弯路~
项目简介
Paperless-ngx 是一款功能强大的开源无纸化文档管理系统,能够将纸质文件转化为可搜索的在线归档库,实现数字化管理与“少纸化办公”。
该项目是 Paperless 与 Paperless-ng 的官方继任者,由社区团队共同维护和发展,旨在为个人与团队提供一个可靠、安全且易于扩展的文档存储与检索平台。
演示地址:demo.paperless-ngx.com(账号密码:demo/demo,演示数据会定期重置,请勿上传敏感文件)。
功能特色
-
文档归档:扫描、上传并集中管理各类文档,支持自动分类和标签。
-
全文检索:内置 OCR 技术,快速搜索 PDF、图片扫描件中的文字。
-
智能标签:根据内容自动识别并添加标签,方便后期整理。
-
多用户支持:适用于家庭、团队与企业环境。
-
多语言界面:通过 Crowdin 协作,支持多国语言翻译。
-
生态兼容:与多种扫描仪、文件存储系统和第三方应用兼容。
-
支持批量编辑作,设置标签、对应者等以及权限。
-
并排编辑文档
-
支持移动设备
完整功能与截图可查阅官方文档: docs.paperless-ngx.com。
注意事项
由于 Paperless-ngx 常用于存储敏感文件(如税务资料、合同、发票等),官方建议:
-
默认不提供加密存储,需自行把控安全;
-
推荐在本地服务器或 NAS 上运行,并定期做好备份;
-
部署时结合反向代理与 WAF(如 Nginx Proxy Manager、雷池等)加强安全防护。
教程优点
-
整合中文语言包,安装后即为中文界面。
-
整合 Excel 和 Email 文件格式插件,部署后无需额外配置。
-
操作简化,一个教程即可满足企业级使用场景。
部署教程
以下以 群晖 NAS 系统 为例(其他系统需提前安装最新版本 Docker 和 Docker Compose)。
1. 连接 NAS
-
打开群晖的 SSH 功能,使用终端软件连接并切换到 root 状态。
-
打开群晖
docker
文件夹 → 右键 → 属性 → 常规 → 复制文件夹位置路径。 -
在终端进入该路径,作为容器数据存储目录。
2. 创建项目文件夹
mkdir -p paperless-ngx/{redisdata,pgdata,data,media,export,consume}
目录结构说明:
/项目部署路径/paperless-ngx/ ← Paperless-ngx 项目根目录
├── redisdata/ ← Redis 数据持久化目录
├── pgdata/ ← PostgreSQL 数据库文件目录
├── data/ ← Paperless 系统运行数据(索引、缓存等)
├── media/ ← 存放已上传的文档文件
├── export/ ← 文档导出目录(从系统导出文件会保存到这里)
└── consume/ ← 自动导入目录(放入文件会被系统自动导入并解析)
进入项目文件夹:
cd paperless-ngx
3. 编辑 docker-compose.yml
vi docker-compose.yml
内容示例:
按字母i
键进入编辑模式,复制并修改下面的配置文件,粘贴到终端,按Esc
键退出编辑模式,输入:wq
保存并退出。
(排版太挤的就先粘贴到文本文件内,修改后再使用,灵活应变。)
- 感谢你赐予我前进的力量