每次整理家里那堆“纸山”——发票、合同、快递单据,我都头疼不已。上次找装修合同,翻了三个文件袋,折腾半小时才找到,那一刻我心想:要是这些纸能直接“变身”为可搜索的电子版就好了。

后来我终于在 GitHub 上发现了这款神器——Paperless-ngx,足足有 20.2K Star!它可不是简单扫个电子版,用 OCR 识别后,输个 “2024 物业费” 就能秒定位文件;不管是 Word、Excel 还是 PDF,甚至老存档的扫描件,都能贴标签分类,比文件夹层层嵌套清爽太多,像有个随叫随到的私人档案员。

后来我把它部署在了 NAS 上,过程中踩过些小坑,也摸清了所有细节 —— 所以这次整理的图文教程,从环境准备到 Docker Compose 部署,再到中文 OCR 配置和企业环境使用规划,每一步都写得明明白白。哪怕你是刚玩 NAS 的新手,跟着做也能搞定。要是你也想告别 “翻文件” 的麻烦,用私有化部署实现无纸化管理,咱这篇教程能帮你少走不少弯路~

项目简介

Paperless-ngx 是一款功能强大的开源无纸化文档管理系统,能够将纸质文件转化为可搜索的在线归档库,实现数字化管理与“少纸化办公”。

该项目是 Paperless 与 Paperless-ng 的官方继任者,由社区团队共同维护和发展,旨在为个人与团队提供一个可靠、安全且易于扩展的文档存储与检索平台。

演示地址:demo.paperless-ngx.com(账号密码:demo/demo,演示数据会定期重置,请勿上传敏感文件)。

功能特色

  • 文档归档:扫描、上传并集中管理各类文档,支持自动分类和标签。

  • 全文检索:内置 OCR 技术,快速搜索 PDF、图片扫描件中的文字。

  • 智能标签:根据内容自动识别并添加标签,方便后期整理。

  • 多用户支持:适用于家庭、团队与企业环境。

  • 多语言界面:通过 Crowdin 协作,支持多国语言翻译。

  • 生态兼容:与多种扫描仪、文件存储系统和第三方应用兼容。

  • 支持批量编辑作,设置标签、对应者等以及权限。

  • 并排编辑文档

  • 支持移动设备

完整功能与截图可查阅官方文档: docs.paperless-ngx.com

注意事项

由于 Paperless-ngx 常用于存储敏感文件(如税务资料、合同、发票等),官方建议:

  • 默认不提供加密存储,需自行把控安全;

  • 推荐在本地服务器或 NAS 上运行,并定期做好备份;

  • 部署时结合反向代理与 WAF(如 Nginx Proxy Manager、雷池等)加强安全防护。

教程优点

  • 整合中文语言包,安装后即为中文界面。

  • 整合 Excel 和 Email 文件格式插件,部署后无需额外配置。

  • 操作简化,一个教程即可满足企业级使用场景。


部署教程

以下以 群晖 NAS 系统 为例(其他系统需提前安装最新版本 Docker 和 Docker Compose)。

1. 连接 NAS

  • 打开群晖的 SSH 功能,使用终端软件连接并切换到 root 状态。DSM open SSH.png

  • 打开群晖 docker 文件夹 → 右键 → 属性 → 常规 → 复制文件夹位置路径。DSM copy docker.png

  • 在终端进入该路径,作为容器数据存储目录。

2. 创建项目文件夹

mkdir -p paperless-ngx/{redisdata,pgdata,data,media,export,consume}

目录结构说明:

/项目部署路径/paperless-ngx/              ← Paperless-ngx 项目根目录
├── redisdata/   ← Redis 数据持久化目录
├── pgdata/      ← PostgreSQL 数据库文件目录
├── data/        ← Paperless 系统运行数据(索引、缓存等)
├── media/       ← 存放已上传的文档文件
├── export/      ← 文档导出目录(从系统导出文件会保存到这里)
└── consume/     ← 自动导入目录(放入文件会被系统自动导入并解析)

进入项目文件夹:

cd paperless-ngx

3. 编辑 docker-compose.yml

vi docker-compose.yml

内容示例:
按字母i键进入编辑模式,复制并修改下面的配置文件,粘贴到终端,按Esc键退出编辑模式,输入:wq保存并退出。
(排版太挤的就先粘贴到文本文件内,修改后再使用,灵活应变。)