跳到主要内容

PDF 数据提取到表格

模板概览

项目说明
分类📄 文档处理 · 📊 数据处理
集成应用Google Drive、Google Sheets
难度⭐⭐ 中级
创建者n8n 官方团队

工作原理

这个工作流自动监控 Google Drive 指定文件夹中的新 PDF 文件。当新的发票、合同或报表上传时,工作流提取 PDF 中的文字内容,使用正则表达式或 AI 解析出关键结构化数据(发票号、金额、日期、客户名等),然后将这些数据自动追加到 Google Sheets 的指定工作表中。

核心功能

  • 自动监控 — 监听 Google Drive 文件夹中的新 PDF 文件
  • 文字提取 — 从 PDF 中提取全量文字内容
  • 结构化解析 — 识别并提取金额、日期、编号等关键字段
  • 表格写入 — 将提取的数据自动追加到 Google Sheets

工作流节点

Google Drive Trigger (新文件) → Read Binary File (读取 PDF)
→ Extract Document Text (提取文字)
→ Code (解析结构化数据)
→ Google Sheets (写入)

使用步骤

  1. 导入模板 — 在 n8n 中导入此工作流模板
  2. 配置 Google Drive — 授权并选择要监控的 PDF 文件夹
  3. 配置 Google Sheets — 选择或创建目标表格,设置好列标题
  4. 调整解析规则 — 根据你的 PDF 格式修改提取字段和正则
  5. 激活并测试 — 上传一个测试 PDF 验证数据提取准确性

适用场景

  • 🧾 财务发票自动录入
  • 📋 合同关键信息归档
  • 📊 月度报表数据汇总
  • 🏦 银行对账单自动化处理

相关文档


💡 使用要求:需要 n8n 1.0.0 或更高版本

👉 在 n8n 中导入此模板