为您的完整文档和图像流水线提供一个 n8n 节点
Source: Dev.to
(请提供您希望翻译的具体文本内容,我将为您翻译成简体中文。)
三服务管道问题
您需要在 n8n 工作流中处理发票。通常您会这样串接:
- Mistral OCR – 提取文本
- GPT‑4o – 将其结构化为 JSON
- Google Sheets – 存储结果
这涉及三个服务、三套凭证和三个计费账户。OCR 按页计费,LLM 按 token 计费,每次运行都会消耗两者的额度。
如果有人随后要求您根据提取的数据生成 PDF 摘要,您就会再加入第四个服务(例如 PDF.co、HTML‑to‑PDF 节点,或调用 Puppeteer 的 Function 节点)。每种选项都有各自的怪癖、认证方式和失败模式。
结果就是一堆 HTTP Request 节点、用于格式转换的 Function 节点以及 base64 编码/解码的粘合代码。大多数 n8n 文档工作流都是这样形成的——并不是因为方法错误,而是因为没有单一工具能够覆盖完整的管道。提取需要一个供应商,转换需要另一个,生成又需要第三个。
迭代层社区节点
The Iteration Layer n8n 社区节点将提取、转换和生成合并为一次安装。
- 从下拉菜单中选择资源:
- 文档提取
- 图像转换
- 图像生成
- 文档生成
- 表格生成
- 文档转 Markdown
- 填写参数。
- 节点会自动处理身份验证、二进制数据和响应解析。
实际影响:
以前需要三个独立服务和五个 n8n 节点的流水线可以缩减为 两个 Iteration Layer 节点 串联使用。二进制数据在它们之间原生流动——无需 Function 节点来解码 base64,也不需要格式转换的胶水。只需一个 API 密钥、一个信用池,并且每个资源的输出都设计为直接供下一个使用。
安装
从 n8n UI
- 打开 Settings > Community Nodes。
- 点击 Install a community node,输入
n8n-nodes-iterationlayer,然后安装。
自托管 n8n
cd ~/.n8n
npm install n8n-nodes-iterationlayer
安装完成后,重启 n8n。然后:
- 前往 Credentials > New Credential。
- 搜索 Iteration Layer API 并输入您的 API 密钥。
获取免费试用密钥(无需信用卡)。
示例流水线
文档提取 → 文档生成
| 节点 | 资源 | 关键设置 |
|---|---|---|
| Node 1 | Document Extraction | • 输入:发票 PDF(电子邮件触发、文件上传或 URL) • 定义提取模式(发票号、供应商名称、明细项目、总额) |
| Node 2 | Document Generation | • 输出格式:PDF • 使用提取的数据通过 n8n 表达式构建文档定义 |
提取节点返回带有置信度分数的结构化 JSON;生成节点消费该 JSON 并输出二进制 PDF 数据,可直接用于发送邮件、上传至 Google Drive 或写入 S3。
图像转换 → 图像生成
| 节点 | 资源 | 关键设置 |
|---|---|---|
| Node 1 | Image Transformation | • 输入:来自触发器或文件节点的图像 • 操作:调整大小至 1200×1200、智能裁剪、锐化、转换为 WebP |
| Node 2 | Image Generation | • 画布:将处理后的图像作为图层 • 添加文字图层(产品名称、价格) • 输出格式:PNG |
第一个节点的二进制输出直接插入第二个节点,无需任何转换步骤。
其他常见组合
- Document to Markdown → Document Extraction – 将复杂的 PDF 转换为干净的 Markdown,然后提取结构化数据。
- Document Extraction → Sheet Generation – 从一批发票中提取数据并生成格式化的 Excel 报表。
- Image Transformation → Document Generation – 处理产品照片并将它们编入 PDF 目录。
每个资源都接受来自前置节点的二进制数据或 URL,产生文件的资源会输出 n8n 二进制数据。输出可以直接链入下游节点(S3、Google Drive、Slack、邮件),无需中间步骤。
为什么使用迭代层?
- 单一集成 替代多个 HTTP 请求和函数节点。
- 统一计费 – 一个 API 密钥,一个信用池。
- 确定性、基于模式的抽取,附带置信度分数、引用和来源参考——无需每个 token 的 LLM 不确定性。
- 一体化 UI – 在无需编写 JSON 的情况下,配置多达 24 种图像操作、文档模板和表格布局。
如果您目前正在为抽取、转换或生成而串联多个服务,Iteration Layer 社区节点将它们整合为一次集成,让您更快构建稳健的文档和图像流水线。