Package Information
Released: 7/1/2025
Downloads: 179 weekly / 760 monthly
Latest Version: 0.1.0
Author: qixyuanmeng
Available Nodes
Documentation
n8n-nodes-readdoc
这是一个用于读取doc/docx文档内容的n8n社区节点。
功能特性
- 支持读取 .doc 和 .docx 文件
- 多种输出格式:纯文本、HTML、Markdown
- 提取文档元数据(字数统计、字符数等)
- 保持原始二进制数据(可选)
- 错误处理和继续执行选项
安装
# 在你的n8n实例中安装
npm install n8n-nodes-readdoc
使用方法
- 将包含doc/docx文件的二进制数据传递给节点
- 选择输出格式(纯文本、HTML或Markdown)
- 配置其他选项(如是否包含样式信息)
- 节点将输出提取的文档内容和元数据
输入数据格式
节点需要包含二进制数据的输入,二进制数据应该是doc或docx文件。
输出数据格式
{
"content": "提取的文档内容",
"fileName": "document.docx",
"fileType": "docx",
"format": "text",
"metadata": {},
"wordCount": 150,
"characterCount": 1200
}
支持的文件格式
.doc- Microsoft Word 97-2003文档.docx- Microsoft Word 2007+文档
开发
本项目使用TypeScript开发,基于n8n节点开发框架。
构建
pnpm run build
开发模式
pnpm run dev
代码格式化
pnpm run format
代码检查
pnpm run lint
依赖
mammoth- 用于处理.docx文件textract- 用于处理.doc文件
许可证
MIT
贡献
欢迎提交Pull Request和Issue!