Package Information
Available Nodes
Documentation
n8n-nodes-MaibaoAPI(V1.1.0 版本)
🚀 告别见鬼的 HTTP Request 节点! 在 n8n 中像原生节点一样傻瓜式调用 MaibaoAPI 中的模型。
🌟 为什么开发这个节点?
还在为配置那个该死的 HTTP Request 节点抓耳挠腮吗?还在手动拼接复杂的 JSON 或者在 Code 节点里苦哈哈地写 Base64 转换函数吗?(说的就是我自己)
为了无痛调用麦包平台(https://api.maibao.chat)上的各种AI大模型,本项目诞生了!
作者本人完全没有代码基础,全靠 Gemini和Claude 鼎力赞助完成,这个节点(对我来说)很好用!
✨ 核心亮点
傻瓜式配置:摆脱复杂的 API 参数构造,配置简单选项即可开用。
自动图像处理:彻底解决 Base64 转换痛点。直接读取
Binary选项卡中的图片,生成结果也直接返回图片。五模式支持:同时支持"文字生成"、"图片生成"、"视频生成"、"向量嵌入"、"音频转文本"五种模式。
跨节点 Binary 读取:支持从指定的其他节点读取 Binary 图片数据,无需手动传递。
🛠️ 功能详解
1. 文字生成模式
模型自定义:支持手动指定模型 ID(例如
gemini-3.1-pro-preview、gemini-3-flash等)。双模态支持:支持发送 文字 + 图片 的组合。
自动 Base64:节点会自动识别并转换 Binary 中的图片文件,最高支持 3 张图片同时输入。再也不用手动加代码节点去做转换了!
文档附件: 配合 Extract from File 节点使用。Extract from File 节点会提取 pdf 等文件中的文字内容,以 text 字段输出,本节点则会自动抓取上一节点输出的 text 字段内容,并自动与用户提示词进行拼接,实现将提示词+文档内容一并传输给 AI。
2. 图片生成模式
极简输入输出:输入是 Binary 图片,输出也是 Binary 图片,节点内自动完成图片转 base64、单图与多图处理逻辑切换、base64 转图片。
多样化创作:
文生图:输入 Prompt 直接生成。
图生图:支持"文 + 单图"或"文 + 多图"生图(参考图上限为 3 张)。
简单参数:下拉框选择设置 分辨率、尺寸比例。
生图模型:当前支持以下模型:
模型名称 模型 ID 分辨率参数 尺寸比例参数 Gemini-3.1-Flash-Image gemini-3.1-flash-image-preview❌ 不需要 ✅ 支持 (13种比例,含1:4/4:1/1:8/8:1) Gemini-3-Pro-Image gemini-3-pro-image-preview✅ 支持 (1K/2K/4K) ✅ 支持 (9种比例) 即梦 5.0 doubao-seedream-5-0-260128✅ 支持 (2K/3K) ❌ 不支持
3. 视频生成模式 (Sora 2)
基本完美适配了 Sora 2 的异步生成链路:
五大核心操作:
创建视频:支持
Sora 2与Sora 2 Pro。混编视频:基于已有视频 ID 进行二次创作。
检索视频:获取生成进度与状态。
下载视频:获取最终的 MP4 二进制文件。
历史列表:查询历史视频任务。
故事板模式:
开启后,你可以分镜头(Shot 1, Shot 2...)填写内容。节点会自动帮你组合成复杂的、符合 API 要求的格式,实现分镜级的视频控制!
智能轮询等待:
检索视频时,节点会自动每 15 秒查一次生成进度,最长持续查询 10 分钟。查询到视频生成完毕后,节点才运行成功。
4. 向量嵌入模式 (Embeddings)
支持将文本转换为向量嵌入,适用于语义搜索、文本相似度计算、RAG 应用等场景:
模型选择:支持
text-embedding-3-large(默认)和text-embedding-3-small两种模型。简单易用:只需输入文本,即可获取对应的向量嵌入数据。
灵活输入:支持表达式,可从上游节点动态获取待嵌入的文本内容。
5. 音频转文本模式 (Whisper)
使用 Whisper-1 模型将音频文件转写为文本,完美适配抖音等平台视频的音频转录场景:
模型固定:使用
whisper-1模型,无需手动配置。多格式支持:支持 9 种音频格式:
flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav、webm。智能语言识别:
自动识别:默认自动检测音频语言(推荐)。
手动指定:可选择中文或英语,提高准确性和速度。
双输出格式:
带时间戳的 JSON 格式:包含完整转写文本、分段信息、时间戳、音频时长等详细数据。
纯文本格式:仅返回转写的文本内容,适合直接传递给下游节点。
自动音频处理:节点会自动从 Binary 中读取音频文件,支持从当前节点或指定节点读取。
典型使用场景:
抖音/快手视频音频转文字
会议录音转文字
语音消息转文字
播客/音频内容转录
输出示例(带时间戳格式):
{
"text": "大家好,今天我要分享一个关于人工智能的话题...",
"duration": 125.5,
"language": "chinese",
"words": [
{
"word": "大家好",
"start": 0.0,
"end": 0.5
},
{
"word": "今天",
"start": 0.6,
"end": 1.0
},
{
"word": "我",
"start": 1.1,
"end": 1.3
},
{
"word": "要",
"start": 1.4,
"end": 1.6
},
{
"word": "分享",
"start": 1.7,
"end": 2.2
}
]
}
注意:带时间戳的 JSON 格式使用词级别(word)时间戳,输出更简洁精确。每个词包含
word(词语)、start(开始时间)、end(结束时间)三个字段。
使用提示:
音频属性名默认为:
data, data0, video, video0, audio, audio0,一般无需修改。转写结果可直接传递给 AI 节点进行内容分析、摘要生成等后续处理。
支持实时处理,无需等待异步任务完成。
🆕 版本更新记录
v1.1.0 (2026-03-08)
- 新增功能:音频转文本模式 (Whisper-1)
- 支持 9 种音频格式:flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm
- 支持自动语言识别和中英文手动选择
- 支持两种输出格式:带时间戳的 JSON 格式 / 纯文本格式
- 完整的错误处理和格式验证
- 适配抖音等平台视频音频转录场景
- 功能优化:Binary 来源模式现在支持音频文件读取
v1.0.0 (2026-03-06)
- 初始版本:从 DeerAPI 迁移到 MaibaoAPI
- 模型升级:
- 文字生成默认模型:
gemini-3.1-pro-preview - 图像生成模型:
Gemini-3.1-Flash-Image(gemini-3.1-flash-image-preview) - 支持13种尺寸比例Gemini-3-Pro-Image(gemini-3-pro-image-preview) - 支持9种尺寸比例即梦 5.0(doubao-seedream-5-0-260128) - 支持2K/3K分辨率
- 文字生成默认模型:
- API 端点更新:Base URL 更新为
https://api.maibao.chat/v1 - 功能保持:所有原有功能完全保留(文字生成、图像生成、视频生成、向量嵌入)
📦 安装方法
在你的 n8n 根目录下运行:
npm install n8n-nodes-maibaoapi
或者在 n8n 设定页面的 Community Nodes 中搜索 n8n-nodes-MaibaoAPI 进行安装。
(个人推荐下面这种方法,因为安装方法是 Gemini 自己脑补写的,虽然看起来是对的,但我没用过命令行安装的方式)
🛞 使用流程
添加凭证: 在 n8n 凭证管理页面创建凭证,凭证搜索"MaibaoAPI"。凭证只需要填入从 MaibaoAPI 后台获取的 API Key 就行了,Base URL 不要改。
添加节点: 在工作流中添加节点时,可搜索"MaibaoAPI",即可找到本节点(找不到是因为你还没安装本社区节点)
节点配置: 选择凭证 → 选择模式(文本生成/图像生成/视频生成/向量嵌入/音频转文本)→ 填好其它两三个参数(模型 ID、提示词等)→ OJ8K 完事!
说明: "图片属性名"/"音频属性名"这个参数,默认已经填写了常用的属性名,一般情况下不需要修改。节点会自动检测这些属性名中哪些有对应的文件。因为 n8n 工作流 Binary 选项卡中的文件属性名一般默认就是 data, data0 之类的。当然,如果你的文件属性名不一样,这里就需要你自己填了。
v1.5.6 新增: "Binary 来源模式"参数允许你从指定的其他节点读取 Binary 数据(图片、音频等)。选择"指定节点"模式后,在"指定节点名称"中填入节点名称(多个节点用逗号分隔),节点会自动从这些节点收集 Binary 数据。
⚠️ 免责声明 & 致谢
关于代码:本项目所有核心代码均由 Gemini和Claude 编写。作者本人不保证代码的完美性,如有 Bug 纯属正常(毕竟是 AI 写的)。
功能限制:目前功能相对有限,大家凑合用吧。我也会一边用一边根据自己的需求进行功能迭代。
开发者寄语:寄语个 G8,让 Gemini 写个 README 文档,叽叽歪歪净扯没用的。
顺便交点朋友: 本人专注于研究电商领域的 AI 技术应用,电商干了 13 年,AI 搞了3年了。微信号:maosonghuai
如果你觉得这个项目帮到了你,请给个 Star 🌟,这也是对 Gemini 最大的鼓励!
(反之,如果你觉得没帮到,请骂 Gemini)
