maibaoapi

便捷调用 MaibaoAPI 进行文字、图像、Sora 2 视频生成、音频转文本及向量嵌入

Package Information

Downloads: 0 weekly / 0 monthly

Latest Version: 1.1.1

Author: 毛淞淮

Available Nodes

MaibaoAPI

调用 MaibaoAPI 进行文字、图像、Sora 2 视频生成及向量嵌入

Documentation

n8n-nodes-MaibaoAPI（V1.1.0 版本）

🚀 告别见鬼的 HTTP Request 节点！ 在 n8n 中像原生节点一样傻瓜式调用 MaibaoAPI 中的模型。

🌟 为什么开发这个节点？

还在为配置那个该死的 HTTP Request 节点抓耳挠腮吗？还在手动拼接复杂的 JSON 或者在 Code 节点里苦哈哈地写 Base64 转换函数吗？（说的就是我自己）

为了无痛调用麦包平台（https://api.maibao.chat）上的各种AI大模型，本项目诞生了！

作者本人完全没有代码基础，全靠 Gemini和Claude 鼎力赞助完成，这个节点（对我来说）很好用！

✨ 核心亮点

傻瓜式配置：摆脱复杂的 API 参数构造，配置简单选项即可开用。
自动图像处理：彻底解决 Base64 转换痛点。直接读取 Binary 选项卡中的图片，生成结果也直接返回图片。
五模式支持：同时支持"文字生成"、"图片生成"、"视频生成"、"向量嵌入"、"音频转文本"五种模式。
跨节点 Binary 读取：支持从指定的其他节点读取 Binary 图片数据，无需手动传递。

🛠️ 功能详解

1. 文字生成模式

模型自定义：支持手动指定模型 ID（例如 gemini-3.1-pro-preview、gemini-3-flash 等）。
双模态支持：支持发送 文字 + 图片 的组合。
自动 Base64：节点会自动识别并转换 Binary 中的图片文件，最高支持 3 张图片同时输入。再也不用手动加代码节点去做转换了！
文档附件： 配合 Extract from File 节点使用。Extract from File 节点会提取 pdf 等文件中的文字内容，以 text 字段输出，本节点则会自动抓取上一节点输出的 text 字段内容，并自动与用户提示词进行拼接，实现将提示词+文档内容一并传输给 AI。

2. 图片生成模式

极简输入输出：输入是 Binary 图片，输出也是 Binary 图片，节点内自动完成图片转 base64、单图与多图处理逻辑切换、base64 转图片。
多样化创作：
- 文生图：输入 Prompt 直接生成。
- 图生图：支持"文 + 单图"或"文 + 多图"生图（参考图上限为 3 张）。
简单参数：下拉框选择设置 分辨率、尺寸比例。

生图模型：当前支持以下模型：

模型名称	模型 ID	分辨率参数	尺寸比例参数
Gemini-3.1-Flash-Image	`gemini-3.1-flash-image-preview`	❌ 不需要	✅ 支持 (13种比例，含1:4/4:1/1:8/8:1)
Gemini-3-Pro-Image	`gemini-3-pro-image-preview`	✅ 支持 (1K/2K/4K)	✅ 支持 (9种比例)
即梦 5.0	`doubao-seedream-5-0-260128`	✅ 支持 (2K/3K)	❌ 不支持

3. 视频生成模式 (Sora 2)

基本完美适配了 Sora 2 的异步生成链路：

五大核心操作：
- 创建视频：支持 Sora 2 与 Sora 2 Pro。
- 混编视频：基于已有视频 ID 进行二次创作。
- 检索视频：获取生成进度与状态。
- 下载视频：获取最终的 MP4 二进制文件。
- 历史列表：查询历史视频任务。
故事板模式：

开启后，你可以分镜头（Shot 1, Shot 2...）填写内容。节点会自动帮你组合成复杂的、符合 API 要求的格式，实现分镜级的视频控制！
智能轮询等待：

检索视频时，节点会自动每 15 秒查一次生成进度，最长持续查询 10 分钟。查询到视频生成完毕后，节点才运行成功。

4. 向量嵌入模式 (Embeddings)

支持将文本转换为向量嵌入，适用于语义搜索、文本相似度计算、RAG 应用等场景：

模型选择：支持 text-embedding-3-large（默认）和 text-embedding-3-small 两种模型。
简单易用：只需输入文本，即可获取对应的向量嵌入数据。
灵活输入：支持表达式，可从上游节点动态获取待嵌入的文本内容。

5. 音频转文本模式 (Whisper)

使用 Whisper-1 模型将音频文件转写为文本，完美适配抖音等平台视频的音频转录场景：

模型固定：使用 whisper-1 模型，无需手动配置。
多格式支持：支持 9 种音频格式：flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav、webm。
智能语言识别：
- 自动识别：默认自动检测音频语言（推荐）。
- 手动指定：可选择中文或英语，提高准确性和速度。
双输出格式：
- 带时间戳的 JSON 格式：包含完整转写文本、分段信息、时间戳、音频时长等详细数据。
- 纯文本格式：仅返回转写的文本内容，适合直接传递给下游节点。
自动音频处理：节点会自动从 Binary 中读取音频文件，支持从当前节点或指定节点读取。
典型使用场景：
- 抖音/快手视频音频转文字
- 会议录音转文字
- 语音消息转文字
- 播客/音频内容转录

输出示例（带时间戳格式）：

{
  "text": "大家好，今天我要分享一个关于人工智能的话题...",
  "duration": 125.5,
  "language": "chinese",
  "words": [
    {
      "word": "大家好",
      "start": 0.0,
      "end": 0.5
    },
    {
      "word": "今天",
      "start": 0.6,
      "end": 1.0
    },
    {
      "word": "我",
      "start": 1.1,
      "end": 1.3
    },
    {
      "word": "要",
      "start": 1.4,
      "end": 1.6
    },
    {
      "word": "分享",
      "start": 1.7,
      "end": 2.2
    }
  ]
}

注意：带时间戳的 JSON 格式使用词级别（word）时间戳，输出更简洁精确。每个词包含 word（词语）、start（开始时间）、end（结束时间）三个字段。

使用提示：

音频属性名默认为：data, data0, video, video0, audio, audio0，一般无需修改。
转写结果可直接传递给 AI 节点进行内容分析、摘要生成等后续处理。
支持实时处理，无需等待异步任务完成。

🆕 版本更新记录

v1.1.0 (2026-03-08)

新增功能：音频转文本模式 (Whisper-1)
- 支持 9 种音频格式：flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm
- 支持自动语言识别和中英文手动选择
- 支持两种输出格式：带时间戳的 JSON 格式 / 纯文本格式
- 完整的错误处理和格式验证
- 适配抖音等平台视频音频转录场景
功能优化：Binary 来源模式现在支持音频文件读取

v1.0.0 (2026-03-06)

初始版本：从 DeerAPI 迁移到 MaibaoAPI
模型升级：
- 文字生成默认模型：gemini-3.1-pro-preview
- 图像生成模型：
  - Gemini-3.1-Flash-Image (gemini-3.1-flash-image-preview) - 支持13种尺寸比例
  - Gemini-3-Pro-Image (gemini-3-pro-image-preview) - 支持9种尺寸比例
  - 即梦 5.0 (doubao-seedream-5-0-260128) - 支持2K/3K分辨率
API 端点更新：Base URL 更新为 https://api.maibao.chat/v1
功能保持：所有原有功能完全保留（文字生成、图像生成、视频生成、向量嵌入）

📦 安装方法

在你的 n8n 根目录下运行：

npm install n8n-nodes-maibaoapi

或者在 n8n 设定页面的 Community Nodes 中搜索 n8n-nodes-MaibaoAPI 进行安装。

（个人推荐下面这种方法，因为安装方法是 Gemini 自己脑补写的，虽然看起来是对的，但我没用过命令行安装的方式）

🛞 使用流程

添加凭证： 在 n8n 凭证管理页面创建凭证，凭证搜索"MaibaoAPI"。凭证只需要填入从 MaibaoAPI 后台获取的 API Key 就行了，Base URL 不要改。
添加节点： 在工作流中添加节点时，可搜索"MaibaoAPI"，即可找到本节点（找不到是因为你还没安装本社区节点）
节点配置： 选择凭证 → 选择模式（文本生成/图像生成/视频生成/向量嵌入/音频转文本）→ 填好其它两三个参数（模型 ID、提示词等）→ OJ8K 完事！

说明： "图片属性名"/"音频属性名"这个参数，默认已经填写了常用的属性名，一般情况下不需要修改。节点会自动检测这些属性名中哪些有对应的文件。因为 n8n 工作流 Binary 选项卡中的文件属性名一般默认就是 data, data0 之类的。当然，如果你的文件属性名不一样，这里就需要你自己填了。

v1.5.6 新增： "Binary 来源模式"参数允许你从指定的其他节点读取 Binary 数据（图片、音频等）。选择"指定节点"模式后，在"指定节点名称"中填入节点名称（多个节点用逗号分隔），节点会自动从这些节点收集 Binary 数据。

⚠️ 免责声明 & 致谢

关于代码：本项目所有核心代码均由 Gemini和Claude 编写。作者本人不保证代码的完美性，如有 Bug 纯属正常（毕竟是 AI 写的）。
功能限制：目前功能相对有限，大家凑合用吧。我也会一边用一边根据自己的需求进行功能迭代。
开发者寄语：寄语个 G8，让 Gemini 写个 README 文档，叽叽歪歪净扯没用的。
顺便交点朋友： 本人专注于研究电商领域的 AI 技术应用，电商干了 13 年，AI 搞了3年了。微信号：maosonghuai

如果你觉得这个项目帮到了你，请给个 Star 🌟，这也是对 Gemini 最大的鼓励！

（反之，如果你觉得没帮到，请骂 Gemini）

maibaoapiInstall