maibaoapi

便捷调用 MaibaoAPI 进行文字、图像、Sora 2 视频生成、音频转文本及向量嵌入

Package Information

Downloads: 0 weekly / 0 monthly
Latest Version: 1.1.1
Author: 毛淞淮

Documentation

n8n-nodes-MaibaoAPI(V1.1.0 版本)

🚀 告别见鬼的 HTTP Request 节点! 在 n8n 中像原生节点一样傻瓜式调用 MaibaoAPI 中的模型。


🌟 为什么开发这个节点?

还在为配置那个该死的 HTTP Request 节点抓耳挠腮吗?还在手动拼接复杂的 JSON 或者在 Code 节点里苦哈哈地写 Base64 转换函数吗?(说的就是我自己)

为了无痛调用麦包平台(https://api.maibao.chat)上的各种AI大模型,本项目诞生了!

作者本人完全没有代码基础,全靠 Gemini和Claude 鼎力赞助完成,这个节点(对我来说)很好用!

✨ 核心亮点

  • 傻瓜式配置:摆脱复杂的 API 参数构造,配置简单选项即可开用。

  • 自动图像处理:彻底解决 Base64 转换痛点。直接读取 Binary 选项卡中的图片,生成结果也直接返回图片。

  • 五模式支持:同时支持"文字生成"、"图片生成"、"视频生成"、"向量嵌入"、"音频转文本"五种模式。

  • 跨节点 Binary 读取:支持从指定的其他节点读取 Binary 图片数据,无需手动传递。


🛠️ 功能详解

1. 文字生成模式

  • 模型自定义:支持手动指定模型 ID(例如 gemini-3.1-pro-previewgemini-3-flash 等)。

  • 双模态支持:支持发送 文字 + 图片 的组合。

  • 自动 Base64:节点会自动识别并转换 Binary 中的图片文件,最高支持 3 张图片同时输入。再也不用手动加代码节点去做转换了!

  • 文档附件: 配合 Extract from File 节点使用。Extract from File 节点会提取 pdf 等文件中的文字内容,以 text 字段输出,本节点则会自动抓取上一节点输出的 text 字段内容,并自动与用户提示词进行拼接,实现将提示词+文档内容一并传输给 AI。

2. 图片生成模式

  • 极简输入输出:输入是 Binary 图片,输出也是 Binary 图片,节点内自动完成图片转 base64、单图与多图处理逻辑切换、base64 转图片。

  • 多样化创作

    • 文生图:输入 Prompt 直接生成。

    • 图生图:支持"文 + 单图"或"文 + 多图"生图(参考图上限为 3 张)。

  • 简单参数:下拉框选择设置 分辨率尺寸比例

  • 生图模型:当前支持以下模型:

    模型名称 模型 ID 分辨率参数 尺寸比例参数
    Gemini-3.1-Flash-Image gemini-3.1-flash-image-preview ❌ 不需要 ✅ 支持 (13种比例,含1:4/4:1/1:8/8:1)
    Gemini-3-Pro-Image gemini-3-pro-image-preview ✅ 支持 (1K/2K/4K) ✅ 支持 (9种比例)
    即梦 5.0 doubao-seedream-5-0-260128 ✅ 支持 (2K/3K) ❌ 不支持

3. 视频生成模式 (Sora 2)

基本完美适配了 Sora 2 的异步生成链路:

  • 五大核心操作

    • 创建视频:支持 Sora 2Sora 2 Pro

    • 混编视频:基于已有视频 ID 进行二次创作。

    • 检索视频:获取生成进度与状态。

    • 下载视频:获取最终的 MP4 二进制文件。

    • 历史列表:查询历史视频任务。

  • 故事板模式:

    开启后,你可以分镜头(Shot 1, Shot 2...)填写内容。节点会自动帮你组合成复杂的、符合 API 要求的格式,实现分镜级的视频控制!

  • 智能轮询等待:

    检索视频时,节点会自动每 15 秒查一次生成进度,最长持续查询 10 分钟。查询到视频生成完毕后,节点才运行成功。

4. 向量嵌入模式 (Embeddings)

支持将文本转换为向量嵌入,适用于语义搜索、文本相似度计算、RAG 应用等场景:

  • 模型选择:支持 text-embedding-3-large(默认)和 text-embedding-3-small 两种模型。

  • 简单易用:只需输入文本,即可获取对应的向量嵌入数据。

  • 灵活输入:支持表达式,可从上游节点动态获取待嵌入的文本内容。

5. 音频转文本模式 (Whisper)

使用 Whisper-1 模型将音频文件转写为文本,完美适配抖音等平台视频的音频转录场景:

  • 模型固定:使用 whisper-1 模型,无需手动配置。

  • 多格式支持:支持 9 种音频格式:flacmp3mp4mpegmpgam4aoggwavwebm

  • 智能语言识别

    • 自动识别:默认自动检测音频语言(推荐)。

    • 手动指定:可选择中文或英语,提高准确性和速度。

  • 双输出格式

    • 带时间戳的 JSON 格式:包含完整转写文本、分段信息、时间戳、音频时长等详细数据。

    • 纯文本格式:仅返回转写的文本内容,适合直接传递给下游节点。

  • 自动音频处理:节点会自动从 Binary 中读取音频文件,支持从当前节点或指定节点读取。

  • 典型使用场景

    • 抖音/快手视频音频转文字

    • 会议录音转文字

    • 语音消息转文字

    • 播客/音频内容转录

输出示例(带时间戳格式)

{
  "text": "大家好,今天我要分享一个关于人工智能的话题...",
  "duration": 125.5,
  "language": "chinese",
  "words": [
    {
      "word": "大家好",
      "start": 0.0,
      "end": 0.5
    },
    {
      "word": "今天",
      "start": 0.6,
      "end": 1.0
    },
    {
      "word": "我",
      "start": 1.1,
      "end": 1.3
    },
    {
      "word": "要",
      "start": 1.4,
      "end": 1.6
    },
    {
      "word": "分享",
      "start": 1.7,
      "end": 2.2
    }
  ]
}

注意:带时间戳的 JSON 格式使用词级别(word)时间戳,输出更简洁精确。每个词包含 word(词语)、start(开始时间)、end(结束时间)三个字段。

使用提示

  • 音频属性名默认为:data, data0, video, video0, audio, audio0,一般无需修改。

  • 转写结果可直接传递给 AI 节点进行内容分析、摘要生成等后续处理。

  • 支持实时处理,无需等待异步任务完成。


🆕 版本更新记录

v1.1.0 (2026-03-08)

  • 新增功能:音频转文本模式 (Whisper-1)
    • 支持 9 种音频格式:flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm
    • 支持自动语言识别和中英文手动选择
    • 支持两种输出格式:带时间戳的 JSON 格式 / 纯文本格式
    • 完整的错误处理和格式验证
    • 适配抖音等平台视频音频转录场景
  • 功能优化:Binary 来源模式现在支持音频文件读取

v1.0.0 (2026-03-06)

  • 初始版本:从 DeerAPI 迁移到 MaibaoAPI
  • 模型升级
    • 文字生成默认模型:gemini-3.1-pro-preview
    • 图像生成模型:
      • Gemini-3.1-Flash-Image (gemini-3.1-flash-image-preview) - 支持13种尺寸比例
      • Gemini-3-Pro-Image (gemini-3-pro-image-preview) - 支持9种尺寸比例
      • 即梦 5.0 (doubao-seedream-5-0-260128) - 支持2K/3K分辨率
  • API 端点更新:Base URL 更新为 https://api.maibao.chat/v1
  • 功能保持:所有原有功能完全保留(文字生成、图像生成、视频生成、向量嵌入)

📦 安装方法

在你的 n8n 根目录下运行:

npm install n8n-nodes-maibaoapi

或者在 n8n 设定页面的 Community Nodes 中搜索 n8n-nodes-MaibaoAPI 进行安装。

(个人推荐下面这种方法,因为安装方法是 Gemini 自己脑补写的,虽然看起来是对的,但我没用过命令行安装的方式)


🛞 使用流程

  1. 添加凭证: 在 n8n 凭证管理页面创建凭证,凭证搜索"MaibaoAPI"。凭证只需要填入从 MaibaoAPI 后台获取的 API Key 就行了,Base URL 不要改

  2. 添加节点: 在工作流中添加节点时,可搜索"MaibaoAPI",即可找到本节点(找不到是因为你还没安装本社区节点)

  3. 节点配置: 选择凭证 → 选择模式(文本生成/图像生成/视频生成/向量嵌入/音频转文本)→ 填好其它两三个参数(模型 ID、提示词等)→ OJ8K 完事!

说明: "图片属性名"/"音频属性名"这个参数,默认已经填写了常用的属性名,一般情况下不需要修改。节点会自动检测这些属性名中哪些有对应的文件。因为 n8n 工作流 Binary 选项卡中的文件属性名一般默认就是 data, data0 之类的。当然,如果你的文件属性名不一样,这里就需要你自己填了。

v1.5.6 新增: "Binary 来源模式"参数允许你从指定的其他节点读取 Binary 数据(图片、音频等)。选择"指定节点"模式后,在"指定节点名称"中填入节点名称(多个节点用逗号分隔),节点会自动从这些节点收集 Binary 数据。


⚠️ 免责声明 & 致谢

  1. 关于代码:本项目所有核心代码均由 Gemini和Claude 编写。作者本人不保证代码的完美性,如有 Bug 纯属正常(毕竟是 AI 写的)。

  2. 功能限制:目前功能相对有限,大家凑合用吧。我也会一边用一边根据自己的需求进行功能迭代。

  3. 开发者寄语:寄语个 G8,让 Gemini 写个 README 文档,叽叽歪歪净扯没用的。

  4. 顺便交点朋友: 本人专注于研究电商领域的 AI 技术应用,电商干了 13 年,AI 搞了3年了。微信号:maosonghuai


如果你觉得这个项目帮到了你,请给个 Star 🌟,这也是对 Gemini 最大的鼓励!

(反之,如果你觉得没帮到,请骂 Gemini)

Discussion