mopdf

n8n community node for PDF processing - convert PDF to images, extract text and run OCR

Package Information

Downloads: 731 weekly / 974 monthly
Latest Version: 0.2.7
Author: Kayjix

Documentation

n8n-nodes-mopdf

MoPDF ist eine n8n Community Node für PDF Verarbeitung.

Features

  • 📄 PDF zu Bilder konvertieren (PNG/JPEG)
  • 📝 Text aus PDF extrahieren
  • 🔍 OCR Texterkennung via Tesseract

Installation

In n8n unter Settings → Community Nodes:
n8n-nodes-mopdf

Operations

PDF zu Bilder

Konvertiert jede PDF Seite in ein Bild.

  • DPI einstellbar (Standard: 200)
  • Format: PNG oder JPEG
  • Seitenauswahl möglich

Text Extrahieren

Extrahiert Text direkt aus der PDF ohne OCR.

  • Pro Seite oder kombiniert
  • Metadaten einschließbar

OCR

Texterkennung auf Bildern.

  • Sprachen: Deutsch, Englisch und mehr
  • Konfidenz Score
  • Wörter und Zeilen mit Koordinaten

Licenses

This package depends on the following third-party libraries. By using this package, you are also subject to their respective licenses.

  • [MuPDF] (AGPL v3)
  • [Tesseract.js] (Apache 2.0)

Discussion