Kategorie: Workflows

Engineering-RAG-Workflow für Elektro- & Maschinenbauprojekte

Live-Wissensdatenbank für Normen, Artikellisten, Kundenanforderungen und Projektdokumente

In modernen Engineering-Projekten (Elektrokonstruktion, Maschinenbau, Automatisierung, Sondermaschinen) arbeiten Teams ständig mit komplexen Vorgabedokumenten, darunter:

Artikel- und Materiallisten
Kundenspezifikationen
Normensammlungen (DIN, ISO, VDE)
Freigabedokumente & Änderungsstände
EPLAN-Auszüge
Risikoanalysen
Lastenhefte und Funktionsbeschreibungen

Diese Informationen müssen versioniert, durchsuchbar, projektbezogen, aktuell und teamweit verfügbar sein.

Hier setzt unser RAG-unterstütztes Engineering-Wissenssystem an.

🧠 Ziel des Systems

Eine projektorientierte, KI-gestützte Live-Wissensdatenbank, die:

Automatisch Dokumente aus Nextcloud einliest
Texte, Tabellen, Normartikel, technische Inhalte extrahiert und strukturiert
OCR für gescannte PDFs nutzt
Alles in eine Postgres/PGVector-Datenbank schreibt
Änderungen in Echtzeit erkennt
Veraltete Daten automatisch löscht
Eine KI-Chatoberfläche (Open-WebUI) benutzt, um Fragen projektbezogen zu beantworten
Inhalte nicht erfindet, sondern nur referenziert
Tabellen per SQL auswertet (z. B. „zeige alle Artikelgrößen“, „max. Stromstärke“ usw.)
Bilder extrahiert, in Supabase lädt und korrekt im Markdown ausgibt

Damit hat das Engineering-Team einen digitalen Projektingenieur, der alle Dokumente kennt, sie durchsucht, interpretiert und vergleicht.

🏗️ Architekturüberblick

Der Workflow besteht aus drei zentralen Bereichen:

1️⃣ Dokument-Ingestion & Synchronisation (Nextcloud → RAG-Datenbank)

🔁 Alle 5 Minuten:

Nextcloud-Ordner scannen
– /Dokumente/n8n/RAG/…
Gegen Postgres vergleichen (ETag + LastModified)
➜ nur neue oder geänderte Dateien werden eingelesen.
Veraltete Einträge entfernen
– aus:
- document_metadata
- document_rows
- documents_pg (Vektorstore)
Neue/aktualisierte Dateien einlesen
- Dateityp bestimmen (PDF, Excel, CSV, DOCX …)
- Tabellen extrahieren (CSV/XLSX)
- Text extrahieren (Default Loader)
- OCR verwenden wenn nötig
  (für gescannte PDFs ➜ Mistral OCR)
Dokument in Chunks splitten + speichern
➜ als Vektoren in documents_pg

Damit wird jede Änderung sofort übernommen.

2️⃣ RAG-KI-Agent (Open-WebUI)

Der Chat läuft über:

Azure OpenAI (DSGVO-konform)
Modelle: gpt-5-mini, gpt-4.1-mini, Embeddings
Postgres Vektorsuche (PGVector)
KI-Gedächtnis über Postgres Chat Memory

Der Agent erhält ein strenges System-Prompt:

✔ Keine Halluzinationen
✔ Immer RAG-Suche -> Dokumente referenzieren
✔ SQL-Abfragen für tabellarische Daten
✔ Markdown-strukturierte Antworten
✔ Anzeigen aller Bilder (automatisch aus Supabase)

Beispielprompt:

„Suche bitte die genaue Normstelle für Kurzschlussfestigkeit aus den hochgeladenen Kundenvorgaben.“

Der Agent durchsucht:

kundenspezifische Vorgaben
Normen (z. B. DIN EN 61439)
technische Anhänge
Excel-Stücklisten
Tabellen zur Strombelastbarkeit
Maschinenrichtlinien-Auszüge

und liefert exakte, belegte Antworten.

3️⃣ Dynamischer Dokument-Parser

(OCR → Bildextraktion → Supabase → Markdown-Rekonstruktion)

Der zweite Workflow:

Hochladen eines PDF/Dokuments zu Mistral API
Generierung einer signierten URL
OCR-Prozess mit:
- Textextraktion
- Erkennung aller Bilder
- Erstellung natürlicher Bildbeschreibungen
Speichern aller Bilder via Supabase
Ersetzen aller inline-Bild-IDs im Markdown
Zurückgeben eines vollständig rekonstruierten Markdown-Dokuments
– mit Bildern
– mit Bildbeschreibungen
– perfekt geeignet für RAG

Beispiel:

![page1_image3](page1_image3)

→ wird ersetzt durch →

![page1_image3](https://supabase.domain/storage/.../892173_page1_image3.png)

Die Abbildung zeigt die Verdrahtung eines Motorschützes mit Überlastschutz…

🛠️ Was wird gespeichert?

1. `document_metadata`

file_id (ETag)
title
url (Nextcloud-Pfad)
last_modified
schema (bei Tabellen)

2. `document_rows`

Jede Tabellenzeile als JSON
Beispiel für Artikeldaten:

{
  "Artikelnummer": "X20392",
  "Bezeichnung": "Sicherungsautomat 10A",
  "Hersteller": "Siemens",
  "Norm": "DIN EN 60898",
  "Strom": "10A"
}

3. `documents_pg` (Vektorstore)

alle Textchunks
inklusive OCR-Texte
inklusive Bildbeschreibungen

⚙️ Use-Cases in Engineering-Projekten

🔌 Elektroplanung / Schaltschrankbau

automatische Ermittlung der richtigen Normstellen
Prüfung ob Komponenten normkonform sind
Zeigen von Artikeln aus einer Liste

⚙️ Maschinenbau / Mechanik

Normanforderungen für Sicherheit (z. B. ISO 12100)
automatisches Auslesen von Lastenheften
OCR lesbarer gescannter Werkstattnotizen
Inhaltliche Zusammenführer unterschiedlicher Revisionen

📑 QM & Dokumentation

zentraler Norm-Wissensspeicher
projektbezogene Vorgabensammlung
automatisches Änderungsmanagement
Rückverfolgbarkeit aller Vorgaben

💡 Engineering-KI | Beispielabfragen

„Welche Artikel sind im Projekt XY freigegeben?“
„Welche Norm fordert den Überstromschutz der 24V-Schiene?“
„Vergleiche die Kundenanforderungen Version 2.1 und 3.0.“
„Welche Motorleistung ist laut Vorgabe zulässig?“
„Liste alle Artikel mit größerem Nennstrom als 16A.“
„Welche Dokumente wurden seit gestern geändert?“

📈 Vorteile für Engineering-Firmen

❤️ Für Konstrukteure

Keine Sucherei in 300 PDFs
Sofort Antworten auf Normfragen
Projektbezogene Wissensbasis — nie wieder alte Dokumentstände

🧠 Für Projektleitung

Versionssicherheit
Vollautomatisches Änderungsmonitoring
Revisionssichere Ablage

⚡ Für die Firma

Weniger Fehler
Schnellere Konstruktion
Saubere, nachvollziehbare Dokumentation
Compliance-sichere Normanwendung

🧩 Technologiestack

Bereich	Lösung
Dateiablage	Nextcloud
OCR	Mistral
KI Modelle	Azure OpenAI (DSGVO)
Datenbank	Supabase Postgres + PGVector
Orchestrierung	n8n
Workspace	Open-WebUI
Embeddings	`text-embedding-3-small`
Reranker	Cohere Reranker
Versionierung	ETag + LastModified Vergleich

🎯 Fazit

Dieser Workflow transformiert deine Engineering-Firma in einen datenbasierten, KI-gestützten High-Performance-Prozess:

✔ alle Kundenvorgaben
✔ alle Normen
✔ alle Artikellisten
✔ alle Freigaben
✔ alle Projektfiles
✔ alle Tabellen
✔ alle Bilder
✔ alle OCR-Inhalte

werden vollautomatisch eingelesen, versioniert, durchsuchbar gemacht, mit KI analysierbar und projektbezogen live aktuell gehalten.

26.11.2025

Automatisierte Terminbuchung auf system-boost.de – n8n, NocoDB & CalDAV
Um meine Beratungsgespräche effizient zu planen, habe ich auf system-boost.de eine komplett automatisierte Terminbuchung umgesetzt.
Dabei kommen ausschließlich Open-Source-Technologien zum Einsatz – vollständig selbst gehostet, DSGVO-konform und perfekt in meine bestehenden Workflows integriert.

Die Lösung verbindet WordPress → n8n → NocoDB → CalDAV zu einem leistungsfähigen Automatisierungsprozess, der Anfragen speichert, Termine automatisch anlegt, interne Benachrichtigungen sendet und freie Zeitslots live auf der Website ausgibt.

Warum ich diese Lösung entwickelt habe

Ich wollte ein Terminbuchungssystem, das:
- keine SaaS-Abhängigkeit hat
- keine Kundendaten an US-Dienste überträgt
- zu 100 % automatisiert arbeitet
- meinen Kalender live prüft und freie Slots anzeigt
- in mein Automatisierungs-Ökosystem (n8n, Self-Hosting, CalDAV) passt
Die bestehenden Lösungen waren entweder überladen, teuer oder nicht ausreichend datenschutzkonform.
Also habe ich eine eigene, schlanke und performante Alternative gebaut.

So funktioniert die Terminbuchung auf system-boost.de

1) WordPress-Formular → n8n (Webhook)

Wenn ein Besucher einen Termin auswählt und das Formular absendet:
- erreicht die Anfrage den n8n Webhook wp-terminbuchung
- der Benutzer wird direkt auf die Danke-Seite weitergeleitet
- alle Daten werden im Hintergrund verarbeitet
2) Speicherung in NocoDB (Lead-Management)

Alle Anfragen werden automatisch in einer NocoDB-Tabelle gespeichert:
- Vorname
- Nachname
- E-Mail
- Firma
- Datum
- Uhrzeit
- Datenschutz-Einwilligung
Damit habe ich eine einfache, saubere und DSGVO-konforme Lead-Verwaltung.

3) Automatische E-Mail-Benachrichtigung

Ich erhalte sofort eine interne E-Mail mit allen Details der Anfrage.
Das erlaubt mir, auch mobile oder unterwegs schnell zu sehen, welcher Termin gebucht wurde.

4) Automatische Kalendererstellung (CalDAV)

Mein self-hosted CalDAV-Kalender erstellt automatisch ein 30-Minuten Meeting:
- Titel: „Erstgespräch mit {Name} ({Firma})“
- Ort: „Online-Meeting“
- Beschreibung: alle Kontaktdaten + Buchungsquelle
- Start-/Endzeit werden zuverlässig per JavaScript berechnet
Damit landet jeder Termin ohne Klick direkt in meinem Kalender.

Die technischen Highlights

🟦 n8n Workflow 1: Buchung entgegennehmen

Nodes:
- Webhook → Redirect
- NocoDB – Create Row
- Email Send
- Code Node (Zeitberechnung)
- CalDAV – createEvent
🟩 n8n Workflow 2: Freie Termin-Slots berechnen

Dieser Workflow liefert die freien Slots live an die Webseite.

Die Slot-API:

GET /webhook/wp-termin-slots?date=YYYY-MM-DD

Der Workflow:
1. liest alle Termine für den angefragten Tag aus meinem CalDAV-Kalender
2. erkennt Überschneidungen
3. berücksichtigt Pufferzeiten
4. generiert 30-Minuten-Slots
5. filtert nur die wirklich freien Zeiten
6. gibt ein sauberes JSON zurück – ideal für die WordPress-Buchungsmaske
Beispiel-Response:
```
{
  "date": "2025-12-04",
  "slots": ["10:00", "10:30", "11:00", ...]
}
```
Arbeitszeit-Logik
- Mo–Fr: 07:00–19:00
- Sa: 10:00–16:00
- So: keine Terminbuchung
- Vor und nach jedem Termin wird ein 30-Minuten-Puffer geblockt
Datenschutz & DSGVO

Da alles self-hosted läuft, gibt es:
- keine externen Datenübertragungen
- vollständige Datenminimierung
- Speicherung nur im eigenen NocoDB-System
- Transport ausschließlich via HTTPS
- klare Einwilligung im Formular (Checkbox)
Die Lösung erfüllt damit deutlich höhere Anforderungen als kommerzielle SaaS-Terminbuchungen.

Die Vorteile für meine Besucher & Kunden
- Transparente Terminübersicht – freie Slots werden live angezeigt
- Direkte automatische Buchung – kein Hin und Her per E-Mail
- Sofortige Bestätigung & Kalendarisierung
- Datenschutz auf höchstem Niveau
- Keine Drittanbieter, keine Tracker, keine Cookies notwendig
Die Vorteile für mich als Berater
- Leads kommen strukturiert in meine Datenbank
- Termine tauchen automatisch im Kalender auf
- Doppelte Buchungen sind ausgeschlossen
- Zero-Maintenance durch Automatisierung
- Erweiterbar wie eine API-first-Lösung (z. B. für Mautic, CRM, Follow-ups)
Fazit

Die Terminbuchung auf system-boost.de zeigt, wie leistungsfähig n8n, WordPress, NocoDB und CalDAV zusammen wirken können – vor allem dann, wenn man Wert auf Open Source, Datenschutz und Automatisierung legt.
Dieses Setup ist stabil, flexibel und bietet eine hochwertige User Experience ohne externe Dienste.
26.11.2025
Kundenprojekt: Automatisierte OCR-Verarbeitung in Nextcloud – suchbare PDF/A-Dokumente mit n8n & lokalem API-Server
Ausgangssituation

Bei einem unserer Kunden werden täglich zahlreiche Dokumente gescannt – Rechnungen, Lieferscheine, Verträge oder Notizen. Diese landen automatisch in einem Nextcloud-Ordner und stehen anschließend verschiedenen Mitarbeitern zur Verfügung.
Das Problem: Die PDFs stammen direkt aus dem Scanner und enthalten keine durchsuchbaren Texte. Damit war die Suche nach Dokumenteninhalten oder Beträgen mühsam, und eine revisionssichere Langzeitarchivierung im PDF/A-Format war nicht gewährleistet.

Der Kunde wünschte sich eine vollautomatische Lösung, um neue Scans in Nextcloud automatisch zu erkennen, in durchsuchbare PDF/A-Dateien zu konvertieren und anschließend sauber abzulegen – ohne Cloud-Dienste, vollständig on-premises.

Unsere Lösung: n8n + Nextcloud + lokaler OCR-API-Server

Wir haben dafür einen Workflow auf Basis von n8n entwickelt, der direkt mit der Nextcloud des Kunden verbunden ist.
Der Ablauf im Überblick:
1. Überwachung des Scanner-Ordners:
  In regelmäßigen Intervallen prüft der Workflow den Nextcloud-Ordner /Geschaeftsdaten/Scanner auf neue Dateien.
2. Filterung & Verarbeitung:
  Bereits verarbeitete Dokumente (erkennbar an der Endung _ocr.pdf) werden übersprungen, um doppelte Konvertierungen zu vermeiden.
3. Lokale OCR-Verarbeitung:
  Neue PDF-Dateien werden automatisch an einen lokalen OCR-API-Server geschickt, der innerhalb der Kundeninfrastruktur läuft.
  Dieser Server basiert auf FastAPI und nutzt intern ocrmypdf mit der OCR-Engine Tesseract.
  Unterstützt werden mehrere Sprachen (z. B. Deutsch & Englisch), automatische Drehung, Schräglagenkorrektur und Optimierung.
  Das Ergebnis ist ein PDF/A-konformes Dokument mit Textlayer – also durchsuchbar, normgerecht und visuell identisch zum Original.
4. Rückführung & Ablage:
  Das erzeugte _ocr.pdf wird im gleichen Ordner wieder hochgeladen.
  Das ursprüngliche Scan-PDF wird – je nach Einstellung – gelöscht, um Dubletten zu vermeiden.
5. Automatische Namenskonvention:
  Der Workflow ergänzt alle OCR-Dateien einheitlich mit der Endung _ocr.pdf und sorgt so für klare Versionierung und Nachvollziehbarkeit.
Datenschutz & Sicherheit: Verarbeitung ausschließlich lokal

Ein zentrales Ziel dieses Projekts war der Datenschutz.
Alle Verarbeitungsschritte finden innerhalb der Kundensysteme statt – keine Datei verlässt das lokale Netzwerk.

Architektur
- FastAPI-Server läuft on-prem auf einem Linux-System im Intranet.
- Der OCR-Service nutzt ausschließlich temporäre Arbeitsverzeichnisse (tempfile.TemporaryDirectory), die nach jedem Auftrag automatisch gelöscht werden.
- Der Server akzeptiert nur PDF-Dateien (Content-Type: application/pdf oder multipart upload).
- Das Ergebnis wird gestreamt zurückgegeben – keine Kopien im Speicher, keine dauerhafte Speicherung.
Datenschutzvorteile
- Daten bleiben im Haus: Keine Übertragung in fremde Clouds oder Drittländer.
- Verarbeitung zweckgebunden: Nutzung nur zur Texterkennung.
- Speicherbegrenzung: Temporäre Daten werden nach Verarbeitung automatisch gelöscht.
- Transparente Benennung: Jede OCR-Datei trägt den Suffix _ocr.pdf – klar nachvollziehbar.
- Keine Protokollierung von Inhalten: Nur technische Logs (Status, Dauer, Erfolg/Fehler).
Technische Härtung
- Zugriff nur über interne IPs oder VPN.
- HTTPS (TLS)-Absicherung über Reverse Proxy mit Strict-Transport-Security & Referrer-Policy.
- API-Key oder mTLS-Authentifizierung für n8n-Aufrufe.
- Rate-Limits & Timeouts schützen vor Missbrauch.
- Kein Internetzugang vom Server ausgehend (reine Intranet-Kommunikation).
- Antivirus-Option (ClamAV) möglich – vor OCR-Aufruf zur zusätzlichen Prüfung.
Beispielheader (Reverse Proxy)
```
X-Content-Type-Options: nosniff
Content-Security-Policy: default-src 'none'
Strict-Transport-Security: max-age=31536000; includeSubDomains
Referrer-Policy: no-referrer
```
So entsteht eine vollständig datenschutzkonforme On-Prem-Lösung, die nicht nur sicher, sondern auch technisch elegant umgesetzt ist.

Vorteile für den Kunden
- Automatische Texterkennung: Dokumente sind durchsuchbar in Nextcloud & Desktop-Suche.
- Langzeitarchivierung: Ausgabe als PDF/A – rechtssicher und standardkonform.
- Volle Kontrolle: Alle Daten bleiben im eigenen Netzwerk.
- Zeitersparnis: Kein manuelles OCR mehr notwendig.
- Einheitliche Ablage: _ocr.pdf-Suffix für klare Nachvollziehbarkeit.
- DSGVO-konform: Keine Übermittlung, keine Fremdsysteme, keine Drittanbieter.
Technische Eckpunkte
- Workflow Engine: n8n (Automatisierung & Orchestrierung)
- Cloud-System: Nextcloud mit OAuth2-Anbindung
- OCR-Service: FastAPI + ocrmypdf + Tesseract
- Sprachen: Deutsch & Englisch (lang=deu+eng)
- Output: PDF/A mit Texterkennung, Rotation, Deskew, Optimierung
- Dateibenennung: Original → _ocr.pdf
- Timeout: bis zu 15 min für große Dokumente
- Laufzeitumgebung: On-prem Linux, ohne Internetzugang
Erweiterung & Ausblick

In der nächsten Ausbaustufe kann der Workflow erweitert werden, um:
- automatisch Metadaten zu extrahieren (Datum, Lieferant, Rechnungsnummer),
- Dokumente zu taggen oder in Unterordner zu verschieben,
- Benachrichtigungen in Nextcloud Talk oder per Mail zu senden,
- oder eine Anbindung ans ERP/DMS-System zu schaffen.
Fazit

Mit dieser Lösung erhält der Kunde eine automatisierte, sichere und revisionssichere Dokumentenverarbeitung – komplett lokal betrieben, ohne Cloud-Dienste, ohne Datenschutzrisiko.
Der Workflow läuft im Hintergrund, ist wartungsarm und sorgt dafür, dass alle gescannten Dokumente in Nextcloud durchsuchbar, standardisiert und sicher archiviert sind.
08.10.2025
Automatisierte Blogbeiträge aus Medien-Workflows: Von Asset → KI → WordPress-Entwurf
Beim Kunden erweitern wir den bestehenden Medien-Workflow (Airtable → Nextcloud) um eine KI-gestützte Erstellung von Blogbeiträgen. Bilder werden automatisch analysiert, ein sauber strukturierter Beitrag (HTML, SEO-Titel, Auszug, Tags) generiert und als Entwurf in WordPress angelegt – inklusive Featured Image. Die Redaktion prüft nur noch, ergänzt ggf. Details und veröffentlicht.

Ausgangslage & Ziel

Der Kunde sammelt Social-Media-Assets (Text, Fotos, Tags) bereits zentral. Was fehlte: schnell aus verwertbaren Assets einen fundierten Blogentwurf zu erzeugen – mit konsistenter Struktur, SEO-Basics und Medieneinbindung – ohne jedes Mal bei Null zu starten.

Ziel: Aus vorhandenen Inhalten automatisch einen WordPress-Draft erzeugen, der redaktionell nur noch finalisiert wird.

So funktioniert der erweiterte Workflow

1) Picking & Vorbereitung
- Airtable liefert „bereit“-markierte Einträge (Status „Ready“).
- Ein Code-Knoten normalisiert Titel, sammelt Text + Tags + Assets und erzeugt einen sauberen Ablagepfad (Datum_Titel_ID).
2) Nextcloud-Ablage
- Es wird automatisch ein Projektordner erstellt (Nextcloud).
- Assets (Foto/Video) werden heruntergeladen und in den Ordner geladen.
- Eine info.txt dokumentiert Ort, Text, Tags – für Nachvollziehbarkeit.
3) Medien → WordPress
- Falls ein Bild vorhanden ist (JPEG/PNG), wird es vorab von der Quelle geladen und via WordPress-API als Media Attachment hochgeladen.
- Die ID des Uploads wird später als Featured Image gesetzt.
4) KI-Analyse des Bildes
- Ein Vision-Modell analysiert nur das gelieferte Bild (keine Fremdquellen) und erzeugt eine sachliche Beschreibung (keine Phantasiewerte).
5) KI-Autor (Blog-JSON)
- Ein LLM-Chain-Knoten erstellt aus Bildbeschreibung + ursprünglichem Text + Hashtags einen strukturierten Blog-Entwurf (JSON mit Feldern wie title, slug, seo, excerpt, tags, content_html).
- Der Text ist referenzartig in Wir-Form (Projekt/Referenz), mit Abschnitten wie:
  Ausgangssituation & Ziel, Unsere Umsetzung, Vorteile, Technische Eckpunkte, Projekt-Steckbrief, CTA.
- SEO-Basics (Titel 50–60 Zeichen, Meta-Beschreibung 140–160) und interne Links (z. B. /leistungen/…) werden integriert – ohne Keyword-Spam.
6) WordPress-Draft anlegen
- Über die WP-REST-API wird ein Beitrag als „draft“ erstellt (Autor, Kategorie, Slug, HTML-Inhalt).
- Danach wird via API die Featured-Media-ID gesetzt – das Bild erscheint als Artikel-Teaser.
7) Status-Rückmeldung
- Der Ursprungsdatensatz wird markiert (z. B. „Nextcloud = Ja“), damit nichts doppelt verarbeitet wird.
Datenschutz & Governance
- Keine Fremdquellen: Die KI nutzt nur die gelieferten Assets + Felder.
- Entwurf statt Autopublish: Redaktionelle Kontrolle bleibt beim Team.
- EU-Hosting möglich, klare Zugriffsrechte und Protokollierung.
- Transparenz: info.txt sichert Kontext & Nachvollziehbarkeit pro Beitrag.
Konkrete Vorteile für den Kunden
- Zeitgewinn: Aus Rohmaterial wird in Minuten ein vollständiger Draft.
- Konsistenz: Einheitliche Struktur, sauberer HTML-Aufbau, SEO-Grundlagen automatisch.
- Medien korrekt eingebunden: Featured Image, Alt-Texte/Caption-Vorschläge, saubere Dateinamen.
- Weniger Fehlerquellen: Automatisierte Pfade, Status-Flags, klare Logs.
- Skalierbar: Funktioniert für wiederkehrende Formate (Baustellen-Update, Referenz, Produkt-Notiz).
Technische Eckpunkte (Auszug)
- Trigger: alle 10 Minuten; filtert auf Status „Ready“ und „nicht verarbeitet“.
- Storage: Nextcloud-Ordner je Beitrag; info.txt mit Metadaten.
- Media Pipeline: HTTP-Download → WP Media Upload → Rückgabe media_id.
- Content-Engine: Vision-Analyse → LLM-Chain → valide JSON-Antwort mit content_html.
- WordPress-API: POST /wp/v2/posts (draft), anschließend PATCH mit featured_media.
- Fail-safes: MIME-Check (nur Bildformate), Timeouts, klare Fehlerpfade (kein Autopublish).
Typische Redaktionelle Checks (1–3 Minuten)
- Titel leicht zuspitzen, Excerpt finalisieren.
- Interne Links prüfen (passen die Zielseiten?).
- Zwei, drei Wörter im „Technische Eckpunkte“-Block verfeinern.
- Veröffentlichen.
Fazit

Die Erweiterung macht aus vorhandenen Medien in einem Rutsch einen sauberen Blogentwurf – mit Bild, Struktur und SEO-Grundlagen. Das Team fokussiert sich auf Qualität & Freigabe, der Rest läuft reproduzierbar im Hintergrund. Ergebnis: mehr Inhalte, weniger Aufwand, konsistent im Markenstil.
15.09.2025
Kontaktformular-Pipeline mit n8n: Mautic → Datenbereinigung → Airtable
Kurzfassung: Ein Webhook nimmt Mautic-Formularsendungen entgegen, bereinigt Felder (z. B. Anrede & Newsletter-Opt-in) und legt die Datensätze standardisiert in Airtable an. So landen Leads sauber strukturiert im CRM-Backlog – inklusive Status „Todo“ für die weitere Bearbeitung.

Ausgangslage & Ziel

Formulare liefern oft uneinheitliche Werte (z. B. „geehrter Herr“, „w“, „1/0“). Ziel war eine robuste, nachvollziehbare Lead-Erfassung, die:
- Eingaben vereinheitlicht (Anrede, Newsletter),
- Dubletten vermeidet (saubere Felder & Mapping),
- Leads direkt in Airtable bereitstellt – bereit für Follow-ups.
Funktionsweise (End-to-End)
1. Webhook aus Mautic
  Das Formular sendet per POST an n8n (Header-Auth). Der Node „From Mautic+“ nimmt die Felder entgegen (Vorname, Nachname, Firma, Adresse, Nachricht, Newsletter etc.).
2. Datenbereinigung (Code-Node „Umschreiben“)
  - Entfernt Zero-Width-/Sonderzeichen & Mehrfach-Spaces.
  - Anrede-Normalisierung → Mann | Frau | Divers (erkennt Varianten wie „geehrter Herr“, „m/w/d“).
  - Newsletter-Opt-in → Ja | Nein (akzeptiert 1/0, true/false, on/off, ja/nein, yes/no).
3. Airtable-Create
  - Mapping auf Felder wie Vorname, Nachname, Firma, Straße, PLZ, Stadt, Telefon, E-Mail, Nachricht, Anrede, Newsletter.
  - Status = „Todo“ für den Start im Sales-/Support-Prozess.
Vorteile
- Konsistente Datenqualität: Einheitliche Anrede & Opt-in-Werte, weniger Nacharbeit.
- Schnelle Übergabe: Leads landen direkt in Airtable (Listen, Kanban, Automationen).
- Nachvollziehbar: Bereinigungslogik in n8n klar dokumentiert & versionierbar.
- DSGVO-freundlich: Minimalprinzip, klare Transportwege, kein unnötiges Speichern.
Best Practices & Erweiterungen
- Double-Opt-In über Mautic automatisieren und in Airtable spiegeln.
- Duplikat-Check (E-Mail/Telefon) vor Anlage.
- Benachrichtigungen (E-Mail/Slack/Teams) bei neuen „Todo“-Leads.
- Validierung (z. B. PLZ-Muster, Pflichtfelder) im n8n-Flow.
- Datenhaltung EU-basiert und Rollenrechte in Airtable prüfen.
Fazit

Mit n8n als Orchestrator wird aus einem einfachen Kontaktformular eine verlässliche Lead-Pipeline: sauber bereinigt, korrekt klassifiziert und sofort bearbeitbar im Team-Workflow.
10.09.2025
WhatsApp-Assistent mit n8n: Multimodale Kundenkommunikation (Text, Bild, Stimme)
Kurzfassung: Für einen Kunden haben wir einen WhatsApp-Assistenten umgesetzt, der Text, Sprachnachrichten, Bilder und Dokumente verarbeitet. Der Bot nutzt n8n als Orchestrierung, Azure OpenAI für die Antwortlogik, on-prem STT/OCR für Sprache & Dokumente sowie Twilio für die Zustellung. Sessions werden pro Kontakt gespeichert, Antworten sind präzise, auditierbar und mobilfreundlich.

Ausgangslage & Ziel

Kundenanfragen kommen heute über verschiedene Formate – kurze Texte, Sprachnachrichten, Fotos von Dokumenten. Ziel war ein robuster, datenschutzfreundlicher Kommunikationsfluss, der alles automatisch versteht, sinnvoll beantwortet und bei Bedarf Termine direkt anlegt.

Funktionsweise (End-to-End)
1. Eingang über WhatsApp/SMS (Twilio)
  Der Webhook nimmt eingehende Nachrichten entgegen und erkennt den Nachrichtentyp: Text, Audio, Bild, Dokument.
2. Intelligente Vorverarbeitung
  - Text: wird direkt in den Agent übergeben.
  - Audio: Speech-to-Text via on-prem STT (lokaler Endpunkt).
  - Bild/Dokument: OCR via on-prem Service (lokaler Endpunkt).
  - Kleine Robustheit: automatische Korrektur von MIME-Types bei Audio, damit alles sauber verarbeitet wird.
3. Gedächtnis (Session Memory)
  Pro WhatsApp-Kontakt wird ein kurzer Kontextverlauf gespeichert (Session-Key), damit Rückfragen natürlich wirken (z. B. Nachname, gewünschte Uhrzeit).
4. AI-Agent (Tools-first)
  Ein klarer System-Prompt steuert den Stil:
  - präzise, mobilfreundlich, ohne Spekulation
  - kann Dateien analysieren, Bilder beschreiben, Sprachinhalte transkribieren
  - erkennt, wenn Angaben fehlen, und fragt gezielt nach
  - hält Privacy-Regeln ein (keine Speicherung sensibler Daten)
5. Optionale Terminvergabe
  Der Agent ruft freigegebene HTTP-Tools auf:
  - Mitarbeiter & Services anzeigen
  - Kalenderdaten prüfen
  - Termin anlegen (Start/Ende, Mitarbeiter, Service)
6. Antwort & Ausgabe
  - Standard: Textantwort zurück an WhatsApp
  - Optional: Text-to-Speech (on-prem TTS) → Voice-Reply
  - Fallback-Message, wenn ein Dateityp nicht unterstützt wird
Datenschutz & Compliance
- DSGVO-freundlich: Verarbeitung bevorzugt EU-basiert; Sprache/OCR laufen auf eigenen Endpunkten.
- Transparenz: Kein unkontrolliertes Speichern sensibler Inhalte; klare Fehler- und Limit-Hinweise.
- Minimalprinzip: Nur notwendige Metadaten; kein Teilen zwischen Sessions.
Nutzen für das Team
- Schnellere Antworten – unabhängig vom Format der Anfrage
- Weniger Rückfragen – strukturierte Nachfragen nur bei fehlenden Pflichtangaben
- Weniger Tool-Hopping – Terminvergabe direkt im Chat
- Skalierbar – weitere Dienste (z. B. FAQs, Bestellstatus) lassen sich per Tool anbinden
Technischer Überblick (ausgewählte Bausteine)
- n8n als Orchestrator (Routing, Typ-Erkennung, Sessions, Fehlerbehandlung)
- Azure OpenAI (Chat-Modell) mit klaren Antwortregeln
- On-prem STT/OCR/TTS für Sprache, Bilder, Dokumente
- Twilio für WhatsApp/SMS-Ein- und Ausgang
- Robustheit: MIME-Fix für Audio, Fallback-SMS, strukturierte JSON-Outputs
Ergebnis

Der Assistant beantwortet multimodale Anfragen zuverlässig, reduziert die Bearbeitungszeit und ermöglicht self-service Terminbuchung – ohne Medienbrüche und mit compliance-gerechter Verarbeitung.
10.09.2025
Industrie-Chatbot mit n8n: Tool-Orchestrierung statt Halluzinationen
Kurzfassung: Für einen Industrie-Kunden haben wir einen Chatbot implementiert, der Nutzerfragen nicht „aus dem Kopf“ beantwortet, sondern gezielt angebundene Tools nutzt: Artikel-Lookup, Datenblattabruf und Wissenszugriff – alles protokolliert, reproduzierbar und DSGVO-konform. Der Bot läuft auf n8n mit OpenAI-kompatibler Webhook-Schnittstelle und Azure OpenAI (EU-Kontext), inklusive Sessionspeicher und Intent-Routing.

Ausgangslage & Ziel

Technische Anfragen zu Industrieartikeln sind komplex: Artikelnummern variieren, Nachfolger existieren, und Spezifikationen müssen belastbar sein. Ziel war ein robuster Chat-Workflow, der:
- Nutzerfragen annimmt (OpenAI-API-kompatibel),
- Intent & Parameter (z. B. Artikelnummer, Hersteller) sauber extrahiert,
- hersteller-spezifische Datenquellen bzw. freigegebene Crawler/Workflows ansteuert,
- nur belegbare Informationen zurückgibt – mit Quellen aus den Tools.
Architektur im Überblick
- Webhook (POST /v1/chat/completions): OpenAI-kompatible Endpoint-Struktur für einfache Integration.
- Pre-Processing („Vereinfachen“): Extrahiert Session-Key, letzte Usernachricht, Metadaten (IP/User-Agent optional).
- Intent-Router („Qualifikation“): Klassifiziert Anfrage (z. B. article_lookup, free_text_search, knowledge_db_query) und liefert ein valide geparstes JSON.
- Memory (Session): Buffer Window Memory per Session-Key für zusammenhängende Dialoge.
- Orchestrator-Agent: Strenge Tools-first-Policy: Erst passende Workflows aufrufen (z. B. Artikel-Lookup, PDF-Abruf, Parser, Specs-Extraktion), dann antworten.
- Tool-Workflows:
  - Hersteller-spezifische Pull-Workflows (nur wenn freigegeben).
  - Fallback-Crawler für generische Abfragen.
- Compliance & Determinismus: Keine freien Vermutungen, nur toolbasierte Ergebnisse mit Quellen.
- Response-Formatter: Konvertiert die Ausgabe in ein OpenAI-API-konformes Chat-Completion-Objekt.
Wichtiger Hinweis: Es werden keine vertraulichen/geschützten Inhalte offengelegt. Der Beitrag enthält keine Details zu konkreten Scraping-Zielen oder proprietären Endpunkten.

Funktionsweise Schritt für Schritt
1. Request entgegennehmen: Client postet Chat-Nachrichten an den Webhook (OpenAI-Format).
2. Session & Frage extrahieren: Session-Key, letzte Userfrage, gewünschtes Modell.
3. Intent-Erkennung: Parser liefert rein JSON-basiert: Intent, Sprache, erkannte Artikelnummer/Hersteller, Confidence.
4. Tool-Planung: Orchestrator wählt das zuständige Workflow-Tool (z. B. Hersteller-Lookup → Datenblatt → Parser → Specs).
5. Ausführung & Validierung: Ergebnisse werden auf Vollständigkeit geprüft (z. B. Spannung, Strom, Abmessungen, IP-Schutzklasse).
6. Antwort bauen: Knapp, sachlich, mit Quellen (nur aus Tool-Outputs).
7. Rückgabe: OpenAI-kompatibles JSON (choices, message, usage).
Warum dieser Ansatz?
- Verlässlich statt generativ unscharf: Der Bot „weiß“ nichts – er verwaltet Wissen und zitiert nur Tool-Ergebnisse.
- Auditierbar: Jeder Schritt ist in n8n nachvollziehbar (Logs, Status).
- Skalierbar: Neue Hersteller/Datenquellen werden als Tool-Workflow ergänzt.
- EU & DSGVO: Betrieb mit Azure OpenAI (EU-Konfiguration) und klaren Zugriffs-/Compliance-Regeln.
Sicherheits- & Compliance-Prinzipien
- Tools-first, Knowledge-last: Keine Freitexterfindungen.
- Quellenpflicht: Nur verlinkte/benannte Tool-Outputs.
- Minimal-Rückfragen: Nur wenn essenzielle Parameter fehlen (z. B. Hersteller, MLFB).
- Keine Secrets/IDs im Output, keine personenbezogenen Daten ohne Freigabe.
- EU-Hosting präferiert, Logs & Rechtekonzepte inklusive.
Nutzen für Fachabteilungen
- Schnellere Antworten auf wiederkehrende Technikfragen.
- Weniger Rückfragen durch saubere Parametrisierung und Nachfolger-Hinweise.
- Wissensentlastung im Support: Der Bot übernimmt Erstklärung & Spezifikats-Auszug.
- Konsistente Qualität dank deterministischer Pipelines.
Erweiterungen (Roadmap)
- Streaming-Antworten am Webhook für Live-Token-Output.
- Mehrsprachigkeit mit Terminologie-Glossar.
- RAG auf freigegebenen internen Dokumenten (rollenbasiert).
- Telemetry & Monitoring (Fehlerraten, Tool-Latenzen, Antwortqualität).
- Admin-Konsole zum Verwalten von Tools, Limits, Session-Policies.
Fazit

Mit n8n als Orchestrierungs-Layer und Azure OpenAI als Modell-Backend entsteht ein verlässlicher Industrie-Chatbot, der nur belegbare Informationen aus angebundenen Hersteller-/Wissens-Workflows liefert. Das reduziert Fehlantworten, schafft Vertrauen und spart Support-Zeit – DSGVO-konform und erweiterbar.
10.09.2025
Medien-Workflow automatisieren mit n8n, Nextcloud & Airtable (DSGVO-konform)
Kurzfassung: Dieser Workflow automatisiert die Ablage von Social-Media-Assets: Inhalte werden aus Airtable gelesen, in Nextcloud strukturiert abgelegt, Metadaten als info.txt gespeichert und der Datensatz anschließend markiert. Das Ganze läuft mit n8n, ist DSGVO-konform und eignet sich perfekt für KMU, die wiederkehrende Medienprozesse standardisieren möchten.

Ausgangslage & Ziel

Viele Teams verteilen Bilder, Videos und Texte über E-Mail, Chat oder lokale Ordner. Ergebnis: Duplikate, Versionschaos und Zeitverlust.
Ziel: Ein zentraler, reproduzierbarer Prozess, der Social-Media-Assets automatisch herunterlädt, sauber benennt, in einer EU-gehosteten Nextcloud ablegt und im Quellsystem den Status aktualisiert.

Kern-Keywords: n8n Automatisierung, Nextcloud Hosting, Airtable Integration, DSGVO, Medien-Workflow, Docker

Architektur im Überblick
- Airtable dient als Content-Quelle (Titel, Text, Tags, Medienlinks, Status).
- n8n orchestriert den Prozess (Zeitplan, Logik, Downloads, Uploads).
- Nextcloud ist die zentrale, DSGVO-konforme Ablage (EU-Hosting).
- Docker ermöglicht ein schlankes, wartbares Hosting-Setup.
Der Workflow Schritt für Schritt
1. Trigger (Zeitplan): Ein Schedule Trigger prüft in regelmäßigen Abständen (z. B. minütlich), ob neue Inhalte bereitstehen.
2. Suche in Airtable: Mit filterByFormula werden Datensätze mit Status Ready gefunden, die noch nicht in Nextcloud liegen.
3. Vorbereitung (Code-Node):
  - Aus Datum, Titel und ID wird ein sprechender Ordnername generiert, z. B. 2025-09-10_Titel_12345.
  - Medien-Assets (Fotos/Videos) werden aus den Feldern gesammelt.
  - Metadaten wie Text und Tags werden übernommen.
4. Ordner anlegen (Nextcloud): Der Workflow erstellt den Zielordner in Nextcloud – ohne führenden Slash, damit die Pfade konsistent bleiben.
5. Assets verarbeiten:
  - Split/Loop: Jedes Asset wird einzeln heruntergeladen (HTTP Request) und in den Ordner hochgeladen.
  - Dadurch sind auch große Uploads robust und nachvollziehbar.
6. info.txt erzeugen:
  - Eine info.txt fasst Ort (Pfad), Text und Tags zusammen.
  - Sie wird als Datei konvertiert und ebenfalls in den Ordner hochgeladen.
7. Airtable-Update: Nach erfolgreicher Ablage setzt n8n im Datensatz das Feld Nextcloud = Ja. So ist jeder Schritt auditierbar und doppelte Verarbeitung wird vermieden.
Warum das funktioniert
- Standardisierte Benennung: Datum_Titel_ID sorgt für Ordnung und schnelle Suche.
- Nachvollziehbarkeit: Die info.txt dokumentiert Kontext & Tags direkt am Speicherort.
- Zuverlässigkeit: Batch-Verarbeitung und Timeouts verhindern Abbrüche bei großen Dateien.
- Datenschutz: Nextcloud in der EU und klare Zugriffsrechte unterstützen DSGVO-Konformität.
Vorteile für KMU
- Zeitersparnis: Keine manuelle Dateiablage, kein Copy-&-Paste.
- Weniger Fehler: Automatische Status-Updates in Airtable.
- Transparenz: Jede Veröffentlichung hat einen eindeutigen Ordner mit Metadaten.
- Skalierbar: Neue Kanäle/Teams integrieren, ohne Abläufe zu ändern.
Erweiterungen (Best Practices)
- Monitoring & Alerts: Fehlerbenachrichtigungen per E-Mail oder Slack/Teams.
- Bild-/Videopipeline: Optionale Konvertierung/Komprimierung vor Upload.
- Versionierung: Sperr- und Freigabe-Workflows (QA → On Air).
- Rechte & Rollen: Rollenkonzepte in Nextcloud, 2FA, Offsite-Backups.
- Publishing-Schritt: Anbindung an Mautic/Shop/CRM oder Social-Scheduling.
Fazit

Mit n8n, Airtable und Nextcloud entsteht ein robuster Medien-Workflow, der Ordnung schafft, Zeit spart und Datenschutzanforderungen erfüllt. Ideal für Teams, die regelmäßig Content produzieren und eine saubere, skalierbare Ablage benötigen.
10.09.2025

Kategorie: Workflows

🧠 Ziel des Systems

🏗️ Architekturüberblick

1️⃣ Dokument-Ingestion & Synchronisation (Nextcloud → RAG-Datenbank)

🔁 Alle 5 Minuten:

2️⃣ RAG-KI-Agent (Open-WebUI)

3️⃣ Dynamischer Dokument-Parser

(OCR → Bildextraktion → Supabase → Markdown-Rekonstruktion)

🛠️ Was wird gespeichert?

1. document_metadata

2. document_rows

3. documents_pg (Vektorstore)

⚙️ Use-Cases in Engineering-Projekten

🔌 Elektroplanung / Schaltschrankbau

⚙️ Maschinenbau / Mechanik

📑 QM & Dokumentation

💡 Engineering-KI | Beispielabfragen

📈 Vorteile für Engineering-Firmen

❤️ Für Konstrukteure

🧠 Für Projektleitung

⚡ Für die Firma

🧩 Technologiestack

🎯 Fazit

Warum ich diese Lösung entwickelt habe

So funktioniert die Terminbuchung auf system-boost.de

1) WordPress-Formular → n8n (Webhook)

2) Speicherung in NocoDB (Lead-Management)

3) Automatische E-Mail-Benachrichtigung

4) Automatische Kalendererstellung (CalDAV)

Die technischen Highlights

🟦 n8n Workflow 1: Buchung entgegennehmen

🟩 n8n Workflow 2: Freie Termin-Slots berechnen

Arbeitszeit-Logik

Datenschutz & DSGVO

Die Vorteile für meine Besucher & Kunden

Die Vorteile für mich als Berater

Fazit

Ausgangssituation

Unsere Lösung: n8n + Nextcloud + lokaler OCR-API-Server

Datenschutz & Sicherheit: Verarbeitung ausschließlich lokal

Architektur

Datenschutzvorteile

Technische Härtung

Beispielheader (Reverse Proxy)

Vorteile für den Kunden

Technische Eckpunkte

Erweiterung & Ausblick

Fazit

Ausgangslage & Ziel

So funktioniert der erweiterte Workflow

1) Picking & Vorbereitung

2) Nextcloud-Ablage

3) Medien → WordPress

4) KI-Analyse des Bildes

5) KI-Autor (Blog-JSON)

6) WordPress-Draft anlegen

7) Status-Rückmeldung

Datenschutz & Governance

Konkrete Vorteile für den Kunden

Technische Eckpunkte (Auszug)

Typische Redaktionelle Checks (1–3 Minuten)

Fazit

Ausgangslage & Ziel

Funktionsweise (End-to-End)

Vorteile

Best Practices & Erweiterungen

Fazit

Ausgangslage & Ziel

Funktionsweise (End-to-End)

Datenschutz & Compliance

Nutzen für das Team

Technischer Überblick (ausgewählte Bausteine)

Ergebnis

Ausgangslage & Ziel

Architektur im Überblick

Funktionsweise Schritt für Schritt

Warum dieser Ansatz?

Sicherheits- & Compliance-Prinzipien

Nutzen für Fachabteilungen

Erweiterungen (Roadmap)

1. `document_metadata`

2. `document_rows`

3. `documents_pg` (Vektorstore)