Kategorie: Workflows

  • Engineering-RAG-Workflow für Elektro- & Maschinenbauprojekte

    Engineering-RAG-Workflow für Elektro- & Maschinenbauprojekte

    Live-Wissensdatenbank für Normen, Artikellisten, Kundenanforderungen und Projektdokumente

    In modernen Engineering-Projekten (Elektrokonstruktion, Maschinenbau, Automatisierung, Sondermaschinen) arbeiten Teams ständig mit komplexen Vorgabedokumenten, darunter:

    • Artikel- und Materiallisten
    • Kundenspezifikationen
    • Normensammlungen (DIN, ISO, VDE)
    • Freigabedokumente & Änderungsstände
    • EPLAN-Auszüge
    • Risikoanalysen
    • Lastenhefte und Funktionsbeschreibungen

    Diese Informationen müssen versioniert, durchsuchbar, projektbezogen, aktuell und teamweit verfügbar sein.

    Hier setzt unser RAG-unterstütztes Engineering-Wissenssystem an.


    🧠 Ziel des Systems

    Eine projektorientierte, KI-gestützte Live-Wissensdatenbank, die:

    • Automatisch Dokumente aus Nextcloud einliest
    • Texte, Tabellen, Normartikel, technische Inhalte extrahiert und strukturiert
    • OCR für gescannte PDFs nutzt
    • Alles in eine Postgres/PGVector-Datenbank schreibt
    • Änderungen in Echtzeit erkennt
    • Veraltete Daten automatisch löscht
    • Eine KI-Chatoberfläche (Open-WebUI) benutzt, um Fragen projektbezogen zu beantworten
    • Inhalte nicht erfindet, sondern nur referenziert
    • Tabellen per SQL auswertet (z. B. „zeige alle Artikelgrößen“, „max. Stromstärke“ usw.)
    • Bilder extrahiert, in Supabase lädt und korrekt im Markdown ausgibt

    Damit hat das Engineering-Team einen digitalen Projektingenieur, der alle Dokumente kennt, sie durchsucht, interpretiert und vergleicht.


    🏗️ Architekturüberblick

    Der Workflow besteht aus drei zentralen Bereichen:


    1️⃣ Dokument-Ingestion & Synchronisation (Nextcloud → RAG-Datenbank)

    🔁 Alle 5 Minuten:

    1. Nextcloud-Ordner scannen
      /Dokumente/n8n/RAG/…
    2. Gegen Postgres vergleichen (ETag + LastModified)
      ➜ nur neue oder geänderte Dateien werden eingelesen.
    3. Veraltete Einträge entfernen
      – aus:
      • document_metadata
      • document_rows
      • documents_pg (Vektorstore)
    4. Neue/aktualisierte Dateien einlesen
      • Dateityp bestimmen (PDF, Excel, CSV, DOCX …)
      • Tabellen extrahieren (CSV/XLSX)
      • Text extrahieren (Default Loader)
      • OCR verwenden wenn nötig
        (für gescannte PDFs ➜ Mistral OCR)
    5. Dokument in Chunks splitten + speichern
      ➜ als Vektoren in documents_pg

    Damit wird jede Änderung sofort übernommen.


    2️⃣ RAG-KI-Agent (Open-WebUI)

    Der Chat läuft über:

    • Azure OpenAI (DSGVO-konform)
      Modelle: gpt-5-mini, gpt-4.1-mini, Embeddings
    • Postgres Vektorsuche (PGVector)
    • KI-Gedächtnis über Postgres Chat Memory

    Der Agent erhält ein strenges System-Prompt:

    ✔ Keine Halluzinationen
    ✔ Immer RAG-Suche -> Dokumente referenzieren
    ✔ SQL-Abfragen für tabellarische Daten
    ✔ Markdown-strukturierte Antworten
    ✔ Anzeigen aller Bilder (automatisch aus Supabase)

    Beispielprompt:

    „Suche bitte die genaue Normstelle für Kurzschlussfestigkeit aus den hochgeladenen Kundenvorgaben.“

    Der Agent durchsucht:

    • kundenspezifische Vorgaben
    • Normen (z. B. DIN EN 61439)
    • technische Anhänge
    • Excel-Stücklisten
    • Tabellen zur Strombelastbarkeit
    • Maschinenrichtlinien-Auszüge

    und liefert exakte, belegte Antworten.


    3️⃣ Dynamischer Dokument-Parser

    (OCR → Bildextraktion → Supabase → Markdown-Rekonstruktion)

    Der zweite Workflow:

    1. Hochladen eines PDF/Dokuments zu Mistral API
    2. Generierung einer signierten URL
    3. OCR-Prozess mit:
      • Textextraktion
      • Erkennung aller Bilder
      • Erstellung natürlicher Bildbeschreibungen
    4. Speichern aller Bilder via Supabase
    5. Ersetzen aller inline-Bild-IDs im Markdown
    6. Zurückgeben eines vollständig rekonstruierten Markdown-Dokuments
      – mit Bildern
      – mit Bildbeschreibungen
      – perfekt geeignet für RAG

    Beispiel:

    ![page1_image3](page1_image3)
    
    → wird ersetzt durch →
    
    ![page1_image3](https://supabase.domain/storage/.../892173_page1_image3.png)
    
    Die Abbildung zeigt die Verdrahtung eines Motorschützes mit Überlastschutz…
    

    🛠️ Was wird gespeichert?

    1. document_metadata

    • file_id (ETag)
    • title
    • url (Nextcloud-Pfad)
    • last_modified
    • schema (bei Tabellen)

    2. document_rows

    • Jede Tabellenzeile als JSON
      Beispiel für Artikeldaten:
    {
      "Artikelnummer": "X20392",
      "Bezeichnung": "Sicherungsautomat 10A",
      "Hersteller": "Siemens",
      "Norm": "DIN EN 60898",
      "Strom": "10A"
    }
    

    3. documents_pg (Vektorstore)

    • alle Textchunks
    • inklusive OCR-Texte
    • inklusive Bildbeschreibungen

    ⚙️ Use-Cases in Engineering-Projekten

    🔌 Elektroplanung / Schaltschrankbau

    • automatische Ermittlung der richtigen Normstellen
    • Prüfung ob Komponenten normkonform sind
    • Zeigen von Artikeln aus einer Liste

    ⚙️ Maschinenbau / Mechanik

    • Normanforderungen für Sicherheit (z. B. ISO 12100)
    • automatisches Auslesen von Lastenheften
    • OCR lesbarer gescannter Werkstattnotizen
    • Inhaltliche Zusammenführer unterschiedlicher Revisionen

    📑 QM & Dokumentation

    • zentraler Norm-Wissensspeicher
    • projektbezogene Vorgabensammlung
    • automatisches Änderungsmanagement
    • Rückverfolgbarkeit aller Vorgaben

    💡 Engineering-KI | Beispielabfragen

    • „Welche Artikel sind im Projekt XY freigegeben?“
    • „Welche Norm fordert den Überstromschutz der 24V-Schiene?“
    • „Vergleiche die Kundenanforderungen Version 2.1 und 3.0.“
    • „Welche Motorleistung ist laut Vorgabe zulässig?“
    • „Liste alle Artikel mit größerem Nennstrom als 16A.“
    • „Welche Dokumente wurden seit gestern geändert?“

    📈 Vorteile für Engineering-Firmen

    ❤️ Für Konstrukteure

    • Keine Sucherei in 300 PDFs
    • Sofort Antworten auf Normfragen
    • Projektbezogene Wissensbasis — nie wieder alte Dokumentstände

    🧠 Für Projektleitung

    • Versionssicherheit
    • Vollautomatisches Änderungsmonitoring
    • Revisionssichere Ablage

    ⚡ Für die Firma

    • Weniger Fehler
    • Schnellere Konstruktion
    • Saubere, nachvollziehbare Dokumentation
    • Compliance-sichere Normanwendung

    🧩 Technologiestack

    BereichLösung
    DateiablageNextcloud
    OCRMistral
    KI ModelleAzure OpenAI (DSGVO)
    DatenbankSupabase Postgres + PGVector
    Orchestrierungn8n
    WorkspaceOpen-WebUI
    Embeddingstext-embedding-3-small
    RerankerCohere Reranker
    VersionierungETag + LastModified Vergleich

    🎯 Fazit

    Dieser Workflow transformiert deine Engineering-Firma in einen datenbasierten, KI-gestützten High-Performance-Prozess:

    ✔ alle Kundenvorgaben
    ✔ alle Normen
    ✔ alle Artikellisten
    ✔ alle Freigaben
    ✔ alle Projektfiles
    ✔ alle Tabellen
    ✔ alle Bilder
    ✔ alle OCR-Inhalte

    werden vollautomatisch eingelesen, versioniert, durchsuchbar gemacht, mit KI analysierbar und projektbezogen live aktuell gehalten.

  • Automatisierte Terminbuchung auf system-boost.de – n8n, NocoDB & CalDAV

    Automatisierte Terminbuchung auf system-boost.de – n8n, NocoDB & CalDAV

    Um meine Beratungsgespräche effizient zu planen, habe ich auf system-boost.de eine komplett automatisierte Terminbuchung umgesetzt.
    Dabei kommen ausschließlich Open-Source-Technologien zum Einsatz – vollständig selbst gehostet, DSGVO-konform und perfekt in meine bestehenden Workflows integriert.

    Die Lösung verbindet WordPress → n8n → NocoDB → CalDAV zu einem leistungsfähigen Automatisierungsprozess, der Anfragen speichert, Termine automatisch anlegt, interne Benachrichtigungen sendet und freie Zeitslots live auf der Website ausgibt.


    Warum ich diese Lösung entwickelt habe

    Ich wollte ein Terminbuchungssystem, das:

    • keine SaaS-Abhängigkeit hat
    • keine Kundendaten an US-Dienste überträgt
    • zu 100 % automatisiert arbeitet
    • meinen Kalender live prüft und freie Slots anzeigt
    • in mein Automatisierungs-Ökosystem (n8n, Self-Hosting, CalDAV) passt

    Die bestehenden Lösungen waren entweder überladen, teuer oder nicht ausreichend datenschutzkonform.
    Also habe ich eine eigene, schlanke und performante Alternative gebaut.


    So funktioniert die Terminbuchung auf system-boost.de

    1) WordPress-Formular → n8n (Webhook)

    Wenn ein Besucher einen Termin auswählt und das Formular absendet:

    • erreicht die Anfrage den n8n Webhook wp-terminbuchung
    • der Benutzer wird direkt auf die Danke-Seite weitergeleitet
    • alle Daten werden im Hintergrund verarbeitet

    2) Speicherung in NocoDB (Lead-Management)

    Alle Anfragen werden automatisch in einer NocoDB-Tabelle gespeichert:

    • Vorname
    • Nachname
    • E-Mail
    • Firma
    • Datum
    • Uhrzeit
    • Datenschutz-Einwilligung

    Damit habe ich eine einfache, saubere und DSGVO-konforme Lead-Verwaltung.

    3) Automatische E-Mail-Benachrichtigung

    Ich erhalte sofort eine interne E-Mail mit allen Details der Anfrage.
    Das erlaubt mir, auch mobile oder unterwegs schnell zu sehen, welcher Termin gebucht wurde.

    4) Automatische Kalendererstellung (CalDAV)

    Mein self-hosted CalDAV-Kalender erstellt automatisch ein 30-Minuten Meeting:

    • Titel: „Erstgespräch mit {Name} ({Firma})“
    • Ort: „Online-Meeting“
    • Beschreibung: alle Kontaktdaten + Buchungsquelle
    • Start-/Endzeit werden zuverlässig per JavaScript berechnet

    Damit landet jeder Termin ohne Klick direkt in meinem Kalender.


    Die technischen Highlights

    🟦 n8n Workflow 1: Buchung entgegennehmen

    Nodes:

    • Webhook → Redirect
    • NocoDB – Create Row
    • Email Send
    • Code Node (Zeitberechnung)
    • CalDAV – createEvent

    🟩 n8n Workflow 2: Freie Termin-Slots berechnen

    Dieser Workflow liefert die freien Slots live an die Webseite.

    Die Slot-API:

    GET /webhook/wp-termin-slots?date=YYYY-MM-DD

    Der Workflow:

    1. liest alle Termine für den angefragten Tag aus meinem CalDAV-Kalender
    2. erkennt Überschneidungen
    3. berücksichtigt Pufferzeiten
    4. generiert 30-Minuten-Slots
    5. filtert nur die wirklich freien Zeiten
    6. gibt ein sauberes JSON zurück – ideal für die WordPress-Buchungsmaske

    Beispiel-Response:

    {
      "date": "2025-12-04",
      "slots": ["10:00", "10:30", "11:00", ...]
    }
    

    Arbeitszeit-Logik

    • Mo–Fr: 07:00–19:00
    • Sa: 10:00–16:00
    • So: keine Terminbuchung
    • Vor und nach jedem Termin wird ein 30-Minuten-Puffer geblockt

    Datenschutz & DSGVO

    Da alles self-hosted läuft, gibt es:

    • keine externen Datenübertragungen
    • vollständige Datenminimierung
    • Speicherung nur im eigenen NocoDB-System
    • Transport ausschließlich via HTTPS
    • klare Einwilligung im Formular (Checkbox)

    Die Lösung erfüllt damit deutlich höhere Anforderungen als kommerzielle SaaS-Terminbuchungen.


    Die Vorteile für meine Besucher & Kunden

    • Transparente Terminübersicht – freie Slots werden live angezeigt
    • Direkte automatische Buchung – kein Hin und Her per E-Mail
    • Sofortige Bestätigung & Kalendarisierung
    • Datenschutz auf höchstem Niveau
    • Keine Drittanbieter, keine Tracker, keine Cookies notwendig

    Die Vorteile für mich als Berater

    • Leads kommen strukturiert in meine Datenbank
    • Termine tauchen automatisch im Kalender auf
    • Doppelte Buchungen sind ausgeschlossen
    • Zero-Maintenance durch Automatisierung
    • Erweiterbar wie eine API-first-Lösung (z. B. für Mautic, CRM, Follow-ups)

    Fazit

    Die Terminbuchung auf system-boost.de zeigt, wie leistungsfähig n8n, WordPress, NocoDB und CalDAV zusammen wirken können – vor allem dann, wenn man Wert auf Open Source, Datenschutz und Automatisierung legt.
    Dieses Setup ist stabil, flexibel und bietet eine hochwertige User Experience ohne externe Dienste.

  • Kundenprojekt: Automatisierte OCR-Verarbeitung in Nextcloud – suchbare PDF/A-Dokumente mit n8n & lokalem API-Server

    Kundenprojekt: Automatisierte OCR-Verarbeitung in Nextcloud – suchbare PDF/A-Dokumente mit n8n & lokalem API-Server

    Ausgangssituation

    Bei einem unserer Kunden werden täglich zahlreiche Dokumente gescannt – Rechnungen, Lieferscheine, Verträge oder Notizen. Diese landen automatisch in einem Nextcloud-Ordner und stehen anschließend verschiedenen Mitarbeitern zur Verfügung.
    Das Problem: Die PDFs stammen direkt aus dem Scanner und enthalten keine durchsuchbaren Texte. Damit war die Suche nach Dokumenteninhalten oder Beträgen mühsam, und eine revisionssichere Langzeitarchivierung im PDF/A-Format war nicht gewährleistet.

    Der Kunde wünschte sich eine vollautomatische Lösung, um neue Scans in Nextcloud automatisch zu erkennen, in durchsuchbare PDF/A-Dateien zu konvertieren und anschließend sauber abzulegen – ohne Cloud-Dienste, vollständig on-premises.


    Unsere Lösung: n8n + Nextcloud + lokaler OCR-API-Server

    Wir haben dafür einen Workflow auf Basis von n8n entwickelt, der direkt mit der Nextcloud des Kunden verbunden ist.
    Der Ablauf im Überblick:

    1. Überwachung des Scanner-Ordners:
      In regelmäßigen Intervallen prüft der Workflow den Nextcloud-Ordner /Geschaeftsdaten/Scanner auf neue Dateien.
    2. Filterung & Verarbeitung:
      Bereits verarbeitete Dokumente (erkennbar an der Endung _ocr.pdf) werden übersprungen, um doppelte Konvertierungen zu vermeiden.
    3. Lokale OCR-Verarbeitung:
      Neue PDF-Dateien werden automatisch an einen lokalen OCR-API-Server geschickt, der innerhalb der Kundeninfrastruktur läuft.
      Dieser Server basiert auf FastAPI und nutzt intern ocrmypdf mit der OCR-Engine Tesseract.
      Unterstützt werden mehrere Sprachen (z. B. Deutsch & Englisch), automatische Drehung, Schräglagenkorrektur und Optimierung.
      Das Ergebnis ist ein PDF/A-konformes Dokument mit Textlayer – also durchsuchbar, normgerecht und visuell identisch zum Original.
    4. Rückführung & Ablage:
      Das erzeugte _ocr.pdf wird im gleichen Ordner wieder hochgeladen.
      Das ursprüngliche Scan-PDF wird – je nach Einstellung – gelöscht, um Dubletten zu vermeiden.
    5. Automatische Namenskonvention:
      Der Workflow ergänzt alle OCR-Dateien einheitlich mit der Endung _ocr.pdf und sorgt so für klare Versionierung und Nachvollziehbarkeit.

    Datenschutz & Sicherheit: Verarbeitung ausschließlich lokal

    Ein zentrales Ziel dieses Projekts war der Datenschutz.
    Alle Verarbeitungsschritte finden innerhalb der Kundensysteme statt – keine Datei verlässt das lokale Netzwerk.

    Architektur

    • FastAPI-Server läuft on-prem auf einem Linux-System im Intranet.
    • Der OCR-Service nutzt ausschließlich temporäre Arbeitsverzeichnisse (tempfile.TemporaryDirectory), die nach jedem Auftrag automatisch gelöscht werden.
    • Der Server akzeptiert nur PDF-Dateien (Content-Type: application/pdf oder multipart upload).
    • Das Ergebnis wird gestreamt zurückgegeben – keine Kopien im Speicher, keine dauerhafte Speicherung.

    Datenschutzvorteile

    • Daten bleiben im Haus: Keine Übertragung in fremde Clouds oder Drittländer.
    • Verarbeitung zweckgebunden: Nutzung nur zur Texterkennung.
    • Speicherbegrenzung: Temporäre Daten werden nach Verarbeitung automatisch gelöscht.
    • Transparente Benennung: Jede OCR-Datei trägt den Suffix _ocr.pdf – klar nachvollziehbar.
    • Keine Protokollierung von Inhalten: Nur technische Logs (Status, Dauer, Erfolg/Fehler).

    Technische Härtung

    • Zugriff nur über interne IPs oder VPN.
    • HTTPS (TLS)-Absicherung über Reverse Proxy mit Strict-Transport-Security & Referrer-Policy.
    • API-Key oder mTLS-Authentifizierung für n8n-Aufrufe.
    • Rate-Limits & Timeouts schützen vor Missbrauch.
    • Kein Internetzugang vom Server ausgehend (reine Intranet-Kommunikation).
    • Antivirus-Option (ClamAV) möglich – vor OCR-Aufruf zur zusätzlichen Prüfung.

    Beispielheader (Reverse Proxy)

    X-Content-Type-Options: nosniff
    Content-Security-Policy: default-src 'none'
    Strict-Transport-Security: max-age=31536000; includeSubDomains
    Referrer-Policy: no-referrer
    

    So entsteht eine vollständig datenschutzkonforme On-Prem-Lösung, die nicht nur sicher, sondern auch technisch elegant umgesetzt ist.


    Vorteile für den Kunden

    • Automatische Texterkennung: Dokumente sind durchsuchbar in Nextcloud & Desktop-Suche.
    • Langzeitarchivierung: Ausgabe als PDF/A – rechtssicher und standardkonform.
    • Volle Kontrolle: Alle Daten bleiben im eigenen Netzwerk.
    • Zeitersparnis: Kein manuelles OCR mehr notwendig.
    • Einheitliche Ablage: _ocr.pdf-Suffix für klare Nachvollziehbarkeit.
    • DSGVO-konform: Keine Übermittlung, keine Fremdsysteme, keine Drittanbieter.

    Technische Eckpunkte

    • Workflow Engine: n8n (Automatisierung & Orchestrierung)
    • Cloud-System: Nextcloud mit OAuth2-Anbindung
    • OCR-Service: FastAPI + ocrmypdf + Tesseract
    • Sprachen: Deutsch & Englisch (lang=deu+eng)
    • Output: PDF/A mit Texterkennung, Rotation, Deskew, Optimierung
    • Dateibenennung: Original → _ocr.pdf
    • Timeout: bis zu 15 min für große Dokumente
    • Laufzeitumgebung: On-prem Linux, ohne Internetzugang

    Erweiterung & Ausblick

    In der nächsten Ausbaustufe kann der Workflow erweitert werden, um:

    • automatisch Metadaten zu extrahieren (Datum, Lieferant, Rechnungsnummer),
    • Dokumente zu taggen oder in Unterordner zu verschieben,
    • Benachrichtigungen in Nextcloud Talk oder per Mail zu senden,
    • oder eine Anbindung ans ERP/DMS-System zu schaffen.

    Fazit

    Mit dieser Lösung erhält der Kunde eine automatisierte, sichere und revisionssichere Dokumentenverarbeitung – komplett lokal betrieben, ohne Cloud-Dienste, ohne Datenschutzrisiko.
    Der Workflow läuft im Hintergrund, ist wartungsarm und sorgt dafür, dass alle gescannten Dokumente in Nextcloud durchsuchbar, standardisiert und sicher archiviert sind.


  • Automatisierte Blogbeiträge aus Medien-Workflows: Von Asset → KI → WordPress-Entwurf

    Automatisierte Blogbeiträge aus Medien-Workflows: Von Asset → KI → WordPress-Entwurf

    Beim Kunden erweitern wir den bestehenden Medien-Workflow (Airtable → Nextcloud) um eine KI-gestützte Erstellung von Blogbeiträgen. Bilder werden automatisch analysiert, ein sauber strukturierter Beitrag (HTML, SEO-Titel, Auszug, Tags) generiert und als Entwurf in WordPress angelegt – inklusive Featured Image. Die Redaktion prüft nur noch, ergänzt ggf. Details und veröffentlicht.

    Ausgangslage & Ziel

    Der Kunde sammelt Social-Media-Assets (Text, Fotos, Tags) bereits zentral. Was fehlte: schnell aus verwertbaren Assets einen fundierten Blogentwurf zu erzeugen – mit konsistenter Struktur, SEO-Basics und Medieneinbindung – ohne jedes Mal bei Null zu starten.

    Ziel: Aus vorhandenen Inhalten automatisch einen WordPress-Draft erzeugen, der redaktionell nur noch finalisiert wird.


    So funktioniert der erweiterte Workflow

    1) Picking & Vorbereitung

    • Airtable liefert „bereit“-markierte Einträge (Status „Ready“).
    • Ein Code-Knoten normalisiert Titel, sammelt Text + Tags + Assets und erzeugt einen sauberen Ablagepfad (Datum_Titel_ID).

    2) Nextcloud-Ablage

    • Es wird automatisch ein Projektordner erstellt (Nextcloud).
    • Assets (Foto/Video) werden heruntergeladen und in den Ordner geladen.
    • Eine info.txt dokumentiert Ort, Text, Tags – für Nachvollziehbarkeit.

    3) Medien → WordPress

    • Falls ein Bild vorhanden ist (JPEG/PNG), wird es vorab von der Quelle geladen und via WordPress-API als Media Attachment hochgeladen.
    • Die ID des Uploads wird später als Featured Image gesetzt.

    4) KI-Analyse des Bildes

    • Ein Vision-Modell analysiert nur das gelieferte Bild (keine Fremdquellen) und erzeugt eine sachliche Beschreibung (keine Phantasiewerte).

    5) KI-Autor (Blog-JSON)

    • Ein LLM-Chain-Knoten erstellt aus Bildbeschreibung + ursprünglichem Text + Hashtags einen strukturierten Blog-Entwurf (JSON mit Feldern wie title, slug, seo, excerpt, tags, content_html).
    • Der Text ist referenzartig in Wir-Form (Projekt/Referenz), mit Abschnitten wie:
      Ausgangssituation & Ziel, Unsere Umsetzung, Vorteile, Technische Eckpunkte, Projekt-Steckbrief, CTA.
    • SEO-Basics (Titel 50–60 Zeichen, Meta-Beschreibung 140–160) und interne Links (z. B. /leistungen/…) werden integriert – ohne Keyword-Spam.

    6) WordPress-Draft anlegen

    • Über die WP-REST-API wird ein Beitrag als „draft“ erstellt (Autor, Kategorie, Slug, HTML-Inhalt).
    • Danach wird via API die Featured-Media-ID gesetzt – das Bild erscheint als Artikel-Teaser.

    7) Status-Rückmeldung

    • Der Ursprungsdatensatz wird markiert (z. B. „Nextcloud = Ja“), damit nichts doppelt verarbeitet wird.

    Datenschutz & Governance

    • Keine Fremdquellen: Die KI nutzt nur die gelieferten Assets + Felder.
    • Entwurf statt Autopublish: Redaktionelle Kontrolle bleibt beim Team.
    • EU-Hosting möglich, klare Zugriffsrechte und Protokollierung.
    • Transparenz: info.txt sichert Kontext & Nachvollziehbarkeit pro Beitrag.

    Konkrete Vorteile für den Kunden

    • Zeitgewinn: Aus Rohmaterial wird in Minuten ein vollständiger Draft.
    • Konsistenz: Einheitliche Struktur, sauberer HTML-Aufbau, SEO-Grundlagen automatisch.
    • Medien korrekt eingebunden: Featured Image, Alt-Texte/Caption-Vorschläge, saubere Dateinamen.
    • Weniger Fehlerquellen: Automatisierte Pfade, Status-Flags, klare Logs.
    • Skalierbar: Funktioniert für wiederkehrende Formate (Baustellen-Update, Referenz, Produkt-Notiz).

    Technische Eckpunkte (Auszug)

    • Trigger: alle 10 Minuten; filtert auf Status „Ready“ und „nicht verarbeitet“.
    • Storage: Nextcloud-Ordner je Beitrag; info.txt mit Metadaten.
    • Media Pipeline: HTTP-Download → WP Media Upload → Rückgabe media_id.
    • Content-Engine: Vision-Analyse → LLM-Chain → valide JSON-Antwort mit content_html.
    • WordPress-API: POST /wp/v2/posts (draft), anschließend PATCH mit featured_media.
    • Fail-safes: MIME-Check (nur Bildformate), Timeouts, klare Fehlerpfade (kein Autopublish).

    Typische Redaktionelle Checks (1–3 Minuten)

    • Titel leicht zuspitzen, Excerpt finalisieren.
    • Interne Links prüfen (passen die Zielseiten?).
    • Zwei, drei Wörter im „Technische Eckpunkte“-Block verfeinern.
    • Veröffentlichen.

    Fazit

    Die Erweiterung macht aus vorhandenen Medien in einem Rutsch einen sauberen Blogentwurf – mit Bild, Struktur und SEO-Grundlagen. Das Team fokussiert sich auf Qualität & Freigabe, der Rest läuft reproduzierbar im Hintergrund. Ergebnis: mehr Inhalte, weniger Aufwand, konsistent im Markenstil.

  • Kontaktformular-Pipeline mit n8n: Mautic → Datenbereinigung → Airtable

    Kontaktformular-Pipeline mit n8n: Mautic → Datenbereinigung → Airtable

    Kurzfassung: Ein Webhook nimmt Mautic-Formularsendungen entgegen, bereinigt Felder (z. B. Anrede & Newsletter-Opt-in) und legt die Datensätze standardisiert in Airtable an. So landen Leads sauber strukturiert im CRM-Backlog – inklusive Status „Todo“ für die weitere Bearbeitung.

    Ausgangslage & Ziel

    Formulare liefern oft uneinheitliche Werte (z. B. „geehrter Herr“, „w“, „1/0“). Ziel war eine robuste, nachvollziehbare Lead-Erfassung, die:

    • Eingaben vereinheitlicht (Anrede, Newsletter),
    • Dubletten vermeidet (saubere Felder & Mapping),
    • Leads direkt in Airtable bereitstellt – bereit für Follow-ups.

    Funktionsweise (End-to-End)

    1. Webhook aus Mautic
      Das Formular sendet per POST an n8n (Header-Auth). Der Node „From Mautic+“ nimmt die Felder entgegen (Vorname, Nachname, Firma, Adresse, Nachricht, Newsletter etc.).
    2. Datenbereinigung (Code-Node „Umschreiben“)
      • Entfernt Zero-Width-/Sonderzeichen & Mehrfach-Spaces.
      • Anrede-NormalisierungMann | Frau | Divers (erkennt Varianten wie „geehrter Herr“, „m/w/d“).
      • Newsletter-Opt-inJa | Nein (akzeptiert 1/0, true/false, on/off, ja/nein, yes/no).
    3. Airtable-Create
      • Mapping auf Felder wie Vorname, Nachname, Firma, Straße, PLZ, Stadt, Telefon, E-Mail, Nachricht, Anrede, Newsletter.
      • Status = „Todo“ für den Start im Sales-/Support-Prozess.

    Vorteile

    • Konsistente Datenqualität: Einheitliche Anrede & Opt-in-Werte, weniger Nacharbeit.
    • Schnelle Übergabe: Leads landen direkt in Airtable (Listen, Kanban, Automationen).
    • Nachvollziehbar: Bereinigungslogik in n8n klar dokumentiert & versionierbar.
    • DSGVO-freundlich: Minimalprinzip, klare Transportwege, kein unnötiges Speichern.

    Best Practices & Erweiterungen

    • Double-Opt-In über Mautic automatisieren und in Airtable spiegeln.
    • Duplikat-Check (E-Mail/Telefon) vor Anlage.
    • Benachrichtigungen (E-Mail/Slack/Teams) bei neuen „Todo“-Leads.
    • Validierung (z. B. PLZ-Muster, Pflichtfelder) im n8n-Flow.
    • Datenhaltung EU-basiert und Rollenrechte in Airtable prüfen.

    Fazit

    Mit n8n als Orchestrator wird aus einem einfachen Kontaktformular eine verlässliche Lead-Pipeline: sauber bereinigt, korrekt klassifiziert und sofort bearbeitbar im Team-Workflow.


  • WhatsApp-Assistent mit n8n: Multimodale Kundenkommunikation (Text, Bild, Stimme)

    WhatsApp-Assistent mit n8n: Multimodale Kundenkommunikation (Text, Bild, Stimme)

    Kurzfassung: Für einen Kunden haben wir einen WhatsApp-Assistenten umgesetzt, der Text, Sprachnachrichten, Bilder und Dokumente verarbeitet. Der Bot nutzt n8n als Orchestrierung, Azure OpenAI für die Antwortlogik, on-prem STT/OCR für Sprache & Dokumente sowie Twilio für die Zustellung. Sessions werden pro Kontakt gespeichert, Antworten sind präzise, auditierbar und mobilfreundlich.

    Ausgangslage & Ziel

    Kundenanfragen kommen heute über verschiedene Formate – kurze Texte, Sprachnachrichten, Fotos von Dokumenten. Ziel war ein robuster, datenschutzfreundlicher Kommunikationsfluss, der alles automatisch versteht, sinnvoll beantwortet und bei Bedarf Termine direkt anlegt.

    Funktionsweise (End-to-End)

    1. Eingang über WhatsApp/SMS (Twilio)
      Der Webhook nimmt eingehende Nachrichten entgegen und erkennt den Nachrichtentyp: Text, Audio, Bild, Dokument.
    2. Intelligente Vorverarbeitung
      • Text: wird direkt in den Agent übergeben.
      • Audio: Speech-to-Text via on-prem STT (lokaler Endpunkt).
      • Bild/Dokument: OCR via on-prem Service (lokaler Endpunkt).
      • Kleine Robustheit: automatische Korrektur von MIME-Types bei Audio, damit alles sauber verarbeitet wird.
    3. Gedächtnis (Session Memory)
      Pro WhatsApp-Kontakt wird ein kurzer Kontextverlauf gespeichert (Session-Key), damit Rückfragen natürlich wirken (z. B. Nachname, gewünschte Uhrzeit).
    4. AI-Agent (Tools-first)
      Ein klarer System-Prompt steuert den Stil:
      • präzise, mobilfreundlich, ohne Spekulation
      • kann Dateien analysieren, Bilder beschreiben, Sprachinhalte transkribieren
      • erkennt, wenn Angaben fehlen, und fragt gezielt nach
      • hält Privacy-Regeln ein (keine Speicherung sensibler Daten)
    5. Optionale Terminvergabe
      Der Agent ruft freigegebene HTTP-Tools auf:
      • Mitarbeiter & Services anzeigen
      • Kalenderdaten prüfen
      • Termin anlegen (Start/Ende, Mitarbeiter, Service)
    6. Antwort & Ausgabe
      • Standard: Textantwort zurück an WhatsApp
      • Optional: Text-to-Speech (on-prem TTS) → Voice-Reply
      • Fallback-Message, wenn ein Dateityp nicht unterstützt wird

    Datenschutz & Compliance

    • DSGVO-freundlich: Verarbeitung bevorzugt EU-basiert; Sprache/OCR laufen auf eigenen Endpunkten.
    • Transparenz: Kein unkontrolliertes Speichern sensibler Inhalte; klare Fehler- und Limit-Hinweise.
    • Minimalprinzip: Nur notwendige Metadaten; kein Teilen zwischen Sessions.

    Nutzen für das Team

    • Schnellere Antworten – unabhängig vom Format der Anfrage
    • Weniger Rückfragen – strukturierte Nachfragen nur bei fehlenden Pflichtangaben
    • Weniger Tool-Hopping – Terminvergabe direkt im Chat
    • Skalierbar – weitere Dienste (z. B. FAQs, Bestellstatus) lassen sich per Tool anbinden

    Technischer Überblick (ausgewählte Bausteine)

    • n8n als Orchestrator (Routing, Typ-Erkennung, Sessions, Fehlerbehandlung)
    • Azure OpenAI (Chat-Modell) mit klaren Antwortregeln
    • On-prem STT/OCR/TTS für Sprache, Bilder, Dokumente
    • Twilio für WhatsApp/SMS-Ein- und Ausgang
    • Robustheit: MIME-Fix für Audio, Fallback-SMS, strukturierte JSON-Outputs

    Ergebnis

    Der Assistant beantwortet multimodale Anfragen zuverlässig, reduziert die Bearbeitungszeit und ermöglicht self-service Terminbuchung – ohne Medienbrüche und mit compliance-gerechter Verarbeitung.

  • Industrie-Chatbot mit n8n: Tool-Orchestrierung statt Halluzinationen

    Industrie-Chatbot mit n8n: Tool-Orchestrierung statt Halluzinationen

    Kurzfassung: Für einen Industrie-Kunden haben wir einen Chatbot implementiert, der Nutzerfragen nicht „aus dem Kopf“ beantwortet, sondern gezielt angebundene Tools nutzt: Artikel-Lookup, Datenblattabruf und Wissenszugriff – alles protokolliert, reproduzierbar und DSGVO-konform. Der Bot läuft auf n8n mit OpenAI-kompatibler Webhook-Schnittstelle und Azure OpenAI (EU-Kontext), inklusive Sessionspeicher und Intent-Routing.

    Ausgangslage & Ziel

    Technische Anfragen zu Industrieartikeln sind komplex: Artikelnummern variieren, Nachfolger existieren, und Spezifikationen müssen belastbar sein. Ziel war ein robuster Chat-Workflow, der:

    • Nutzerfragen annimmt (OpenAI-API-kompatibel),
    • Intent & Parameter (z. B. Artikelnummer, Hersteller) sauber extrahiert,
    • hersteller-spezifische Datenquellen bzw. freigegebene Crawler/Workflows ansteuert,
    • nur belegbare Informationen zurückgibt – mit Quellen aus den Tools.

    Architektur im Überblick

    • Webhook (POST /v1/chat/completions): OpenAI-kompatible Endpoint-Struktur für einfache Integration.
    • Pre-Processing („Vereinfachen“): Extrahiert Session-Key, letzte Usernachricht, Metadaten (IP/User-Agent optional).
    • Intent-Router („Qualifikation“): Klassifiziert Anfrage (z. B. article_lookup, free_text_search, knowledge_db_query) und liefert ein valide geparstes JSON.
    • Memory (Session): Buffer Window Memory per Session-Key für zusammenhängende Dialoge.
    • Orchestrator-Agent: Strenge Tools-first-Policy: Erst passende Workflows aufrufen (z. B. Artikel-Lookup, PDF-Abruf, Parser, Specs-Extraktion), dann antworten.
    • Tool-Workflows:
      • Hersteller-spezifische Pull-Workflows (nur wenn freigegeben).
      • Fallback-Crawler für generische Abfragen.
    • Compliance & Determinismus: Keine freien Vermutungen, nur toolbasierte Ergebnisse mit Quellen.
    • Response-Formatter: Konvertiert die Ausgabe in ein OpenAI-API-konformes Chat-Completion-Objekt.

    Wichtiger Hinweis: Es werden keine vertraulichen/geschützten Inhalte offengelegt. Der Beitrag enthält keine Details zu konkreten Scraping-Zielen oder proprietären Endpunkten.

    Funktionsweise Schritt für Schritt

    1. Request entgegennehmen: Client postet Chat-Nachrichten an den Webhook (OpenAI-Format).
    2. Session & Frage extrahieren: Session-Key, letzte Userfrage, gewünschtes Modell.
    3. Intent-Erkennung: Parser liefert rein JSON-basiert: Intent, Sprache, erkannte Artikelnummer/Hersteller, Confidence.
    4. Tool-Planung: Orchestrator wählt das zuständige Workflow-Tool (z. B. Hersteller-Lookup → Datenblatt → Parser → Specs).
    5. Ausführung & Validierung: Ergebnisse werden auf Vollständigkeit geprüft (z. B. Spannung, Strom, Abmessungen, IP-Schutzklasse).
    6. Antwort bauen: Knapp, sachlich, mit Quellen (nur aus Tool-Outputs).
    7. Rückgabe: OpenAI-kompatibles JSON (choices, message, usage).

    Warum dieser Ansatz?

    • Verlässlich statt generativ unscharf: Der Bot „weiß“ nichts – er verwaltet Wissen und zitiert nur Tool-Ergebnisse.
    • Auditierbar: Jeder Schritt ist in n8n nachvollziehbar (Logs, Status).
    • Skalierbar: Neue Hersteller/Datenquellen werden als Tool-Workflow ergänzt.
    • EU & DSGVO: Betrieb mit Azure OpenAI (EU-Konfiguration) und klaren Zugriffs-/Compliance-Regeln.

    Sicherheits- & Compliance-Prinzipien

    • Tools-first, Knowledge-last: Keine Freitexterfindungen.
    • Quellenpflicht: Nur verlinkte/benannte Tool-Outputs.
    • Minimal-Rückfragen: Nur wenn essenzielle Parameter fehlen (z. B. Hersteller, MLFB).
    • Keine Secrets/IDs im Output, keine personenbezogenen Daten ohne Freigabe.
    • EU-Hosting präferiert, Logs & Rechtekonzepte inklusive.

    Nutzen für Fachabteilungen

    • Schnellere Antworten auf wiederkehrende Technikfragen.
    • Weniger Rückfragen durch saubere Parametrisierung und Nachfolger-Hinweise.
    • Wissensentlastung im Support: Der Bot übernimmt Erstklärung & Spezifikats-Auszug.
    • Konsistente Qualität dank deterministischer Pipelines.

    Erweiterungen (Roadmap)

    • Streaming-Antworten am Webhook für Live-Token-Output.
    • Mehrsprachigkeit mit Terminologie-Glossar.
    • RAG auf freigegebenen internen Dokumenten (rollenbasiert).
    • Telemetry & Monitoring (Fehlerraten, Tool-Latenzen, Antwortqualität).
    • Admin-Konsole zum Verwalten von Tools, Limits, Session-Policies.

    Fazit

    Mit n8n als Orchestrierungs-Layer und Azure OpenAI als Modell-Backend entsteht ein verlässlicher Industrie-Chatbot, der nur belegbare Informationen aus angebundenen Hersteller-/Wissens-Workflows liefert. Das reduziert Fehlantworten, schafft Vertrauen und spart Support-Zeit – DSGVO-konform und erweiterbar.

  • Medien-Workflow automatisieren mit n8n, Nextcloud & Airtable (DSGVO-konform)

    Medien-Workflow automatisieren mit n8n, Nextcloud & Airtable (DSGVO-konform)

    Kurzfassung: Dieser Workflow automatisiert die Ablage von Social-Media-Assets: Inhalte werden aus Airtable gelesen, in Nextcloud strukturiert abgelegt, Metadaten als info.txt gespeichert und der Datensatz anschließend markiert. Das Ganze läuft mit n8n, ist DSGVO-konform und eignet sich perfekt für KMU, die wiederkehrende Medienprozesse standardisieren möchten.

    Ausgangslage & Ziel

    Viele Teams verteilen Bilder, Videos und Texte über E-Mail, Chat oder lokale Ordner. Ergebnis: Duplikate, Versionschaos und Zeitverlust.
    Ziel: Ein zentraler, reproduzierbarer Prozess, der Social-Media-Assets automatisch herunterlädt, sauber benennt, in einer EU-gehosteten Nextcloud ablegt und im Quellsystem den Status aktualisiert.

    Kern-Keywords: n8n Automatisierung, Nextcloud Hosting, Airtable Integration, DSGVO, Medien-Workflow, Docker

    Architektur im Überblick

    • Airtable dient als Content-Quelle (Titel, Text, Tags, Medienlinks, Status).
    • n8n orchestriert den Prozess (Zeitplan, Logik, Downloads, Uploads).
    • Nextcloud ist die zentrale, DSGVO-konforme Ablage (EU-Hosting).
    • Docker ermöglicht ein schlankes, wartbares Hosting-Setup.

    Der Workflow Schritt für Schritt

    1. Trigger (Zeitplan): Ein Schedule Trigger prüft in regelmäßigen Abständen (z. B. minütlich), ob neue Inhalte bereitstehen.
    2. Suche in Airtable: Mit filterByFormula werden Datensätze mit Status Ready gefunden, die noch nicht in Nextcloud liegen.
    3. Vorbereitung (Code-Node):
      • Aus Datum, Titel und ID wird ein sprechender Ordnername generiert, z. B. 2025-09-10_Titel_12345.
      • Medien-Assets (Fotos/Videos) werden aus den Feldern gesammelt.
      • Metadaten wie Text und Tags werden übernommen.
    4. Ordner anlegen (Nextcloud): Der Workflow erstellt den Zielordner in Nextcloud – ohne führenden Slash, damit die Pfade konsistent bleiben.
    5. Assets verarbeiten:
      • Split/Loop: Jedes Asset wird einzeln heruntergeladen (HTTP Request) und in den Ordner hochgeladen.
      • Dadurch sind auch große Uploads robust und nachvollziehbar.
    6. info.txt erzeugen:
      • Eine info.txt fasst Ort (Pfad), Text und Tags zusammen.
      • Sie wird als Datei konvertiert und ebenfalls in den Ordner hochgeladen.
    7. Airtable-Update: Nach erfolgreicher Ablage setzt n8n im Datensatz das Feld Nextcloud = Ja. So ist jeder Schritt auditierbar und doppelte Verarbeitung wird vermieden.

    Warum das funktioniert

    • Standardisierte Benennung: Datum_Titel_ID sorgt für Ordnung und schnelle Suche.
    • Nachvollziehbarkeit: Die info.txt dokumentiert Kontext & Tags direkt am Speicherort.
    • Zuverlässigkeit: Batch-Verarbeitung und Timeouts verhindern Abbrüche bei großen Dateien.
    • Datenschutz: Nextcloud in der EU und klare Zugriffsrechte unterstützen DSGVO-Konformität.

    Vorteile für KMU

    • Zeitersparnis: Keine manuelle Dateiablage, kein Copy-&-Paste.
    • Weniger Fehler: Automatische Status-Updates in Airtable.
    • Transparenz: Jede Veröffentlichung hat einen eindeutigen Ordner mit Metadaten.
    • Skalierbar: Neue Kanäle/Teams integrieren, ohne Abläufe zu ändern.

    Erweiterungen (Best Practices)

    • Monitoring & Alerts: Fehlerbenachrichtigungen per E-Mail oder Slack/Teams.
    • Bild-/Videopipeline: Optionale Konvertierung/Komprimierung vor Upload.
    • Versionierung: Sperr- und Freigabe-Workflows (QA → On Air).
    • Rechte & Rollen: Rollenkonzepte in Nextcloud, 2FA, Offsite-Backups.
    • Publishing-Schritt: Anbindung an Mautic/Shop/CRM oder Social-Scheduling.

    Fazit

    Mit n8n, Airtable und Nextcloud entsteht ein robuster Medien-Workflow, der Ordnung schafft, Zeit spart und Datenschutzanforderungen erfüllt. Ideal für Teams, die regelmäßig Content produzieren und eine saubere, skalierbare Ablage benötigen.

WordPress Appliance - Powered by TurnKey Linux