Schlagwort: Nextcloud Dokumentenmanagement

  • Engineering-RAG-Workflow für Elektro- & Maschinenbauprojekte

    Engineering-RAG-Workflow für Elektro- & Maschinenbauprojekte

    Live-Wissensdatenbank für Normen, Artikellisten, Kundenanforderungen und Projektdokumente

    In modernen Engineering-Projekten (Elektrokonstruktion, Maschinenbau, Automatisierung, Sondermaschinen) arbeiten Teams ständig mit komplexen Vorgabedokumenten, darunter:

    • Artikel- und Materiallisten
    • Kundenspezifikationen
    • Normensammlungen (DIN, ISO, VDE)
    • Freigabedokumente & Änderungsstände
    • EPLAN-Auszüge
    • Risikoanalysen
    • Lastenhefte und Funktionsbeschreibungen

    Diese Informationen müssen versioniert, durchsuchbar, projektbezogen, aktuell und teamweit verfügbar sein.

    Hier setzt unser RAG-unterstütztes Engineering-Wissenssystem an.


    🧠 Ziel des Systems

    Eine projektorientierte, KI-gestützte Live-Wissensdatenbank, die:

    • Automatisch Dokumente aus Nextcloud einliest
    • Texte, Tabellen, Normartikel, technische Inhalte extrahiert und strukturiert
    • OCR für gescannte PDFs nutzt
    • Alles in eine Postgres/PGVector-Datenbank schreibt
    • Änderungen in Echtzeit erkennt
    • Veraltete Daten automatisch löscht
    • Eine KI-Chatoberfläche (Open-WebUI) benutzt, um Fragen projektbezogen zu beantworten
    • Inhalte nicht erfindet, sondern nur referenziert
    • Tabellen per SQL auswertet (z. B. „zeige alle Artikelgrößen“, „max. Stromstärke“ usw.)
    • Bilder extrahiert, in Supabase lädt und korrekt im Markdown ausgibt

    Damit hat das Engineering-Team einen digitalen Projektingenieur, der alle Dokumente kennt, sie durchsucht, interpretiert und vergleicht.


    🏗️ Architekturüberblick

    Der Workflow besteht aus drei zentralen Bereichen:


    1️⃣ Dokument-Ingestion & Synchronisation (Nextcloud → RAG-Datenbank)

    🔁 Alle 5 Minuten:

    1. Nextcloud-Ordner scannen
      /Dokumente/n8n/RAG/…
    2. Gegen Postgres vergleichen (ETag + LastModified)
      ➜ nur neue oder geänderte Dateien werden eingelesen.
    3. Veraltete Einträge entfernen
      – aus:
      • document_metadata
      • document_rows
      • documents_pg (Vektorstore)
    4. Neue/aktualisierte Dateien einlesen
      • Dateityp bestimmen (PDF, Excel, CSV, DOCX …)
      • Tabellen extrahieren (CSV/XLSX)
      • Text extrahieren (Default Loader)
      • OCR verwenden wenn nötig
        (für gescannte PDFs ➜ Mistral OCR)
    5. Dokument in Chunks splitten + speichern
      ➜ als Vektoren in documents_pg

    Damit wird jede Änderung sofort übernommen.


    2️⃣ RAG-KI-Agent (Open-WebUI)

    Der Chat läuft über:

    • Azure OpenAI (DSGVO-konform)
      Modelle: gpt-5-mini, gpt-4.1-mini, Embeddings
    • Postgres Vektorsuche (PGVector)
    • KI-Gedächtnis über Postgres Chat Memory

    Der Agent erhält ein strenges System-Prompt:

    ✔ Keine Halluzinationen
    ✔ Immer RAG-Suche -> Dokumente referenzieren
    ✔ SQL-Abfragen für tabellarische Daten
    ✔ Markdown-strukturierte Antworten
    ✔ Anzeigen aller Bilder (automatisch aus Supabase)

    Beispielprompt:

    „Suche bitte die genaue Normstelle für Kurzschlussfestigkeit aus den hochgeladenen Kundenvorgaben.“

    Der Agent durchsucht:

    • kundenspezifische Vorgaben
    • Normen (z. B. DIN EN 61439)
    • technische Anhänge
    • Excel-Stücklisten
    • Tabellen zur Strombelastbarkeit
    • Maschinenrichtlinien-Auszüge

    und liefert exakte, belegte Antworten.


    3️⃣ Dynamischer Dokument-Parser

    (OCR → Bildextraktion → Supabase → Markdown-Rekonstruktion)

    Der zweite Workflow:

    1. Hochladen eines PDF/Dokuments zu Mistral API
    2. Generierung einer signierten URL
    3. OCR-Prozess mit:
      • Textextraktion
      • Erkennung aller Bilder
      • Erstellung natürlicher Bildbeschreibungen
    4. Speichern aller Bilder via Supabase
    5. Ersetzen aller inline-Bild-IDs im Markdown
    6. Zurückgeben eines vollständig rekonstruierten Markdown-Dokuments
      – mit Bildern
      – mit Bildbeschreibungen
      – perfekt geeignet für RAG

    Beispiel:

    ![page1_image3](page1_image3)
    
    → wird ersetzt durch →
    
    ![page1_image3](https://supabase.domain/storage/.../892173_page1_image3.png)
    
    Die Abbildung zeigt die Verdrahtung eines Motorschützes mit Überlastschutz…
    

    🛠️ Was wird gespeichert?

    1. document_metadata

    • file_id (ETag)
    • title
    • url (Nextcloud-Pfad)
    • last_modified
    • schema (bei Tabellen)

    2. document_rows

    • Jede Tabellenzeile als JSON
      Beispiel für Artikeldaten:
    {
      "Artikelnummer": "X20392",
      "Bezeichnung": "Sicherungsautomat 10A",
      "Hersteller": "Siemens",
      "Norm": "DIN EN 60898",
      "Strom": "10A"
    }
    

    3. documents_pg (Vektorstore)

    • alle Textchunks
    • inklusive OCR-Texte
    • inklusive Bildbeschreibungen

    ⚙️ Use-Cases in Engineering-Projekten

    🔌 Elektroplanung / Schaltschrankbau

    • automatische Ermittlung der richtigen Normstellen
    • Prüfung ob Komponenten normkonform sind
    • Zeigen von Artikeln aus einer Liste

    ⚙️ Maschinenbau / Mechanik

    • Normanforderungen für Sicherheit (z. B. ISO 12100)
    • automatisches Auslesen von Lastenheften
    • OCR lesbarer gescannter Werkstattnotizen
    • Inhaltliche Zusammenführer unterschiedlicher Revisionen

    📑 QM & Dokumentation

    • zentraler Norm-Wissensspeicher
    • projektbezogene Vorgabensammlung
    • automatisches Änderungsmanagement
    • Rückverfolgbarkeit aller Vorgaben

    💡 Engineering-KI | Beispielabfragen

    • „Welche Artikel sind im Projekt XY freigegeben?“
    • „Welche Norm fordert den Überstromschutz der 24V-Schiene?“
    • „Vergleiche die Kundenanforderungen Version 2.1 und 3.0.“
    • „Welche Motorleistung ist laut Vorgabe zulässig?“
    • „Liste alle Artikel mit größerem Nennstrom als 16A.“
    • „Welche Dokumente wurden seit gestern geändert?“

    📈 Vorteile für Engineering-Firmen

    ❤️ Für Konstrukteure

    • Keine Sucherei in 300 PDFs
    • Sofort Antworten auf Normfragen
    • Projektbezogene Wissensbasis — nie wieder alte Dokumentstände

    🧠 Für Projektleitung

    • Versionssicherheit
    • Vollautomatisches Änderungsmonitoring
    • Revisionssichere Ablage

    ⚡ Für die Firma

    • Weniger Fehler
    • Schnellere Konstruktion
    • Saubere, nachvollziehbare Dokumentation
    • Compliance-sichere Normanwendung

    🧩 Technologiestack

    BereichLösung
    DateiablageNextcloud
    OCRMistral
    KI ModelleAzure OpenAI (DSGVO)
    DatenbankSupabase Postgres + PGVector
    Orchestrierungn8n
    WorkspaceOpen-WebUI
    Embeddingstext-embedding-3-small
    RerankerCohere Reranker
    VersionierungETag + LastModified Vergleich

    🎯 Fazit

    Dieser Workflow transformiert deine Engineering-Firma in einen datenbasierten, KI-gestützten High-Performance-Prozess:

    ✔ alle Kundenvorgaben
    ✔ alle Normen
    ✔ alle Artikellisten
    ✔ alle Freigaben
    ✔ alle Projektfiles
    ✔ alle Tabellen
    ✔ alle Bilder
    ✔ alle OCR-Inhalte

    werden vollautomatisch eingelesen, versioniert, durchsuchbar gemacht, mit KI analysierbar und projektbezogen live aktuell gehalten.

WordPress Appliance - Powered by TurnKey Linux