Interne Wissens-KI: DSGVO-konformer RAG-Assistent (On-Premise)
Interne Wissens-KI aufbauen ohne Datenabfluss — ein RAG-Chatbot beantwortet Team-Fragen aus Confluence, Jira und Git-Repos, komplett On-Premise, mit Quellenangaben und Berechtigungsprüfung statt Halluzinationen.
„Frag mal Markus, der weiß das." — Markus ist im Urlaub. Oder seit drei Monaten nicht mehr im Unternehmen.
Das Wissen ist ja da: in Confluence-Seiten, Jira-Tickets, README-Dateien, alten Architektur-Entscheidungen. Nur findet es niemand. Also wird dieselbe Frage zum vierten Mal im Team-Chat gestellt, der Senior-Entwickler unterbricht zum vierten Mal seine Arbeit — und die Doku, die es beantwortet hätte, bleibt ungelesen.
Die naheliegende Abkürzung — interne Doku in ein öffentliches KI-Tool kopieren — ist für viele Unternehmen keine Option. Quellcode, Kundendaten, Betriebsgeheimnisse in einer fremden Cloud? Eben.
Dieser Showcase zeigt den anderen Weg: eine Wissens-KI, die im eigenen Netz läuft, nur antwortet, was sie belegen kann, und nur zeigt, was der Fragende sehen darf.
Automatisierungs-Workflow
So beantwortet die interne Wissens-KI eine Frage — Schritt für Schritt, mit Berechtigungsprüfung und Quellenpflicht
Vorher vs. Nachher
| Aspekt | Vorher | Nachher |
|---|---|---|
| Wissenssuche | 20–30 Min über Confluence, Jira, Chats | Eine Frage, Antwort in Sekunden |
| Datenfluss | Copy-Paste in externe KI-Tools | 100% On-Premise, nichts verlässt das Netz |
| Verlässlichkeit | Veraltete Doku, Hörensagen | Jede Antwort mit Quellenlink und Stand |
| Zugriffsschutz | Wissen per Zuruf, unkontrolliert | Antworten respektieren Berechtigungen |
Die Herausforderung
Entwicklungs- und Engineering-Teams verlieren täglich Zeit mit Wissenssuche: Die Antwort existiert irgendwo in Confluence, Jira, GitLab oder auf Netzlaufwerken — aber die Suche dauert 20 bis 30 Minuten oder endet beim erfahrensten Kollegen, der dadurch selbst nicht mehr zum Arbeiten kommt. Bei neuen Mitarbeitenden zieht sich die Einarbeitung über Monate, weil Wissen nur über Zuruf weitergegeben wird.
Gleichzeitig verbieten Datenschutz und IP-Schutz die einfache Lösung: Interne Dokumentation, Quellcode oder Kundendaten dürfen nicht in öffentliche KI-Dienste kopiert werden. Gerade in regulierten oder sicherheitskritischen Umfeldern kommt hinzu: Nicht jeder darf alles sehen. Ein Wissens-Chatbot, der Berechtigungen ignoriert, wäre ein größeres Risiko als gar keiner. Und ein Chatbot, der bei Wissenslücken überzeugend klingende Antworten erfindet, untergräbt das Vertrauen schneller, als er Nutzen stiftet.
Unsere Lösung
Die Referenzarchitektur besteht aus zwei Teilen: einer Indexierungs-Pipeline und einem Antwort-Workflow — beides läuft vollständig auf eigener Infrastruktur.
Die Indexierungs-Pipeline synchronisiert nachts per n8n die Wissensquellen: Confluence-Seiten, Jira-Tickets, GitLab-READMEs und Architektur-Dokumente. Vor der Einbettung in die Vektor-Datenbank (Qdrant) läuft jedes Dokument durch einen Redaktionsfilter, der API-Keys, Tokens, Zugangsdaten und personenbezogene Daten erkennt und entfernt. Zu jedem Textabschnitt werden die Original-Berechtigungen (ACLs) des Quellsystems mitgespeichert.
Im Antwort-Workflow stellt ein Mitarbeiter seine Frage per Web-Oberfläche oder Slack. Nach SSO-Anmeldung sucht das System die relevantesten Textabschnitte — gefiltert auf Quellen, die der Fragende auch im Quellsystem sehen dürfte. Ein lokal betriebenes LLM (z. B. Llama über Ollama, per Docker auf eigener GPU-Hardware) formuliert daraus die Antwort — mit einer harten Regel: Jede Aussage braucht eine Quellenangabe mit Link und Stand. Findet die Suche keine belastbare Quelle, antwortet das System ehrlich „dazu habe ich keine dokumentierte Antwort" und nennt den zuständigen Ansprechpartner, statt zu halluzinieren. Jede Frage und Antwort landet in einem Audit-Log mit definierten Löschfristen.
Hauptmerkmale
100% On-Premise LLM
Das Sprachmodell läuft per Ollama und Docker auf eigener Hardware. Keine API-Calls nach außen, keine Trainingsnutzung Ihrer Daten, volle Kontrolle über Modell und Updates.
Berechtigungsbewusste Suche (RAG)
Die Vektor-Suche filtert auf Dokumente, die der Fragende im Quellsystem sehen darf. Berechtigungen aus Confluence, Jira und GitLab werden beim Abruf durchgesetzt — nicht nachträglich.
Quellenpflicht statt Halluzination
Jede Antwort verlinkt die zugrunde liegenden Dokumente mit Stand. Ohne belastbare Quelle antwortet das System ehrlich mit „weiß ich nicht" und nennt den fachlichen Ansprechpartner.
Secrets- & PII-Redaktion
Vor der Indexierung erkennt und entfernt ein Filter API-Keys, Tokens, Zugangsdaten und personenbezogene Daten — sensible Inhalte landen gar nicht erst im Suchindex.
Ergebnisse
Möglicher Aufbau, kein fertiges Produkt
Die dargestellten Zahlen sind Zielwerte und Erwartungswerte für einen möglichen Aufbau – basierend auf Branchen-Benchmarks, öffentlichen Studien zu vergleichbaren Setups und unseren eigenen Tests mit echtem Stack. Es handelt sich nicht um gemessene Ergebnisse aus einem konkreten Kundenprojekt; tatsächliche Werte hängen von Unternehmensgröße, Prozessreife und Integrationstiefe ab. Wir bieten diesen Aufbau nicht als fertiges Produkt an. Wir helfen Teams, Prozesse zu konzipieren, zu automatisieren und intern zu betreiben – über Architektur-Beratung, Workshops und Implementierungs-Unterstützung mit n8n. Für regulierte Drittsysteme mit Zertifizierungs- oder Lizenzanforderungen (z. B. KIS, gematik, DATEV-zertifiziert) ergänzen wir uns mit spezialisierten Partnern.
Wissensfragen in Sekunden statt halbstündiger Suche — vollständig On-Premise, jede Antwort mit Quellenbeleg, kein Datenabfluss in externe Clouds
Integrationen
Nahtlose Anbindung an Ihre bestehende Infrastruktur
Ollama (On-Premise LLM)
KI-EngineLokal betriebenes offenes Sprachmodell auf eigener GPU-Hardware — Antwortgenerierung ohne externe API
Qdrant
Vektor-DatenbankSemantische Suche über alle indexierten Wissensquellen mit ACL-Filterung pro Anfrage
Confluence & Jira
WissensquellenNächtliche Synchronisation von Seiten und Tickets inklusive Original-Berechtigungen
GitLab
Code & DokuREADMEs, Architektur-Entscheidungen und Wikis aus den Repositories — mit Secrets-Filter
Keycloak
SSO & BerechtigungenSingle Sign-On und Gruppenauflösung — bestimmt, welche Quellen pro Nutzer durchsucht werden
Sicherheit & Compliance
Enterprise-ready mit höchsten Sicherheitsstandards
100% On-Premise
LLM, Vektor-Datenbank und Workflows laufen vollständig auf eigener Infrastruktur. Keine externen KI-APIs, einsetzbar auch in abgeschotteten Netzen.
Berechtigungs-Vererbung
Zugriffsrechte aus Confluence, Jira und GitLab werden bei jeder Suche durchgesetzt. Niemand bekommt Antworten aus Dokumenten, die er nicht öffnen dürfte.
Secrets-Redaktion
API-Keys, Tokens und Zugangsdaten werden vor der Indexierung erkannt und entfernt — sie erreichen den Suchindex gar nicht erst.
Audit-Log & DSGVO
Jede Frage und Antwort wird revisionssicher protokolliert, mit definierten Löschfristen und Auskunftsfähigkeit nach DSGVO.
Technologie-Stack
Häufige Fragen
Ähnliche Showcases
KI-Chatbot für automatisierte Kundenkommunikation
Intelligenter KI-Chatbot erstellen und Kundenkommunikation Software nahtlos integrieren — automatische Beantwortung von Kundenanfragen mit GPT-4, Ticket System Software und menschlicher Eskalation bei Bedarf.
Digitale Dokumenten-Freigabe
Automatisierte Genehmigungsworkflows mit 75% schnelleren Freigabezyklen
Engpassdiagnose – als eigenständiges Tool
Schnell prüfen, wo in Ihren Abläufen Zeit und Geld verloren gehen: die Engpassdiagnose gibt es auch als eigenes Tool unter engpassdiagnose.de.