Die meisten RAG-Tutorials im Netz zeigen das immer gleiche Spielzeug: „Chatten Sie mit Ihrem PDF“. Was dabei selten erwaehnt wird: Diese Demos sind weit von einem produktiven Einsatz entfernt. Sobald die Wissensbasis waechst, Dokumente aktualisiert werden oder Nutzer Fragen stellen, die niemand getestet hat, beginnen die Probleme. Genau an dieser Stelle setzt der hier beschriebene Ansatz an.
In seinem Video zeigt Cole Medin, wie sich mit den beiden Werkzeugen n8n (Workflow-Automatisierung, vergleichbar mit Make.com oder Zapier) und Supabase (Datenbankplattform mit Vektorunterstuetzung ueber PG Vector) ein RAG-KI-Agent aufbauen laesst, der naeher an der Praxis liegt als viele andere Anleitungen. Das Versprechen: kein Code, ueberschaubarer Aufwand, und ein Aufbau, der mit der Wissensbasis mitwaechst. Fuer Entscheider im Mittelstand ist das vor allem deshalb interessant, weil sich damit interne Dokumente, Protokolle oder Handbuecher durchsuchbar machen lassen, ohne ein Entwicklungsteam zu beschaeftigen.
- RAG (Retrieval Augmented Generation) verbindet ein Sprachmodell mit einer eigenen Wissensdatenbank, sodass der Agent auf Ihre Dokumente zugreift statt nur auf sein Trainingswissen.
- n8n uebernimmt die Automatisierung, Supabase dient gleichzeitig als Chat-Gedaechtnis und als Vektordatenbank.
- Der gesamte Aufbau funktioniert ohne Programmierung und ist laut Video in unter 15 Minuten eingerichtet.
- Zwei Details heben den Ansatz von oberflaechlichen Tutorials ab: ein skalierbarer Speicher fuer den Chatverlauf und das Loeschen veralteter Vektoren, um Duplikate zu vermeiden.
- Die kostenlose Stufe von Supabase reicht laut Video fuer den Einstieg vollkommen aus.

Was der Agent in der Praxis leistet
Die Funktionsweise wird im Video an einem einfachen Beispiel gezeigt. Zu Beginn ist die Wissensdatenbank leer, die zugehoerige Tabelle in Supabase enthaelt keine Eintraege. Eine Testfrage nach den Aufgaben aus einem Meeting kann der Agent folgerichtig nicht beantworten.
Anschliessend wird ein Dokument mit Besprechungsnotizen als Google-Doc in einem ueberwachten Ordner abgelegt. Innerhalb von etwa einer Minute laeuft im Hintergrund ein n8n-Workflow, der die Datei verarbeitet und in die Wissensdatenbank einfuegt. Danach erscheint in Supabase ein neuer Datensatz mit dem Seiteninhalt, den Metadaten (unter anderem der Google-Drive-Datei-ID) und dem sogenannten Embedding-Vektor. Stellt man dieselbe Frage erneut, liefert der Agent jetzt die korrekte Antwort aus dem Dokument. Aktualisierungen der Datei werden ebenfalls erkannt und nachgezogen.
Der Aufbau im Ueberblick
Der Workflow besteht aus zwei Teilen: dem eigentlichen Chat-Agenten und einer separaten Strecke, die Dokumente automatisch in die Wissensbasis einpflegt. Ein fertiges JSON-Template laesst sich laut Video aus einem GitHub-Repository herunterladen und ueber „Import from file“ in die eigene n8n-Instanz laden. Danach muessen nur die eigenen Zugangsdaten und der gewuenschte Ordner ergaenzt werden.
Supabase vorbereiten
Supabase wird mit einem GitHub-Konto eingerichtet. Zwei Bereiche der Projekteinstellungen liefern die benoetigten Zugangsdaten:
- Database: Host, Datenbankname, Port, Benutzer und Passwort fuer die Postgres-Verbindung. Diese Daten werden fuer das Chat-Gedaechtnis verwendet.
- API: die projektspezifische URL sowie das Service-Role-Secret. Diese Daten werden fuer die Vektordatenbank benoetigt.
Fuer die Vektorsuche stellt n8n in seiner Dokumentation fertigen SQL-Code bereit. Dieser wird einmalig im SQL-Editor von Supabase ausgefuehrt und legt automatisch die PG-Vector-Erweiterung, die Dokumententabelle und die Matching-Funktion fuer RAG an. Eigener Programmcode ist dafuer nicht noetig.
Der Chat-Agent
Der Agent wird durch einen Trigger „When a chat message is received“ gestartet. Dieser liefert zugleich ein Chat-Fenster direkt in n8n, mit dem sich der Agent ohne Deployment testen laesst. Bei Bedarf kann dieselbe Oberflaeche per fertigem Einbettungscode auf einer Website integriert werden. An den Agenten sind drei Bausteine angeschlossen:
- Chat-Modell: im Beispiel GPT-4o mini, angebunden ueber den OpenAI-API-Schluessel. Alternativ ist auch Anthropic moeglich.
- Chat-Gedaechtnis: hier wird bewusst Postgres ueber Supabase genutzt statt des oft empfohlenen lokalen Fensterspeichers. Der lokale Speicher belastet den n8n-Server und skaliert schlecht. Die benoetigte Tabelle legt n8n bei Bedarf selbst an.
- RAG-Werkzeug: das Tool „retrieve documents“ mit Supabase als Vektorspeicher, konfiguriert ueber Tabellenname und Abfragefunktion.
Dokumente automatisch einpflegen
Der zweite Teil des Workflows haelt die Wissensbasis aktuell. Ein Google-Drive-Trigger prueft in einem festgelegten Ordner regelmaessig auf neue oder geaenderte Dateien. Der weitere Ablauf:
- Die Datei-ID wird extrahiert und an die folgenden Schritte weitergegeben.
- Vorhandene Vektoren mit derselben Datei-ID werden in Supabase geloescht (dazu unten mehr).
- Die Datei wird heruntergeladen, Dokumente werden in Text und Google Sheets in CSV umgewandelt, um den reinen Textinhalt zu gewinnen.
- Der Text wird in die Vektordatenbank eingefuegt. Bei kleinen Dateien entfaellt das Aufteilen in Abschnitte; ansonsten kommt ein einfacher rekursiver Text-Splitter zum Einsatz.
Zwei Details, die ueber Praxistauglichkeit entscheiden
Der Beitrag hebt zwei Punkte hervor, die in vielen Tutorials fehlen und genau dort zu Problemen fuehren, wo es ernst wird.
Skalierbares Chat-Gedaechtnis
Der Verlauf eines Gespraechs wird haeufig lokal auf der n8n-Instanz gespeichert, weil das am einfachsten ist. Genau das ueberlastet den Server mit wachsender Nutzung. Die Auslagerung in eine Postgres-Datenbank bei Supabase ist der Schritt, der den Agenten wirklich belastbar macht.
Veraltete Vektoren loeschen
Der wichtigere Punkt betrifft Aktualisierungen. Die Vektor-Optionen in n8n arbeiten nicht als „Upsert“: Ein bestehender Vektor wird beim erneuten Einfuegen nicht ersetzt, sondern dupliziert, weil die Datei-ID nicht als Vektor-ID dient. Aktualisiert man dieselbe Datei mehrfach, sammeln sich Dubletten an, und die Antwortqualitaet leidet. Die Loesung im Workflow: Vor jedem Einfuegen werden alle Vektoren geloescht, deren Metadaten die Datei-ID des aktuellen Google-Drive-Dokuments tragen. Erst danach wird die neue, aktualisierte Version eingefuegt. So bleibt pro Dokument genau ein aktueller Datensatz erhalten.
Einordnung fuer Entscheider
Der gezeigte Aufbau ist ausdruecklich als solider Startpunkt gedacht, nicht als fertige Endloesung. Erweiterungen wie bessere semantische Suche oder eine zusaetzliche Schluesselwortsuche sind moeglich, werden aber bewusst offengelassen. Fuer eine erste produktionsnahe Wissensdatenbank ist der Ansatz dennoch tragfaehig.
Bemerkenswert ist die Kostenseite: Die kostenlose Supabase-Stufe genuegt laut Video fuer den Einstieg, ein Wechsel auf den kostenpflichtigen Plan lohnt erst beim Skalieren. Wer ohnehin mit n8n arbeitet, kann den Agenten mit den eigenen Dokumenten in kurzer Zeit aufsetzen, ohne externe Entwicklung zu beauftragen.
Fazit
Der Beitrag zeigt nuechtern und nachvollziehbar, wie sich ein RAG-KI-Agent mit n8n und Supabase ohne Programmierung umsetzen laesst. Der eigentliche Mehrwert liegt nicht im schnellen Demo-Effekt, sondern in zwei oft uebergangenen Details: einem skalierbaren Chat-Gedaechtnis und dem konsequenten Entfernen veralteter Vektoren. Genau diese Punkte entscheiden darueber, ob ein Agent bei wachsender Wissensbasis brauchbar bleibt oder mit der Zeit unzuverlaessig wird. Wer interne Dokumente durchsuchbar machen will, erhaelt hier eine pragmatische Blaupause, die sich Schritt fuer Schritt erweitern laesst.
Quelle: Cole Medin, „This RAG AI Agent with n8n + Supabase is the Real Deal“, https://www.youtube.com/watch?v=PEI_ePNNfJQ
