Bauen Sie Ihren ersten KI-Agenten mit Gedächtnis
Agent vs. Chatbot: Was ist der Unterschied
Ein Chatbot beantwortet Nachrichten unabhängig voneinander. Jedes Gespräch ist isoliert. Wenn Sie gestern Ihren Namen genannt haben, weiß er ihn heute nicht mehr.
Ein Agent hat 3 zusätzliche Eigenschaften:
1. Persistentes Gedächtnis: erinnert sich zwischen Sitzungen an Sie
2. Werkzeuge: kann externe APIs aufrufen (Google durchsuchen, E-Mails senden, Code ausführen)
3. Planung: kann komplexe Aufgaben in Schritte zerlegen
In diesem Kurs konzentrieren wir uns auf (1): persistentes Gedächtnis. Werkzeuge und Planung sind separate Kurse.

Grundlegende Speicherarchitektur
Was der Agent über Sie speichern muss:
- Deklarative Fakten: "Pedro arbeitet mit Python", "trinkt Kaffee ohne Zucker", "wohnt in São Paulo"
- Präferenzen: "antworte auf formales pt-BR", "kurze Erklärungen, ohne Ausschmückung"
- Interaktionsverlauf: Zusammenfassung der letzten N Dialoge
- Flüchtiger Kontext: was Sie GERADE tun (wird nach der Sitzung gelöscht)
Speichermuster:
`
memoria_usuario = {
"facts": [
{"text": "Pedro arbeitet mit Python", "pinned": False},
{"text": "bevorzugt kurze Antworten", "pinned": True}
],
"summary_last_10_sessions": "Benutzer hat über TLS, APIs und Authentifizierung gelernt...",
"preferences": {"response_language": "pt-BR", "tone": "technical"}
}`
Wie Brainiall das macht
Unser Backend implementiert bereits persistentes Gedächtnis. Sie können:
1. Auf das 🧠-Symbol in der Chat-Sidebar klicken
2. Eine Liste von Fakten anzeigen, die die KI über Sie gelernt hat
3. Wichtige Fakten anpinnen (niemals vergessen)
4. Bearbeiten oder löschen
5. Das Gedächtnis über einen Toggle deaktivieren
Intern verwenden wir:
- PostgreSQL JSONB zum Speichern von Fakten pro Benutzer
- Eviction policy: maximal 50 nicht angepinnte Fakten, älteste werden zuerst entfernt
- Extraction: alle 10 Nachrichten liest das LLM das Gespräch und schlägt neue Fakten zur Genehmigung vor
- Retrieval: vor dem Antworten werden relevante Fakten gesucht und in den Prompt injiziert
Aufbau Ihres Agenten über die API
Minimalistisches Python-Beispiel:
`python
import httpx
BASE = "https://api.brainiall.com"
KEY = "brnl-xxxxx"
def chat(message, user_memory):
# Inject memory as system prompt context
memory_text = "\n".join(f"- {f}" for f in user_memory["facts"])
system = f"Du bist ein persönlicher Assistent. Über den Benutzer:\n{memory_text}"
r = httpx.post(
f"{BASE}/v1/chat/completions",
json={
"model": "claude-sonnet-4-6",
"messages": [
{"role": "system", "content": system},
{"role": "user", "content": message}
]
},
headers={"Authorization": f"Bearer {KEY}"}
)
return r.json()["choices"][0]["message"]["content"]
# Verwendung
memory = {"facts": ["Pedro arbeitet mit Python", "mag Kaffee ohne Zucker"]}
print(chat("Was habe ich heute Morgen getrunken?", memory))
# → "Du hast wahrscheinlich einen Kaffee ohne Zucker getrunken, oder?"`
Dies ist ein grundlegender Agent. Das Hinzufügen einer automatischen Extraktion (LLM liest und extrahiert neue Fakten) und eines Retrievals (nur relevante Fakten einzufügen) würde den Code auf ~100 Zeilen bringen.
Häufige Fallstricke
- Aufgeblähter Speicher: ohne Eviction wächst der Speicher, bis das Token-Limit überschritten wird
- Widersprüchliche Fakten: „Pedro mag Kaffee" + „Pedro hat aufgehört, Kaffee zu trinken" — welches hat Vorrang?
- Datenschutz: der User muss immer in der Lage sein, Einträge zu sehen + zu bearbeiten + zu löschen
- Falscher Scope: Arbeitserinnerungen dürfen nicht in persönliche Chats durchsickern
- Drift: LLM kann falsche Fakten erfinden, wenn der Prompt mehrdeutig ist; immer vor dem Persistieren validieren

Anwendungsfälle
- Persönlicher Tutor: merkt sich, welche Themen du beherrschst oder wo du Schwierigkeiten hast
- Virtueller Ernährungsberater: Mahlzeitenhistorie, Vorlieben, Einschränkungen
- Karriere-Coach: merkt sich Ziele, aktuelle Erfolge, Verbesserungspunkte
- Schreibassistent: dein Stil, bevorzugter Ton, wiederkehrende Themen
- Interner technischer Support: merkt sich frühere Tickets, Systeme, die du verwendest
Teste jetzt gleich
Im Brainiall-Chat öffne ein Gespräch, erzähle etwas über dich, schließe es, öffne am nächsten Tag ein neues Gespräch – der Agent erinnert sich. Aktivieren/deaktivieren über das 🧠-Symbol in der Sidebar. Mit Pro für €5,49 gibt es vollständiges Gedächtnis; Free hat ein auf 10 Fakten begrenztes Gedächtnis.