Bauen Sie Ihren ersten KI-Agenten mit Gedächtnis

intermediario · 12 min · Por Ana Brainiall

Agent vs. Chatbot: Was ist der Unterschied

Ein Chatbot beantwortet Nachrichten unabhängig voneinander. Jedes Gespräch ist isoliert. Wenn Sie gestern Ihren Namen genannt haben, weiß er ihn heute nicht mehr.

Ein Agent hat 3 zusätzliche Eigenschaften:

1. Persistentes Gedächtnis: erinnert sich zwischen Sitzungen an Sie
2. Werkzeuge: kann externe APIs aufrufen (Google durchsuchen, E-Mails senden, Code ausführen)
3. Planung: kann komplexe Aufgaben in Schritte zerlegen

In diesem Kurs konzentrieren wir uns auf (1): persistentes Gedächtnis. Werkzeuge und Planung sind separate Kurse.

ilustração de 2 personagens — à esquerda um chatbot sem memória (balão vazio ao

Grundlegende Speicherarchitektur

Was der Agent über Sie speichern muss:

Deklarative Fakten: "Pedro arbeitet mit Python", "trinkt Kaffee ohne Zucker", "wohnt in São Paulo"
Präferenzen: "antworte auf formales pt-BR", "kurze Erklärungen, ohne Ausschmückung"
Interaktionsverlauf: Zusammenfassung der letzten N Dialoge
Flüchtiger Kontext: was Sie GERADE tun (wird nach der Sitzung gelöscht)

Speichermuster:

`
memoria_usuario = {
"facts": [
{"text": "Pedro arbeitet mit Python", "pinned": False},
{"text": "bevorzugt kurze Antworten", "pinned": True}
],
"summary_last_10_sessions": "Benutzer hat über TLS, APIs und Authentifizierung gelernt...",
"preferences": {"response_language": "pt-BR", "tone": "technical"}
}
`

Wie Brainiall das macht

Unser Backend implementiert bereits persistentes Gedächtnis. Sie können:

1. Auf das 🧠-Symbol in der Chat-Sidebar klicken
2. Eine Liste von Fakten anzeigen, die die KI über Sie gelernt hat
3. Wichtige Fakten anpinnen (niemals vergessen)
4. Bearbeiten oder löschen
5. Das Gedächtnis über einen Toggle deaktivieren

Intern verwenden wir:
- PostgreSQL JSONB zum Speichern von Fakten pro Benutzer
- Eviction policy: maximal 50 nicht angepinnte Fakten, älteste werden zuerst entfernt
- Extraction: alle 10 Nachrichten liest das LLM das Gespräch und schlägt neue Fakten zur Genehmigung vor
- Retrieval: vor dem Antworten werden relevante Fakten gesucht und in den Prompt injiziert

Aufbau Ihres Agenten über die API

Minimalistisches Python-Beispiel:

`python
import httpx

BASE = "https://api.brainiall.com"
KEY = "brnl-xxxxx"

def chat(message, user_memory):
# Inject memory as system prompt context
memory_text = "\n".join(f"- {f}" for f in user_memory["facts"])
system = f"Du bist ein persönlicher Assistent. Über den Benutzer:\n{memory_text}"

r = httpx.post(
f"{BASE}/v1/chat/completions",
json={
"model": "claude-sonnet-4-6",
"messages": [
{"role": "system", "content": system},
{"role": "user", "content": message}
]
},
headers={"Authorization": f"Bearer {KEY}"}
)
return r.json()["choices"][0]["message"]["content"]

# Verwendung
memory = {"facts": ["Pedro arbeitet mit Python", "mag Kaffee ohne Zucker"]}
print(chat("Was habe ich heute Morgen getrunken?", memory))
# → "Du hast wahrscheinlich einen Kaffee ohne Zucker getrunken, oder?"
`

Dies ist ein grundlegender Agent. Das Hinzufügen einer automatischen Extraktion (LLM liest und extrahiert neue Fakten) und eines Retrievals (nur relevante Fakten einzufügen) würde den Code auf ~100 Zeilen bringen.

Häufige Fallstricke

Aufgeblähter Speicher: ohne Eviction wächst der Speicher, bis das Token-Limit überschritten wird
Widersprüchliche Fakten: „Pedro mag Kaffee" + „Pedro hat aufgehört, Kaffee zu trinken" — welches hat Vorrang?
Datenschutz: der User muss immer in der Lage sein, Einträge zu sehen + zu bearbeiten + zu löschen
Falscher Scope: Arbeitserinnerungen dürfen nicht in persönliche Chats durchsickern
Drift: LLM kann falsche Fakten erfinden, wenn der Prompt mehrdeutig ist; immer vor dem Persistieren validieren

lista visual de 5 armadilhas com ícones e exemplos curtos — caderno inflado, "??

Anwendungsfälle

Persönlicher Tutor: merkt sich, welche Themen du beherrschst oder wo du Schwierigkeiten hast
Virtueller Ernährungsberater: Mahlzeitenhistorie, Vorlieben, Einschränkungen
Karriere-Coach: merkt sich Ziele, aktuelle Erfolge, Verbesserungspunkte
Schreibassistent: dein Stil, bevorzugter Ton, wiederkehrende Themen
Interner technischer Support: merkt sich frühere Tickets, Systeme, die du verwendest

Teste jetzt gleich

Im Brainiall-Chat öffne ein Gespräch, erzähle etwas über dich, schließe es, öffne am nächsten Tag ein neues Gespräch – der Agent erinnert sich. Aktivieren/deaktivieren über das 🧠-Symbol in der Sidebar. Mit Pro für €5,49 gibt es vollständiges Gedächtnis; Free hat ein auf 10 Fakten begrenztes Gedächtnis.