Bangun agen AI pertama Anda dengan memori
Agen vs chatbot: apa bedanya
Sebuah chatbot membalas pesan secara independen. Setiap percakapan terisolasi. Jika Anda menyebutkan nama Anda kemarin, ia tidak mengingatnya hari ini.
Sebuah agen memiliki 3 karakteristik tambahan:
1. Memori persisten: mengingat Anda antar sesi
2. Alat: dapat memanggil API eksternal (mencari di Google, mengirim email, menjalankan kode)
3. Perencanaan: dapat memecah tugas kompleks menjadi langkah-langkah
Dalam kursus ini kita akan fokus pada (1): memori persisten. Alat dan perencanaan adalah kursus terpisah.

Arsitektur memori dasar
Apa yang perlu disimpan agen tentang Anda:
- Fakta deklaratif: "Pedro bekerja dengan Python", "suka kopi tanpa gula", "tinggal di São Paulo"
- Preferensi: "balas dalam bahasa Indonesia formal", "penjelasan singkat, tanpa basa-basi"
- Riwayat interaksi: ringkasan N dialog terakhir
- Konteks sementara: apa yang sedang Anda lakukan SEKARANG (dihapus setelah sesi)
Pola penyimpanan:
`
memoria_usuario = {
"facts": [
{"text": "Pedro bekerja dengan Python", "pinned": False},
{"text": "lebih suka jawaban singkat", "pinned": True}
],
"summary_last_10_sessions": "Pengguna belajar tentang TLS, API, dan autentikasi...",
"preferences": {"response_language": "id", "tone": "technical"}
}`
Bagaimana Brainiall melakukannya
Backend kami sudah mengimplementasikan memori persisten. Anda dapat:
1. Klik ikon 🧠 di sidebar chat
2. Lihat daftar fakta yang telah dipelajari AI tentang Anda
3. Sematkan fakta penting (agar tidak pernah terlupakan)
4. Edit atau hapus
5. Nonaktifkan memori melalui toggle
Secara internal kami menggunakan:
- PostgreSQL JSONB untuk menyimpan fakta per pengguna
- Eviction policy: maksimal 50 fakta yang tidak disematkan, yang paling lama akan dihapus terlebih dahulu
- Extraction: setiap 10 pesan, LLM membaca percakapan dan menyarankan fakta baru untuk disetujui
- Retrieval: sebelum menjawab, fakta yang relevan dicari dan disuntikkan ke dalam prompt
Membangun agen Anda melalui API
Contoh minimalis Python:
`python
import httpx
BASE = "https://api.brainiall.com"
KEY = "brnl-xxxxx"
def chat(message, user_memory):
# Inject memory as system prompt context
memory_text = "\n".join(f"- {f}" for f in user_memory["facts"])
system = f"Anda adalah asisten pribadi. Tentang pengguna:\n{memory_text}"
r = httpx.post(
f"{BASE}/v1/chat/completions",
json={
"model": "claude-sonnet-4-6",
"messages": [
{"role": "system", "content": system},
{"role": "user", "content": message}
]
},
headers={"Authorization": f"Bearer {KEY}"}
)
return r.json()["choices"][0]["message"]["content"]
# Penggunaan
memory = {"facts": ["Pedro bekerja dengan Python", "suka kopi tanpa gula"]}
print(chat("Apa yang saya minum tadi pagi?", memory))
# → "Anda kemungkinan minum kopi tanpa gula, bukan?"`
Ini adalah agen dasar. Menambahkan extraction otomatis (LLM membaca dan mengekstrak fakta baru) dan retrieval (hanya menyuntikkan fakta yang relevan) akan membuat kodenya menjadi sekitar ~100 baris.
Jebakan umum
- Memori yang membengkak: tanpa eviction, memori terus bertumbuh hingga melampaui batas token
- Fakta yang saling bertentangan: "Pedro suka kopi" + "Pedro berhenti minum kopi" — mana yang berlaku?
- Privasi: pengguna harus selalu bisa melihat + mengedit + menghapus
- Cakupan yang salah: memori pekerjaan tidak boleh bocor ke chat pribadi
- Drift: LLM dapat mengarang fakta palsu jika prompt ambigu; selalu validasi sebelum menyimpan

Kasus penggunaan
- Tutor personal: mengingat topik yang sudah Anda kuasai atau masih sulit
- Ahli gizi virtual: riwayat makan, preferensi, pantangan
- Coach karier: mengingat tujuan, pencapaian terbaru, area yang perlu ditingkatkan
- Asisten menulis: gaya Anda, nada yang disukai, tema yang sering muncul
- Dukungan teknis internal: mengingat tiket sebelumnya, sistem yang Anda gunakan
Coba sekarang juga
Di chat Brainiall, buka percakapan, ceritakan sesuatu tentang diri Anda, tutup, lalu buka percakapan baru keesokan harinya — agen akan mengingatnya. Aktifkan/nonaktifkan melalui ikon 🧠 di sidebar. Paket Pro seharga Rp 49rb memiliki memori penuh; paket gratis memiliki memori terbatas hingga 10 fakta.