Bir 300 Sayfalık PDF ile Sohbet Edin
PDF'ler Neden Özel Bir Sorun?
PDF'ler 3 farklı dünyayı bir araya getirdiği için zorludur:
1. Yapılandırılmış metin: paragraflar, listeler, dipnotlar
2. Görsel düzen: sütunlar, tablolar, diyagramlar, grafikler
3. Görseller: fotoğraflar, logolar, gömülü ekran görüntüleri
PDF, görsel öncelikli bir formattır: her cihazda aynı görünümü korur. Ancak metin yalnızca bir yan üründür — orijinal anlamsal içeriği çıkarmak her zaman kolay değildir.
Brainiall'da bir PDF gönderdiğinizde:
- Ham metin çıkarılır (pdfplumber veya pdfium)
- Tablolar tespit edilir (camelot veya tabula)
- Sayfalar görüntüye dönüştürülür
- Metin çıkarılamayan sayfalarda OCR uygulanır (Whisper-OCR veya Mistral-OCR)
- Hiyerarşik yapı keşfedilir (başlıklar, bölümler)
- İsteğe bağlı olarak: RAG için özetlenir ve vektörleştirilir

Konuşma Akışı: RAG mı, Tam Bağlam mı?
Boyuta göre iki farklı strateji:
PDF < 50 sayfa (~100k token):
- Metnin tamamını Claude Sonnet veya Gemini Pro'nun prompt'una gönderin
- Model her şeyi "görür" ve tam bağlama dayalı yanıt verir
- Avantaj: hiçbir bilgi kaybolmaz
- Dezavantaj: birden fazla soru için maliyetli (her istek PDF'yi yeniden işler)
PDF > 50 sayfa:
- RAG (Retrieval Augmented Generation) kullanın
- PDF'yi ~500 tokenlik parçalara bölün
- Her parçayı vektörleştirin
- Kullanıcının sorusuna göre anlamsal olarak en alakalı 5-10 parçayı bulun
- Prompt'a YALNIZCA bu parçaları gönderin
- Avantaj: uygun maliyetli + ölçeklenebilir
- Dezavantaj: model uzak bölümlerdeki bilgileri birleştirmesi gerektiğinde bağlamı kaybedebilir
Brainiall, PDF boyutuna göre hangi stratejiyi kullanacağına otomatik olarak karar verir.
Pratik Kullanım Senaryoları
- Hukuki belgeler: maddeleri bulmak için 80 sayfalık bir sözleşmeyle sohbet etmek
- Akademik makaleler: "yazarın tezine karşı öne sürülen başlıca argümanlar nelerdir?"
- Finansal raporlar: "bu 10-K'da Q3 ile Q4 büyümesini karşılaştır"
- Teknik kılavuzlar: "ekipmanı sıfırlamak için prosedür nedir?"
- Ders kitapları: herhangi bir konu üzerinde özel ders
- Hukuki süreçler: 500+ sayfalık dosyalarda tarihleri, tarafları ve ilgili olayları aramak
Yaygın Tuzaklar
- Karmaşık tablolar: iç içe veya birleştirilmiş tablolar çıkarılan metinde karışık görünebilir; yedek olarak görüntü OCR'ı kullanın
- Matematiksel formüller: PDF'lerdeki LaTeX okunamaz metne dönüşür; vision modeller bu konuda daha iyi sonuç verir
- Eski taranmış belgeler: yalnızca görüntüden oluşan (metin içermeyen) PDF'ler, kelime hatası yapabilecek OCR gerektirir
- Nadir diller: az kaynaklı dillerde OCR kalitesi düşer
- Korumalı PDF'ler: kopyalama korumalı PDF'ler çıkarmayı engelleyebilir — şifre gerekebilir
İyi ve Kötü Çalışan Sorular
İyi çalışır:
- "3. bölümün ana argümanı nedir?"
- "Bu raporda geçen tüm tarihleri listele"
- "4. ve 7. bölümün sonuçlarını karşılaştır"
- "2025'teki net gelir ne kadardı?"
Kötü çalışır:
- "Bu PDF'yi 2 paragrafta özetle" (RAG'da kaybolmuş olabilecek tam bağlamı talep eder)
- "Yazarın sonundaki duygusal tonu nedir?" (parçalarda yakalanması zor bir nüans)
- "45. sayfadaki görselde ne var?" (özel vision gerektirir)

API ile Entegrasyon
`python
import httpx
# Önce PDF'yi yükleyin
with open("sozlesme.pdf", "rb") as f:
r = httpx.post(
"https://api.brainiall.com/v1/files",
files={"file": f},
headers={"Authorization": "Bearer brnl-xxx"}
)
file_id = r.json()["id"]
# Ardından dosyaya referans vererek sohbet edin
r = httpx.post(
"https://api.brainiall.com/v1/chat/completions",
json={
"model": "claude-sonnet-4-6",
"messages": [
{"role": "user", "content": [
{"type": "text", "text": "Bu sözleşmedeki tüm tarafları listele"},
{"type": "file", "file_id": file_id}
]}
]
},
headers={"Authorization": "Bearer brnl-xxx"}
)`
Hemen Deneyin
Brainiall sohbetinde bir PDF'yi giriş alanına sürükleyin ve sorularınızı sorun. Dosya başına 10 MB'a kadar. Pro planı (₺29) cömert yükleme imkânı sunar; Business planında toplu işlem + 30 günlük saklama özelliği bulunur.