Ana Brainiall

Bir 300 Sayfalık PDF ile Sohbet Edin

intermediario · 10 min · Por Ana Brainiall

PDF'ler Neden Özel Bir Sorun?

PDF'ler 3 farklı dünyayı bir araya getirdiği için zorludur:

1. Yapılandırılmış metin: paragraflar, listeler, dipnotlar
2. Görsel düzen: sütunlar, tablolar, diyagramlar, grafikler
3. Görseller: fotoğraflar, logolar, gömülü ekran görüntüleri

PDF, görsel öncelikli bir formattır: her cihazda aynı görünümü korur. Ancak metin yalnızca bir yan üründür — orijinal anlamsal içeriği çıkarmak her zaman kolay değildir.

Brainiall'da bir PDF gönderdiğinizde:
- Ham metin çıkarılır (pdfplumber veya pdfium)
- Tablolar tespit edilir (camelot veya tabula)
- Sayfalar görüntüye dönüştürülür
- Metin çıkarılamayan sayfalarda OCR uygulanır (Whisper-OCR veya Mistral-OCR)
- Hiyerarşik yapı keşfedilir (başlıklar, bölümler)
- İsteğe bağlı olarak: RAG için özetlenir ve vektörleştirilir

ilustração de um PDF sendo "destrinchado" em 4 camadas — texto, tabelas, imagens

Konuşma Akışı: RAG mı, Tam Bağlam mı?

Boyuta göre iki farklı strateji:

PDF < 50 sayfa (~100k token):
- Metnin tamamını Claude Sonnet veya Gemini Pro'nun prompt'una gönderin
- Model her şeyi "görür" ve tam bağlama dayalı yanıt verir
- Avantaj: hiçbir bilgi kaybolmaz
- Dezavantaj: birden fazla soru için maliyetli (her istek PDF'yi yeniden işler)

PDF > 50 sayfa:
- RAG (Retrieval Augmented Generation) kullanın
- PDF'yi ~500 tokenlik parçalara bölün
- Her parçayı vektörleştirin
- Kullanıcının sorusuna göre anlamsal olarak en alakalı 5-10 parçayı bulun
- Prompt'a YALNIZCA bu parçaları gönderin
- Avantaj: uygun maliyetli + ölçeklenebilir
- Dezavantaj: model uzak bölümlerdeki bilgileri birleştirmesi gerektiğinde bağlamı kaybedebilir

Brainiall, PDF boyutuna göre hangi stratejiyi kullanacağına otomatik olarak karar verir.

Pratik Kullanım Senaryoları

Yaygın Tuzaklar

İyi ve Kötü Çalışan Sorular

İyi çalışır:
- "3. bölümün ana argümanı nedir?"
- "Bu raporda geçen tüm tarihleri listele"
- "4. ve 7. bölümün sonuçlarını karşılaştır"
- "2025'teki net gelir ne kadardı?"

Kötü çalışır:
- "Bu PDF'yi 2 paragrafta özetle" (RAG'da kaybolmuş olabilecek tam bağlamı talep eder)
- "Yazarın sonundaki duygusal tonu nedir?" (parçalarda yakalanması zor bir nüans)
- "45. sayfadaki görselde ne var?" (özel vision gerektirir)

comparação visual de 2 colunas — "perguntas que funcionam" com checkmarks verdes

API ile Entegrasyon

`python
import httpx

# Önce PDF'yi yükleyin
with open("sozlesme.pdf", "rb") as f:
r = httpx.post(
"https://api.brainiall.com/v1/files",
files={"file": f},
headers={"Authorization": "Bearer brnl-xxx"}
)
file_id = r.json()["id"]

# Ardından dosyaya referans vererek sohbet edin
r = httpx.post(
"https://api.brainiall.com/v1/chat/completions",
json={
"model": "claude-sonnet-4-6",
"messages": [
{"role": "user", "content": [
{"type": "text", "text": "Bu sözleşmedeki tüm tarafları listele"},
{"type": "file", "file_id": file_id}
]}
]
},
headers={"Authorization": "Bearer brnl-xxx"}
)
`

Hemen Deneyin

Brainiall sohbetinde bir PDF'yi giriş alanına sürükleyin ve sorularınızı sorun. Dosya başına 10 MB'a kadar. Pro planı (₺29) cömert yükleme imkânı sunar; Business planında toplu işlem + 30 günlük saklama özelliği bulunur.

Kursu beğendin mi?

17 Pro kurs + sohbette 40+ AI + video, müzik ve tam Studio üretimi aç.

Pro Ol · ₺99/ay

İstediğin zaman iptal et · Taahhüt yok