Ana Brainiall

تحدث مع ملف PDF من 300 صفحة

intermediario · 10 min · Por Ana Brainiall

لماذا تُعدّ ملفات PDF تحديًا خاصًا

ملفات PDF صعبة لأنها تجمع 3 عوالم في آنٍ واحد:

1. نص منظّم: فقرات، قوائم، حواشٍ سفلية
2. تخطيط بصري: أعمدة، جداول، مخططات، رسوم بيانية
3. صور: صور فوتوغرافية، شعارات، لقطات شاشة مضمّنة

صيغة PDF هي صيغة بصرية بالدرجة الأولى: تحافظ على المظهر في أي جهاز. لكن النص ليس سوى ناتج ثانوي — واستخراج المحتوى الدلالي الأصلي ليس دائمًا أمرًا بسيطًا.

في Brainiall، عندما ترفع ملف PDF:
- يُستخرج النص الخام (pdfplumber أو pdfium)
- تُكتشف الجداول (camelot أو tabula)
- تُحوَّل الصفحات إلى صور
- يُطبَّق OCR (Whisper-OCR أو Mistral-OCR) على الصفحات التي لا يمكن استخراج نصها
- تُكتشف البنية الهرمية (العناوين، الأقسام)
- اختياريًا: التلخيص + التحويل إلى متجهات لـ RAG

ilustração de um PDF sendo "destrinchado" em 4 camadas — texto, tabelas, imagens

تدفق المحادثة: RAG مقابل السياق الكامل

استراتيجيتان تعتمدان على حجم الملف:

PDF أقل من 50 صفحة (~100 ألف رمز):
- أرسل النص الكامل في موجّه Claude Sonnet أو Gemini Pro
- يرى النموذج كل شيء ويجيب بناءً على السياق الكامل
- الميزة: لا تضيع أي معلومة
- العيب: مكلف عند طرح أسئلة متعددة (كل طلب يُعيد معالجة الملف)

PDF أكثر من 50 صفحة:
- استخدم RAG (التوليد المعزّز بالاسترجاع)
- قسّم الملف إلى أجزاء بحجم ~500 رمز
- حوّل كل جزء إلى متجهات
- عند سؤال المستخدم، ابحث عن أكثر 5-10 أجزاء ذات صلة دلاليًا
- أرسل هذه الأجزاء فقط في الموجّه
- الميزة: اقتصادي وقابل للتوسع
- العيب: إذا احتاج النموذج إلى ربط معلومات من أجزاء بعيدة، قد يفقد السياق

تقرر Brainiall تلقائيًا أي استراتيجية تستخدم بناءً على حجم الملف.

حالات استخدام عملية

الأخطاء الشائعة

الأسئلة التي تعمل جيدًا مقابل تلك التي لا تعمل

تعمل جيدًا:
- "ما الحجة المحورية في الفصل الثالث؟"
- "اذكر جميع التواريخ الواردة في هذا التقرير"
- "قارن استنتاجات القسم الرابع بالقسم السابع"
- "ما صافي الإيرادات في عام 2025؟"

لا تعمل جيدًا:
- "لخّص هذا الملف بأكمله في فقرتين" (يطلب سياقًا كاملًا قد يضيع في RAG)
- "ما النبرة العاطفية للمؤلف في النهاية؟" (فروق دقيقة يصعب التقاطها في الأجزاء)
- "ما الذي يظهر في صورة الصفحة 45؟" (يحتاج إلى نموذج رؤية محدد)

comparação visual de 2 colunas — "perguntas que funcionam" com checkmarks verdes

التكامل عبر API

`python
import httpx

# رفع الملف أولًا
with open("contrato.pdf", "rb") as f:
r = httpx.post(
"https://api.brainiall.com/v1/files",
files={"file": f},
headers={"Authorization": "Bearer brnl-xxx"}
)
file_id = r.json()["id"]

# ثم المحادثة مع الإشارة إلى الملف
r = httpx.post(
"https://api.brainiall.com/v1/chat/completions",
json={
"model": "claude-sonnet-4-6",
"messages": [
{"role": "user", "content": [
{"type": "text", "text": "Liste todas as partes deste contrato"},
{"type": "file", "file_id": file_id}
]}
]
},
headers={"Authorization": "Bearer brnl-xxx"}
)
`

جرّبه الآن

في محادثة Brainiall، اسحب ملف PDF إلى منطقة الإدخال وابدأ بطرح أسئلتك. حتى 10 ميغابايت لكل ملف. تتيح خطة Pro بـ 29 ريالًا رفع ملفات بسخاء؛ بينما تتضمن خطة Business معالجة دُفعية واحتفاظًا بالملفات لمدة 30 يومًا.

أعجبك المحتوى؟

افتح 17 دورة Pro + 40+ نموذج AI في الدردشة + إنشاء فيديو وموسيقى والاستوديو الكامل.

اشترك في Pro · $5.99/شهر

ألغِ في أي وقت · بدون التزام