تحدث مع ملف PDF من 300 صفحة
لماذا تُعدّ ملفات PDF تحديًا خاصًا
ملفات PDF صعبة لأنها تجمع 3 عوالم في آنٍ واحد:
1. نص منظّم: فقرات، قوائم، حواشٍ سفلية
2. تخطيط بصري: أعمدة، جداول، مخططات، رسوم بيانية
3. صور: صور فوتوغرافية، شعارات، لقطات شاشة مضمّنة
صيغة PDF هي صيغة بصرية بالدرجة الأولى: تحافظ على المظهر في أي جهاز. لكن النص ليس سوى ناتج ثانوي — واستخراج المحتوى الدلالي الأصلي ليس دائمًا أمرًا بسيطًا.
في Brainiall، عندما ترفع ملف PDF:
- يُستخرج النص الخام (pdfplumber أو pdfium)
- تُكتشف الجداول (camelot أو tabula)
- تُحوَّل الصفحات إلى صور
- يُطبَّق OCR (Whisper-OCR أو Mistral-OCR) على الصفحات التي لا يمكن استخراج نصها
- تُكتشف البنية الهرمية (العناوين، الأقسام)
- اختياريًا: التلخيص + التحويل إلى متجهات لـ RAG

تدفق المحادثة: RAG مقابل السياق الكامل
استراتيجيتان تعتمدان على حجم الملف:
PDF أقل من 50 صفحة (~100 ألف رمز):
- أرسل النص الكامل في موجّه Claude Sonnet أو Gemini Pro
- يرى النموذج كل شيء ويجيب بناءً على السياق الكامل
- الميزة: لا تضيع أي معلومة
- العيب: مكلف عند طرح أسئلة متعددة (كل طلب يُعيد معالجة الملف)
PDF أكثر من 50 صفحة:
- استخدم RAG (التوليد المعزّز بالاسترجاع)
- قسّم الملف إلى أجزاء بحجم ~500 رمز
- حوّل كل جزء إلى متجهات
- عند سؤال المستخدم، ابحث عن أكثر 5-10 أجزاء ذات صلة دلاليًا
- أرسل هذه الأجزاء فقط في الموجّه
- الميزة: اقتصادي وقابل للتوسع
- العيب: إذا احتاج النموذج إلى ربط معلومات من أجزاء بعيدة، قد يفقد السياق
تقرر Brainiall تلقائيًا أي استراتيجية تستخدم بناءً على حجم الملف.
حالات استخدام عملية
- الوثائق القانونية: التحدث مع عقد من 80 صفحة للعثور على البنود
- الأوراق الأكاديمية: "ما أبرز الحجج المضادة لأطروحة المؤلف؟"
- التقارير المالية: "قارن نمو الربع الثالث بالربع الرابع في هذا التقرير السنوي"
- الأدلة التقنية: "ما الإجراء اللازم لإعادة ضبط الجهاز؟"
- الكتب الدراسية: تدريس خصوصي حول أي موضوع
- الملفات القانونية: البحث عن تواريخ وأطراف ووقائع في ملفات تتجاوز 500 صفحة
الأخطاء الشائعة
- الجداول المعقدة: الجداول المتداخلة أو المدمجة قد تظهر بشكل مشوّه في النص المستخرج؛ استخدم OCR للصور كخيار احتياطي
- الصيغ الرياضية: كود LaTeX في ملفات PDF يتحول إلى نص غير مقروء؛ نماذج الرؤية تتعامل معه بشكل أفضل
- المستندات الممسوحة ضوئيًا القديمة: ملفات PDF التي تحتوي على صور فقط (بدون نص) تستلزم OCR قد يُخطئ في بعض الكلمات
- اللغات النادرة: اللغات ذات الموارد المحدودة تُعطي نتائج OCR أضعف
- ملفات PDF المحمية: الملفات ذات حماية النسخ قد تعيق الاستخراج — تحتاج إلى كلمة مرور
الأسئلة التي تعمل جيدًا مقابل تلك التي لا تعمل
تعمل جيدًا:
- "ما الحجة المحورية في الفصل الثالث؟"
- "اذكر جميع التواريخ الواردة في هذا التقرير"
- "قارن استنتاجات القسم الرابع بالقسم السابع"
- "ما صافي الإيرادات في عام 2025؟"
لا تعمل جيدًا:
- "لخّص هذا الملف بأكمله في فقرتين" (يطلب سياقًا كاملًا قد يضيع في RAG)
- "ما النبرة العاطفية للمؤلف في النهاية؟" (فروق دقيقة يصعب التقاطها في الأجزاء)
- "ما الذي يظهر في صورة الصفحة 45؟" (يحتاج إلى نموذج رؤية محدد)

التكامل عبر API
`python
import httpx
# رفع الملف أولًا
with open("contrato.pdf", "rb") as f:
r = httpx.post(
"https://api.brainiall.com/v1/files",
files={"file": f},
headers={"Authorization": "Bearer brnl-xxx"}
)
file_id = r.json()["id"]
# ثم المحادثة مع الإشارة إلى الملف
r = httpx.post(
"https://api.brainiall.com/v1/chat/completions",
json={
"model": "claude-sonnet-4-6",
"messages": [
{"role": "user", "content": [
{"type": "text", "text": "Liste todas as partes deste contrato"},
{"type": "file", "file_id": file_id}
]}
]
},
headers={"Authorization": "Bearer brnl-xxx"}
)`
جرّبه الآن
في محادثة Brainiall، اسحب ملف PDF إلى منطقة الإدخال وابدأ بطرح أسئلتك. حتى 10 ميغابايت لكل ملف. تتيح خطة Pro بـ 29 ريالًا رفع ملفات بسخاء؛ بينما تتضمن خطة Business معالجة دُفعية واحتفاظًا بالملفات لمدة 30 يومًا.