Ana Brainiall

اكتشف اللغة في النصوص متعددة اللغات

iniciante · 7 min · Por Ana Brainiall

لماذا يُعدّ الكشف التلقائي عن اللغة مفيداً

سيناريوهات واقعية:

نموذج fastText language identification، المفتوح المصدر من Facebook، يكتشف 176 لغة في أقل من 10 مللي ثانية لكل نص.

mapa-mundi estilizado com balões de texto em vários idiomas saindo de cada regiã

كيف يميّز النموذج بين اللغات

يمثّل fastText كل كلمة على شكل n-grams من الأحرف (subwords)، ثم يجمع هذه المتجهات ويصنّفها باستخدام انحدار softmax. أسباب نجاحه:

يدرس النموذج البصمة الإحصائية لـ n-grams ويتخذ قراره. النصوص القصيرة (أقل من 3 كلمات) غامضة؛ أما النصوص التي تحتوي على 20 كلمة أو أكثر فتتجاوز دقتها 99%.

الحالات الصعبة وكيفية التعامل معها

العتبة الموصى بها: اقبل الكشف فقط عند confidence > 0.75. وما دون ذلك، ضعه في خانة "غير معروف" وأحله إلى مراجع بشري.

gráfico mostrando confidence scores para 5 frases — uma curta "OK" (0.4), uma lo

التكامل مع بنيتك التقنية

مثال Python نموذجي:

`python
import httpx
r = httpx.post(
"https://api.brainiall.com/api/nlp/language",
json={"text": "Hola, ¿cómo estás hoy?"},
headers={"Authorization": "Bearer brnl-xxx"}
)
# {"language": "es", "confidence": 0.96, "top_3": [
# {"lang": "es", "conf": 0.96},
# {"lang": "pt", "conf": 0.02},
# {"lang": "ca", "conf": 0.01}
# ]}
`

استخدم top_3 عندما تريد عرض بدائل في حالات الثقة المنخفضة (مثال: "يبدو أنها إسبانية، لكن قد تكون كتالونية — يرجى التأكيد").

حالات الاستخدام المتقدمة

جرّبه الآن

اطلب "اكتشف لغة هذا النص: [الصق]" في محادثة Brainiall. API متاح على /api/nlp/language. زمن الاستجابة المعتاد أقل من 10 مللي ثانية — مناسب للاستخدام في الوقت الفعلي. خطة Pro توفر استخداماً سخياً؛ وخطة Business تشمل batch API.

أعجبك المحتوى؟

افتح 17 دورة Pro + 40+ نموذج AI في الدردشة + إنشاء فيديو وموسيقى والاستوديو الكامل.

اشترك في Pro · $5.99/شهر

ألغِ في أي وقت · بدون التزام