Ana Brainiall

Détectez la langue dans des textes multilingues

iniciante · 7 min · Por Ana Brainiall

Pourquoi détecter la langue automatiquement est utile

Scénarios concrets :

Le modèle fastText language identification, open source de Facebook, détecte 176 langues en moins de 10 ms par texte.

mapa-mundi estilizado com balões de texto em vários idiomas saindo de cada regiã

Comment le modèle distingue les langues

fastText représente chaque mot sous forme de n-grams de caractères (subwords). Il additionne ensuite ces vecteurs et classifie avec une régression softmax. Pourquoi ça fonctionne :

Le modèle analyse la signature statistique des n-grams pour trancher. Les textes courts (< 3 mots) sont ambigus ; au-delà de 20 mots, la précision dépasse 99 %.

Cas difficiles et comment les gérer

Seuil recommandé : n'acceptez une détection que si la confidence est > 0,75. En dessous, marquez comme "unknown" et faites appel à un humain.

gráfico mostrando confidence scores para 5 frases — uma curta "OK" (0.4), uma lo

Intégration dans votre stack

Exemple Python typique :

`python
import httpx
r = httpx.post(
"https://api.brainiall.com/api/nlp/language",
json={"text": "Hola, ¿cómo estás hoy?"},
headers={"Authorization": "Bearer brnl-xxx"}
)
# {"language": "es", "confidence": 0.96, "top_3": [
# {"lang": "es", "conf": 0.96},
# {"lang": "pt", "conf": 0.02},
# {"lang": "ca", "conf": 0.01}
# ]}
`

Utilisez top_3 lorsque vous souhaitez afficher des alternatives en cas de faible confiance (ex. : "Semble être de l'espagnol, mais pourrait être du catalan — veuillez confirmer").

Cas d'usage avancés

Testez dès maintenant

Demandez "détectez la langue de ce texte : [collez]" dans le chat Brainiall. API disponible sur /api/nlp/language. Latence typique < 10 ms — idéal pour une utilisation en temps réel. Le plan Pro offre une utilisation généreuse ; le plan Business inclut l'API batch.

Ce cours vous a plu?

Débloquez 17 cours Pro + 40+ IA dans le chat + génération vidéo, musique et Studio complet.

Passer Pro · €5,49/mois

Annulez à tout moment · Sans engagement