Ana Brainiall

Detecta el idioma en textos multilingües

iniciante · 7 min · Por Ana Brainiall

Por qué detectar el idioma automáticamente es útil

Escenarios reales:

El modelo fastText language identification, open source de Facebook, detecta 176 idiomas en menos de 10ms por texto.

mapa-mundi estilizado com balões de texto em vários idiomas saindo de cada regiã

Cómo el modelo distingue idiomas

fastText representa cada palabra como n-grams de caracteres (subwords). Luego suma esos vectores y clasifica con regresión softmax. Por qué funciona:

El modelo analiza la firma estadística de los n-grams y decide. Los textos cortos (<3 palabras) son ambiguos; los textos con 20+ palabras tienen una precisión > 99%.

Casos difíciles y cómo manejarlos

Threshold recomendado: acepta la detección solo si la confianza es > 0.75. Por debajo de ese valor, márcalo como "unknown" y deriva a un humano.

gráfico mostrando confidence scores para 5 frases — uma curta "OK" (0.4), uma lo

Integrándolo en tu stack

Ejemplo típico en Python:

`python
import httpx
r = httpx.post(
"https://api.brainiall.com/api/nlp/language",
json={"text": "Hola, ¿cómo estás hoy?"},
headers={"Authorization": "Bearer brnl-xxx"}
)
# {"language": "es", "confidence": 0.96, "top_3": [
# {"lang": "es", "conf": 0.96},
# {"lang": "pt", "conf": 0.02},
# {"lang": "ca", "conf": 0.01}
# ]}
`

Usa top_3 cuando quieras mostrar alternativas en casos de baja confianza (ej: "Parece ser español, pero podría ser catalán — confirma").

Casos de uso avanzados

Pruébalo ahora mismo

Escribe "detecta el idioma de este texto: [pega aquí]" en el chat de Brainiall. API en /api/nlp/language. Latencia típica < 10ms — ideal para uso en tiempo real. El plan Pro tiene un uso generoso; el plan Business incluye la API en modo batch.

¿Te gustó el curso?

Desbloquea 17 cursos Pro + 40+ IAs en chat + generación de video, música y Studio completo.

Hazte Pro · US$5.99/mes

Cancela cuando quieras · Sin compromiso