Ana Brainiall

Sprache in mehrsprachigen Texten erkennen

iniciante · 7 min · Por Ana Brainiall

Warum automatische Spracherkennung so wertvoll ist

Praxisbeispiele:

Das Modell fastText language identification, Open Source von Facebook, erkennt 176 Sprachen in weniger als 10ms pro Text.

mapa-mundi estilizado com balões de texto em vários idiomas saindo de cada regiã

Wie das Modell Sprachen unterscheidet

fastText repräsentiert jedes Wort als Charakter-N-Gramme (Subwords). Diese Vektoren werden anschließend summiert und per Softmax-Regression klassifiziert. Warum das funktioniert:

Das Modell analysiert die statistische Signatur der N-Gramme und trifft seine Entscheidung. Kurze Texte (<3 Wörter) sind mehrdeutig; Texte mit 20+ Wörtern erreichen eine Genauigkeit von > 99 %.

Schwierige Fälle und wie man damit umgeht

Empfohlener Threshold: Erkennungen nur akzeptieren, wenn Confidence > 0,75. Darunter als "unknown" markieren und manuell prüfen lassen.

gráfico mostrando confidence scores para 5 frases — uma curta "OK" (0.4), uma lo

Integration in deinen Stack

Typisches Python-Beispiel:

`python
import httpx
r = httpx.post(
"https://api.brainiall.com/api/nlp/language",
json={"text": "Hola, ¿cómo estás hoy?"},
headers={"Authorization": "Bearer brnl-xxx"}
)
# {"language": "es", "confidence": 0.96, "top_3": [
# {"lang": "es", "conf": 0.96},
# {"lang": "pt", "conf": 0.02},
# {"lang": "ca", "conf": 0.01}
# ]}
`

Nutze top_3, wenn du bei geringer Konfidenz Alternativen anzeigen möchtest (z. B.: "Scheint Spanisch zu sein, könnte aber Katalanisch sein — bitte bestätigen").

Erweiterte Anwendungsfälle

Jetzt direkt ausprobieren

Frag im Brainiall-Chat: "Erkenne die Sprache dieses Textes: [einfügen]". API unter /api/nlp/language. Typische Latenz < 10ms — ideal für den Einsatz in Echtzeit. Der Pro-Plan bietet großzügiges Kontingent; Business beinhaltet die Batch API.

Kurs gefallen?

17 Pro-Kurse + 40+ KIs im Chat + Video-, Musik- und komplette Studio-Generierung freischalten.

Pro werden · €5,49/Monat

Jederzeit kündbar · Keine Verpflichtung