Ana Brainiall

Metinlerdeki dili otomatik olarak tespit edin

iniciante · 7 min · Por Ana Brainiall

Otomatik dil tespiti neden bu kadar işe yarar

Gerçek hayattan senaryolar:

Facebook'un açık kaynaklı modeli fastText language identification, 176 dili metin başına 10ms'den kısa sürede tespit eder.

mapa-mundi estilizado com balões de texto em vários idiomas saindo de cada regiã

Model dilleri nasıl ayırt eder

fastText, her kelimeyi karakter n-gram'ları (subword'ler) olarak temsil eder. Ardından bu vektörleri toplar ve softmax regresyonu ile sınıflandırır. Neden işe yarar:

Model, n-gram'ların istatistiksel imzasına bakarak karar verir. 3 kelimeden kısa metinler belirsiz olabilir; 20 ve üzeri kelime içeren metinlerde doğruluk %99'u aşar.

Zorlu durumlar ve nasıl başa çıkılır

Önerilen eşik: Yalnızca güven skoru 0,75'in üzerindeki tespitleri kabul edin. Altında kalanları "bilinmiyor" olarak işaretleyin ve insan onayına gönderin.

gráfico mostrando confidence scores para 5 frases — uma curta "OK" (0.4), uma lo

Stack'inize entegrasyon

Tipik Python örneği:

`python
import httpx
r = httpx.post(
"https://api.brainiall.com/api/nlp/language",
json={"text": "Hola, ¿cómo estás hoy?"},
headers={"Authorization": "Bearer brnl-xxx"}
)
# {"language": "es", "confidence": 0.96, "top_3": [
# {"lang": "es", "conf": 0.96},
# {"lang": "pt", "conf": 0.02},
# {"lang": "ca", "conf": 0.01}
# ]}
`

Düşük güven durumlarında alternatifleri göstermek istediğinizde top_3 kullanın (örn: "İspanyolca gibi görünüyor, ancak Katalanca olabilir — lütfen onaylayın").

Gelişmiş kullanım senaryoları

Hemen deneyin

Brainiall sohbet arayüzünde "bu metnin dilini tespit et: [yapıştırın]" yazmanız yeterli. API: /api/nlp/language. Tipik gecikme süresi 10ms'nin altında — gerçek zamanlı kullanım için idealdir. Pro planında cömert kullanım hakkı mevcuttur; Business planı ise toplu işlem için Batch API içerir.

Kursu beğendin mi?

17 Pro kurs + sohbette 40+ AI + video, müzik ve tam Studio üretimi aç.

Pro Ol · ₺99/ay

İstediğin zaman iptal et · Taahhüt yok