Ana Brainiall

Metinlerden isimleri, şirketleri ve tarihleri otomatik olarak çıkarın

iniciante · 8 min · Por Ana Brainiall

NER'in regex'in çözemediği sorunları nasıl çözdüğü

Regex, sabit kalıplar için mükemmeldir: bir posta kodu her zaman belirli sayıda rakamdan oluşur, bir e-posta adresi her zaman @ içerir. Ancak kişi adları, şirketler ve tarihler sabit bir kalıba sahip değildir:

NER, bağlamı anlamayı öğrenen bir dil modeli kullanır: "Garanti Bankası" ile "garanti belgesi" arasındaki farkı ayırt eder. Regex bunu yapamaz; NER ise %95'in üzerinde başarı oranıyla yapabilir.

texto de exemplo colorido com highlights em cores diferentes — nomes em azul, em

Standart ve özel varlıklar

Genel NER modelleri (spaCy, HuggingFace) şunları tespit eder:

Belirli alanlara özel ihtiyaçlarınız için özel bir model eğitebilirsiniz. Örnekler:

Brainiall, Business planında talep üzerine özel modeller sunar.

Arka planda nasıl çalışır (30 saniyede)

1. Tokenizasyon: metin kelimeler ve noktalama işaretlerine ayrılır
2. POS etiketleme: her kelimeye bir dilbilgisel sınıf atanır (isim, fiil...)
3. Bağlamsal analiz: her kelime, komşuları dikkate alınarak 768+ boyutlu bir vektöre dönüştürülür
4. BIO sınıflandırması: her token Başlangıç, İçinde veya Dışında olarak etiketlenir. Örn: "Ahmet" (B-PER) "Yılmaz" (I-PER) "çalışıyor" (O) "" (O) "Türk Telekom'da" (B-ORG)
5. Birleştirme: ardışık B+I token'ları tek bir varlık haline getirilir

Modern modeller (mBERT, XLM-R, multilingual DeBERTa) bu pipeline'ı bir paragraf için ~10-50ms'de çalıştırır.

Pratik kullanım senaryoları

Türkçe'ye özgü sınırlamalar

İpucu: sınır durumlar için, üretime almadan önce mutlaka 100 örneği manuel olarak gözden geçirin.

API üzerinden entegrasyon

Tek endpoint, varlık dizisi döndürür:

`python
import httpx
r = httpx.post(
"https://api.brainiall.com/api/nlp/ner",
json={"text": "Ahmet Yılmaz, Türk Telekom'dan, 5 Ocak'ta açıkladı."},
headers={"Authorization": "Bearer brnl-xxx"}
)
# [{"text": "Ahmet Yılmaz", "type": "PER", "start": 0, "end": 12},
# {"text": "Türk Telekom", "type": "ORG", "start": 15, "end": 27},
# {"text": "5 Ocak", "type": "DATE", "start": 34, "end": 40}]
`

Hemen deneyin

Brainiall sohbet arayüzünde "bu metinden kişileri, şirketleri ve tarihleri çıkar: [yapıştırın]" yazın. Ya da /api/nlp/ner API'si üzerinden kullanın. Pro planı ayda 10.000 istek içerir; Business planı toplu işlem ve özel modeller sunar.

Kursu beğendin mi?

17 Pro kurs + sohbette 40+ AI + video, müzik ve tam Studio üretimi aç.

Pro Ol · ₺99/ay

İstediğin zaman iptal et · Taahhüt yok