Phân tích cảm xúc hàng nghìn đánh giá theo lô

iniciante · 8 min · Por Ana Brainiall

Sentiment analysis thực sự đo lường điều gì

Sentiment analysis trả về cho một đoạn văn bản phản hồi nhị phân (tích cực/tiêu cực) hoặc điểm số từ -1 đến +1. Nghe có vẻ đơn giản, nhưng người dùng sẽ sớm nhận ra: một câu có thể trung lập về mặt ngữ pháp nhưng lại mang nặng cảm xúc cùng một lúc.

Ví dụ:
- "Sản phẩm đã đến." — trung lập về ngữ pháp, nhưng so với "đến nhanh lắm!" thì lại mang nghĩa tiêu cực tương đối
- "Hoạt động đúng như mong đợi." — có vẻ tích cực, nhưng với ai kỳ vọng nhiều hơn, đây là sự thất vọng
- "Tôi sẽ không bao giờ mua lại." — rõ ràng tiêu cực, dù không có từ ngữ tiêu cực tường minh

Các mô hình NLP hiện đại nắm bắt được 92%+ những sắc thái này. Nhưng bạn cần diễn giải điểm số trong bối cảnh kinh doanh của mình.

matriz de 4 quadrantes — eixo X "neutro → emocional", eixo Y "positivo → negativ

Cách xử lý 10.000 đánh giá trong 60 giây

Brainiall cung cấp endpoint batch chấp nhận mảng lên đến 1.000 văn bản mỗi request. Với 10.000 đánh giá:

1. Chia thành 10 batch, mỗi batch 1.000
2. Gửi song song qua asyncio
3. Nhận kết quả có cấu trúc dạng JSON
4. Tổng độ trễ: 30-60 giây cho 10k văn bản

Qua code Python:

`python
import httpx, asyncio

async def analyze_batch(texts):
async with httpx.AsyncClient(timeout=60) as client:
r = await client.post(
"https://api.brainiall.com/api/nlp/sentiment/batch",
json={"texts": texts},
headers={"Authorization": "Bearer brnl-xxxxx"}
)
return r.json()

results = asyncio.run(analyze_batch(reviews[:1000]))
`

Vượt ra ngoài tích cực/tiêu cực: aspect-based sentiment

Một đánh giá có thể chứa những ý kiến trái chiều về các khía cạnh khác nhau:
> "Đồ ăn tuyệt vời, nhưng người phục vụ thô lỗ và giá cả thì cắt cổ."

Sentiment tổng thể: -0.1 (hơi tiêu cực). Nhưng bạn đã bỏ lỡ thông tin quan trọng:
- Đồ ăn: +0.9 (rất tích cực)
- Dịch vụ: -0.7 (rất tiêu cực)
- Giá cả: -0.6 (tiêu cực)

Aspect-based sentiment trích xuất từng khía cạnh và chấm điểm riêng biệt. Hữu ích cho phân tích cạnh tranh, phản hồi sản phẩm, NPS chuyên sâu.

exemplo visual de uma review longa sendo "quebrada" em 3 aspects com scores sepa

Những lỗi kinh điển của người mới bắt đầu

Bỏ qua độ lớn: sentiment -0.1 và -0.9 bị xử lý như nhau trong phân tích nhị phân. Hãy luôn dùng điểm số liên tục.
Không lọc theo mức độ liên quan: những đánh giá kiểu "ổn thôi" vẫn lọt vào dữ liệu — nhưng chẳng cung cấp thông tin gì. Hãy lọc theo độ dài tối thiểu và sự đa dạng từ vựng.
Tổng hợp ngây thơ: trung bình cộng đơn giản của các điểm số có thể che giấu tính hai đỉnh (một nửa yêu thích, một nửa ghét = trung bình trung lập). Hãy luôn vẽ biểu đồ histogram.
Ngôn ngữ hỗn hợp: các mô hình đa ngôn ngữ có độ chính xác thấp hơn trung bình 10%. Nếu có thể, hãy phát hiện ngôn ngữ và dùng mô hình chuyên biệt.

Các trường hợp sử dụng thực tế

Voice of Customer: phân tích toàn bộ đánh giá của một sản phẩm + so sánh với đối thủ cạnh tranh
Mạng xã hội: theo dõi lượt đề cập thương hiệu của bạn trên Twitter/Reddit theo thời gian thực
Phản hồi nội bộ: phân tích câu trả lời khảo sát môi trường làm việc tại doanh nghiệp lớn
Ưu tiên hỗ trợ: ticket có sentiment rất tiêu cực = ưu tiên cao
A/B testing định tính: một biến thể có nhiều đánh giá tích cực hơn không?

Thử ngay bây giờ

Trong chat Brainiall, hãy yêu cầu "phân tích cảm xúc của đánh giá này: [văn bản]". Để xử lý theo lô, dùng endpoint /api/nlp/sentiment/batch qua API. Gói Pro $5.99 bao gồm mức sử dụng rộng rãi; gói Business cung cấp tín dụng API để xử lý hàng triệu yêu cầu qua tích hợp bên ngoài.