Ana Brainiall

Tạo hình ảnh chân thực với các mô hình SOTA

iniciante · 10 min · Por Ana Brainiall

Sự khác biệt giữa một prompt tốt và một prompt "nhạt nhẽo"

Khi các mô hình tạo ảnh khuếch tán trở nên phổ biến vào năm 2022, nhiều người tin rằng càng nhiều từ = kết quả càng tốt. Ngày nay chúng ta biết điều ngược lại mới đúng hơn: cấu trúc rõ ràng quan trọng hơn số lượng từ. Một prompt được xây dựng tốt có 4 thành phần:

1. Chủ thể: những gì xuất hiện trong ảnh (một người phụ nữ, một chiếc xe, một phong cảnh)
2. Hành động/tư thế: chủ thể đang làm gì (đang chạy, đang ngồi, đang mỉm cười)
3. Bối cảnh: ở đâu (nhà bếp, rừng cây, neon night city)
4. Phong cách: được ghi lại như thế nào (ảnh chụp 35mm, minh họa màu nước, 3D render)

Một ví dụ hoàn chỉnh: "professional photograph of a brazilian woman smiling, sitting in a sunlit kitchen window, shot on 35mm film, soft natural light, shallow depth of field, cinematic color grading".

grid 2x2 mostrando variações da mesma descrição com níveis de qualidade crescent

Tại sao phong cách quan trọng hơn độ phân giải

Các mô hình hiện đại tạo ra ảnh có độ phân giải cao (1024×1024 hoặc 2K) một cách dễ dàng. Thách thức không phải là "kích thước", mà là sự nhất quán về phong cách. Một bức ảnh kết hợp ánh sáng điện ảnh với kết cấu minh họa 3D sẽ trông kỳ lạ dù ở độ phân giải 4K.

Mẹo thực tế: chọn MỘT phong cách hình ảnh và củng cố nó bằng 2-3 từ khóa:

Kiểm soát chi tiết với negative prompts

Nhiều mô hình chấp nhận một negative prompt — những gì bạn KHÔNG muốn thấy. Đây không phải là kiểm duyệt, mà là định hướng: "blurry, low quality, watermark, text, signature, deformed hands" giúp tránh những lỗi phổ biến nhất của các mô hình khuếch tán.

Một lỗi thường gặp: nhồi nhét quá nhiều thuật ngữ chung chung vào negative prompt. Tốt nhất là ngắn gọn và cụ thể với vấn đề bạn đang gặp phải. Nếu bàn tay bị biến dạng (vấn đề kinh điển), lúc đó mới thêm "extra fingers, malformed hands".

Các mô hình trên Brainiall và khi nào nên dùng từng loại

Hãy thử cùng một prompt trên 2-3 mô hình khác nhau — sự khác biệt về phong cách giữa chúng còn lớn hơn sự khác biệt về chất lượng.

Những hạn chế bạn sẽ sớm gặp phải

Thử ngay bây giờ

Trong chat Brainiall, nhấp vào "Hình ảnh" ở trên cùng và sử dụng một prompt có cấu trúc như:

"professional photograph of a [người/vật thể], [hành động/tư thế], [địa điểm/bối cảnh], shot on 35mm film, natural lighting, shallow depth of field"

Bạn nhận được 1 hình ảnh trong 2-5 giây. Gói Pro $5.99 bao gồm 100 hình ảnh/tháng trên các mô hình top-tier.

Tích hợp qua API

Ngoài chat, dùng REST API để tích hợp vào app của bạn. Xác thực bằng Bearer token (lấy tại app.brainiall.com).

curl -X POST https://chat.brainiall.com/api/images \
  -H "Authorization: Bearer $BRAINIALL_KEY" \
  -H "Content-Type: application/json" \
  -d '{"model":"google/nano-banana","prompt":"neon cyberpunk city","size":"1024","n":1}' 
import requests, os
r = requests.post("https://chat.brainiall.com/api/images",
    json={"model": "google/nano-banana",
          "prompt": "neon cyberpunk city at night",
          "size": "1024", "n": 1},
    headers={"Authorization": f"Bearer {os.environ["BRAINIALL_KEY"]}"} )
image_url = r.json()["images"][0]["url"]

Thích khóa học?

Mở khóa 17 khóa học Pro + 40+ AI trong chat + tạo video, âm nhạc và Studio đầy đủ.

Lên Pro · $5.99/tháng

Hủy bất cứ lúc nào · Không ràng buộc