Google ra mắt Nano Banana 2 nâng cấp đáng giá về tốc độ tạo ảnh

Tóm tắt nhanh
Google chính thức ra mắt Nano Banana 2, phiên bản dựa trên mô hình tạo ảnh AI Gemini 3.1 Flash Image. Sản phẩm này mang các tính năng cao cấp của Nano Banana Pro xuống cho người dùng phổ thông và miễn phí, nổi bật với tốc độ xử lý cực nhanh và chi phí API giảm đáng kể (từ $0.13 xuống $0.07 cho ảnh 1024x1024). Nano Banana 2 kế thừa các ưu điểm như tính nhất quán đối tượng, hiển thị văn bản chính xác, kết nối thông tin thời gian thực và hỗ trợ độ phân giải lên đến 4K. Bài viết cũng so sánh Nano Banana 2 với GPT Image 1.5 nhấn mạnh triết lý thiết kế khác biệt: Google tập trung vào độ chân thực và sức mạnh thị giác, trong khi OpenAI hướng tới độ chính xác và phong cách đời thường hơn. Mặc dù GPT Image 1.5 có chi phí API tối ưu hơn ($0.009/ảnh) và khả năng tuân thủ prompt tốt hơn, Nano Banana 2 vượt trội về blending và dịch văn bản trong ảnh.
Google vừa chính thức ra mắt Nano Banana 2 (Gemini 3.1 Flash Image), một bước đi đáng chú ý khi hãng quyết định đưa những tính năng từng là đặc quyền của Nano Banana Pro xuống dòng phổ thông. Đây thật sự là một bản nâng cấp mạnh mẽ và cũng là bảo chứng cho lời hứa của Google về việc phổ cập công nghệ pro tới nhiều người dùng hơn, để ngay cả người dùng miễn phí cũng có thể trải nghiệm những tính năng pro.
Nano Banana 2 là gì và điểm khác biệt so với Nano Banana Pro?
Nano Banana 2 tận dụng sức mạnh của mô hình Gemini 3.1 Flash Image mới nhất để thực hiện các yêu cầu tạo và chỉnh sửa ảnh chỉ với tốc độ nhanh hơn hẳn so với bản pro.
Sự khác biệt cốt lõi so với phiên bản Pro
- Tốc độ: Tốc độ chính là điều Nano Banana 2 nhấn mạnh. Trong khi Nano Banana Pro tập trung vào các tác vụ yêu cầu độ trung thực cao nhất và độ chính xác tuyệt đối về dữ kiện, Nano Banana 2 ưu tiên tốc độ xử lý nhanh (tốc độ Flash) mà vẫn duy trì được chất lượng hình ảnh tương đương bản Pro.
- Chi phí: Nano Banana 2 API có mức giá rẻ hơn đáng kể. Ví dụ, một ảnh độ phân giải 1024x1024 trước đây có giá khoảng $0.13 thì nay với Nano Banana 2 chỉ còn khoảng $0.07. Tuy vẫn còn hơi cao nhưng Google đã cố gắng giảm giá để mọi người dễ tiếp cận hơn.
- Đối tượng người dùng: Nano Banana 2 chắc chắn tập trung vào nhiều người dùng hơn khi người dùng miễn phí cũng đã có thể trải nghiệm thay vì chỉ giới hạn cho các gói trả phí Pro hay Ultra như trước đây.
- Tính năng kế thừa: Nano Banana 2 đã được kế thừa các tính năng cao cấp từ bản Pro như khả năng duy trì tính nhất quán của nhân vật và diễn giải các câu lệnh phức tạp.
Các đặc điểm nổi bật của Nano Banana 2 giống với Nano Banana Pro
- Tính nhất quán của đối tượng: Đây là một nâng cấp quá hữu dụng nhưng quen thuộc đối với những ai làm marketing, tạo truyện tranh, tạo ảnh. Tính năng này của Nano Banana 2 giống với bản Pro khi cho phép giữ nguyên ngoại hình của tối đa 5 nhân vật và độ ổn định của 14 vật thể trong cùng một quy trình làm việc.
- Hiển thị văn bản chính xác và đa ngôn ngữ: Nỗi lo về lỗi chính tả hay rào cản ngôn ngữ trên hình ảnh AI giờ đây không còn lo lắng khi dùng Nano Banana. Toàn bộ những tính năng vốn làm nên tên tuổi của dòng Pro từ khả năng hiển thị đúng chính tả đến tính năng dịch thuật văn bản trực tiếp trong ảnh hiện đã được tích hợp trên Nano Banana 2. Khả năng ảnh bị lỗi chính tả, vỡ font hay nhầm ngôn ngữ đã giảm xuống rất thấp, rất hiếm khi xảy ra.
- Kết nối thông tin thời gian thực: Nano Banana 2 sử dụng Gemini và thông tin từ web search nên có thể cập nhật các thay đổi theo thời gian thực để dựng đúng các đối tượng cụ thể, tránh tình trạng lạc đề khi tạo ảnh.
- Độ phân giải cũng rất pro: Nano Banana 2 cũng rút ngắn khoảng cách tính năng với dòng pro khi đã hỗ trợ độ phân giải đầu ra từ 512px đến 4K. Người dùng có thêm nhiều tùy chọn tỷ lệ khung hình mới như 4:1, 1:4, 8:1 và 1:8.
- Tính minh bạch: Google đã đưa tất cả hình ảnh tạo ra bởi Nano Banana 2 đều được nhúng watermark bằng hệ thống SynthID và tuân thủ chuẩn C2PA để xác minh nguồn gốc AI.
Cách sử dụng Nano Banana 2 trên ứng dụng Gemini
Bạn có thể dễ dàng trải nghiệm Nano Banana 2 trực tiếp trên Gemini app hoặc Google AI studio dù sử dụng gói miễn phí hay pro hoặc ultra:
- Bất ngờ: Thật sự bất ngờ khi mà Nano Banana 2 cho chọn trực tiếp kiểu ảnh đầu ra với mẫu ở ngay trên Gemini app mà không cần phải nhập chữ vào prompt nữa. Tuy kết quả vẫn cho ra chưa được ưng ý cho lắm nhưng khi không cần nhập prompt nữa giảm thiểu khả năng quên ghi vào style ảnh để Nano Banana có thể đưa ra những tấm ảnh đúng ý người dùng.

Còn đối với chọn khung hình người dùng vẫn cần chọn khung hình viết trực tiếp vào prompt, đây là điều mình rất nhiều khi quên khi vào prompt.
Lưu ý: Nếu bạn là người dùng Pro/Ultra và cần độ chính xác dữ kiện tối đa, bạn vẫn có thể gọi lại Nano Banana Pro thông qua menu ba chấm (chọn regenerate/redo).
Cuộc đối đầu của Nano Banana 2 với GPT Image 1.5
Tuy là GPT Image 1.5 nên so sánh với dòng Pro nhưng mình vẫn muốn hướng đến sự so sánh thú vị khi mà GPT Image 1.5 và Nano Banana 2 hướng đến những mục tiêu tạo ảnh khác nhau và người dùng khác nhau:
Sự khác nhau về triết lý thiết kế giữa OpenAI và Google
- GPT Image 1.5 thì được OpenAI thiết kế như là một studio sáng tạo tập trung vào độ chính xác. Nó mang lại những trải nghiệm giống với những thiết kế của những bức ảnh đời thường hơn so với Nano Banana.
- Nano Banana 2 thì lại được ví như một nhà quay phim khi tập trung vào sức mạnh thị giác. Google nhấn mạnh vào tri thức "thế giới thực" để tạo ra những hình ảnh có độ chân thực rất cao, ánh sáng sống động và chi tiết sắc nét nhất có thể.
Trải nghiệm thực tế giữa hai mô hình có khác nhau nhiều không
Dựa trên các thử nghiệm đối đầu, kết quả cho thấy sự khác biệt rõ rệt về phong cách:
- Độ chân thực và phong cách ảnh: GPT Image 1.5 có khả năng tạo ra các bức ảnh mang tính đời thường, có độ nhiễu và tự nhiên hơn giống như ảnh chụp bằng iPhone có đèn flash. Ngược lại, Nano Banana thường cho kết quả quá hoàn hảo, đôi khi trông giống ảnh chụp studio hoặc ảnh quảng cáo đã được hậu kì rất phức tạp rồi.
- Khả năng tuân thủ prompt: GPT Image 1.5 tất nhiên là nổi bật hơn với khả năng bám sát prompt vì nếu muốn bám sát Prompt thì người dùng Google phải nâng cấp lên bản pro. Ví dụ trong bài kiểm tra tạo lưới (grid) 6x6 với 36 vật thể khác nhau, nó đã hoàn thành chính xác vị trí của từng đối tượng, điều mà các Nano Banana thế hệ trước chắc chắn thất bại. Nano Banana 2 cũng đã cải thiện rất nhiều ở mảng này nhưng đôi khi vẫn có cách hiểu mang tính sắp đặt sẵn hơn.
- Chữ viết trong ảnh: Cả hai đều đã khắc phục tốt lỗi chính tả trong ảnh, tuy nhiên với GPT Image 1.5 thì thường có bố cục thiết kế giống như các mẫu Canva sẵn có trong khi Nano Banana 2 mạnh về khả năng dịch văn bản ngay bên trong ảnh, ví dụ Nano Banana 2 có khả năng dịch chữ viết trên bia đá ngay trong ảnh.
- Chỉnh sửa trực tiếp: GPT Image 1.5 mạnh về in-painting thay đổi một chi tiết cụ thể (như màu áo) mà vẫn giữ nguyên khuôn mặt và ánh sáng. Nano Banana 2 lại mạnh về blending, có thể kết hợp tối đa 14 hình ảnh tham chiếu để tạo ra một ảnh phức tạp về độ sáng, chiều sâu, màu sắc.
- Tốc độ: Cả hai đều cực nhanh. GPT Image 1.5 và Nano Banana 2 đều rất nhanh bằng mắt thường khó mà thấy được cái nào nhanh hơn.
- Chi phí API: GPT Image 1.5 mang lại mức giá tối ưu hơn cho việc tạo ảnh tiêu chuẩn (khoảng $0.009/ảnh). Dưới đây là bảng so sánh chi phí chi tiết để mọi người tham khảo
So sánh chi phí API của các model tạo ảnh hiện nay
Với Nano Banana 2, Google không chỉ chạy đua về mặt công nghệ mà còn tập trung vào trải nghiệm thực tế của người dùng thông qua tốc độ cực nhanh và khả năng kiểm soát hình ảnh chuyên nghiệp. Đây chắc chắn là công cụ không thể bỏ qua cho các nhà sáng tạo nội dung và marketer trong năm 2026.



