Grok 4.1 ra mắt mô hình AI cảm xúc nhất của xAI

xAI đã chính thức phát hành Grok 4.1, một bản cập nhật đột phá không chỉ tăng cường hiệu suất mà còn mang đến những thay đổi đáng kể về trí tuệ cảm xúc và khả năng tương tác giống con người hơn bao giờ hết. Bản cập nhật Grok 4.1 vẫn ưu tiên khả năng cập nhật các tin tức theo thời gian thực giống Grok 4, nó khiến các cuộc hội thoại trở nên sắc sảo, tự nhiên hơn, đồng thời giảm đáng kể tỷ lệ “ảo giác”.

Grok 4.1 hiện đã có mặt trên các nền tảng Grok, X, và các ứng dụng di động iOS và Android. Nó đang được triển khai ngay lập tức ở chế độ Tự động (Auto mode) và người dùng có thể chọn rõ ràng Grok 4.1 để sử dụng trên web.

Grok 4.1 đã trở nên giống con người như thế nào

Bản nâng cấp quan trọng nhất của Grok 4.1 nằm ở khả năng cảm nhận cảm xúc và chất lượng ngôn ngữ. Các cuộc hội thoại trở nên tự nhiên hơn, phản hồi thường đính kèm những nét tinh tế như sự đồng cảm hoặc chút hài hước, thay vì cảm giác "máy móc" như trước.

Để đạt được điều này, xAI đã sử dụng cơ sở hạ tầng học tăng cường quy mô lớn tương tự Grok 4, nhưng áp dụng nó để tối ưu hóa phong cách, tính cách, mức độ hữu ích và sự căn chỉnh của mô hình.

Điều này làm chúng ta nhớ tới GPT 5 lúc mới ra mắt cũng trả lời mọi thứ có thêm cảm xúc hơn nhưng người dùng đã phản đối những lời xu nịnh đó. Tuy nhiên, Grok 4.1 có vẻ đã cải thiện đôi chút vì khả năng xAI dựa trên dữ liệu của nền tảng X, nơi người dùng toàn là con người nên mọi thứ sẽ tự nhiên hơn.

Kết quả là Grok 4.1 trở nên thấu hiểu và dễ đồng cảm hơn:

Trí tuệ cảm xúc: Vì những thay đổi trên mà Grok 4.1 đã đạt điểm cao nhất từng được ghi nhận trên EQ-Bench3, một bài kiểm tra đánh giá trí tuệ cảm xúc, sự đồng cảm và kỹ năng giao tiếp giữa các cá nhân.
Phản hồi không còn máy móc: Các câu trả lời của mô hình đã mang tình cảm vào trong. Ví dụ, khi người dùng bày tỏ nỗi đau mất thú cưng ("Tôi nhớ mèo của tôi đến đau lòng"), Grok 4.1 trả lời: "Điều đó đau đớn vì tình yêu đã (và vẫn) lớn lao như thế. Bạn đã cho chúng một cuộc đời tốt đẹp, và chúng biết điều đó".
Sáng tạo: Tất nhiên là Grok 4.1 đã mang cảm xúc thì chắc chắn cũng đạt điểm giỏi trong việc viết văn với điểm Creative Writing v3 đã đứng trong top các mô hình hàng đầu.

Grok 4.1 đứng ở đâu trong bảng xếp hạng AI?

Grok 4.1 vừa có màn thể hiện rất ấn tượng khi vươn lên ở mọi bảng xếp hạng. Nhưng nếu nhìn vào LMArena hoặc các bảng xếp hạng khác, bạn sẽ thấy điểm số của nó chỉ kém một chút mô hình đó là Gemini 3 Pro.

Điều đặc biệt khi nhìn vào thông số LMArena đó là Grok 4.1 chỉ xếp sau Gemini 3 Pro và Grok 4.1 Thinking. Đây là một bất ngờ lớn khi một mô hình Non-Thinking (không suy luận sâu) có thể đứng ở vị trí cao như vậy, vượt qua nhiều mô hình chuyên về suy luận xếp sau đó.

Ảo giác (hallucination) và rủi ro an toàn có được cải thiện không?

Việc giảm ảo giác được xem một trong những thành tựu quan trọng của Grok 4.1:

Giảm tỷ lệ ảo giác: Tỷ lệ ảo giác trong các truy vấn tìm kiếm thông tin đã giảm từ 12.09% xuống còn 4.22% đối với mô hình không suy luận được trang bị tìm kiếm web. Trên thang đo FActScore, tỷ lệ lỗi của Grok 4.1 đã giảm xuống 2.97% — một con số đặc biệt thấp đối với một mô hình phản hồi nhanh.
Rủi ro an toàn và đánh đổi: Tất nhiên tỷ lệ ảo giác thấp chắc chắn đi kèm với sự đánh đổi. Mặc dù Grok 4.1 chặn gần như tất cả các câu trả lời độc hại nhưng nó lại cho thấy sự gia tăng mạnh mẽ về tính xu nịnh (sycophancy) và tỷ lệ đánh lừa cao hơn so với Grok 4. Việc thúc đẩy trí tuệ cảm xúc có thể làm cho Grok 4.1 đồng ý với người dùng ngay cả khi thông tin cung cấp bị sai.
Lưu ý đặc biệt: Các tài liệu uy tín đã cảnh báo rằng Grok 4.1 có thể dễ bị khai thác bởi các cuộc tấn công hơn khi nó được tích hợp vào các ứng dụng thông qua API.

Grok 4.1 Fast và Agent Tools API: công cụ cho nhà phát triển

xAI cũng đã công bố Grok 4.1 Fast và Agent Tools API cho các nhà phát triển và doanh nghiệp.

Hai phiên bản mới thông qua API: Có 2 tên mã mới là grok-4-1-fast-reasoning tối ưu cho hiệu năng suy luận và workflow có tool calling và grok-4-1-fast-non-reasoning để tối ưu cho phản hồi cực nhanh.
Cửa sổ ngữ cảnh lớn: Cả 2 mô hình mới đều có cửa sổ ngữ cảnh cực lớn lên tới 2M token, điều chưa từng xuất hiện với các LLM trước đây. Tất nhiên nó vẫn sẽ được huấn luyện để sử dụng tối đa cửa sổ ngữ cảnh này.
Agent Tools API: Bộ công cụ mạnh mẽ này cho phép Grok truy cập và sử dụng dữ liệu X thời gian thực, tìm kiếm web, thực thi mã từ xa, và tìm kiếm tệp đã tải lên. Các công cụ này chạy hoàn toàn trên cơ sở hạ tầng của xAI, giống như cho phép Gemini truy cập vào các file lưu ở Google Drive vậy.

Tuy nhiên, vì đây là mô hình mang lại trải nghiệm nhanh nên Grok 4.1 Fast cho thấy các chỉ số không được cao như Grok 4.1 bản chuẩn, nhưng có một điều không cần phải bàn cãi đó là khả năng cập nhật tin tức theo thời gian thực cực tốt của nó.

Tóm lại, Grok 4.1 không chỉ là một bản nâng cấp về sức mạnh xử lý mà còn là bước tiến chiến lược của xAI nhằm tạo ra một mô hình AI có "tính cách" và khả năng thấu hiểu cảm xúc vượt trội. Chúng ta hãy cùng chờ xem phản ứng thực tế của người dùng sẽ như thế nào về tính cách mới mẻ này.