Quay lại trang tin tức

Con người đã thắng robot Figure AI trong cuộc đua phân loại hàng hóa

Xuất bản vào 19 tháng 05, 2026
Con người đã thắng robot Figure AI trong cuộc đua phân loại hàng hóa

Tóm tắt nhanh

Trong cuộc đua phân loại bưu kiện đầy kịch tính kéo dài hơn 24 giờ của Figure AI, nhân viên Aime đã chiến thắng sát nút robot thế hệ mới Figure 03 với khoảng cách vỏn vẹn 0,04 giây.

Con người đã thắng. Nhưng cánh tay trái của anh gần như gãy, ngón tay phồng rộp, và anh thú nhận chỉ cần thêm 30 phút nữa là phải bỏ cuộc sau cuộc thi phân loại hàng hóa. Robot thì vẫn đang chạy tất nhiên là không mệt, không đau, không cần nghỉ. Đó là câu chuyện đằng sau tấm huy chương "chiến thắng" của con người trong cuộc đối đầu phân loại hàng hóa diễn ra ở Figure AI .

Cuộc đối đầu 10 tiếng giữa người và máy

Figure AI công ty robot hình người được định giá 39 tỷ USD đã tổ chức một thử nghiệm trực tiếp mang tên "Man vs. Machine": robot F.03 (Figure 03) đối đầu với một thực tập sinh tên Aime trong ca phân loại hàng hóa kéo dài 10 tiếng. Nhiệm vụ đơn giản đến mức nhàm chán: nhận diện mã vạch, nhặt kiện hàng, đặt úp mã vạch xuống băng chuyền lặp đi lặp lại liên tục.

Kết quả cuối ca:

  • Aime (người): 12.924 kiện hàng — trung bình 2,79 giây/kiện
  • F.03 (robot): 12.732 kiện hàng — trung bình 2,83 giây/kiện

Chênh lệch: 192 kiện và 0,04 giây mỗi lần xử lý. Con người thắng — theo đúng nghĩa đen của bảng điểm.

Nhưng "thắng" ở đây nghĩa là gì?

CEO Brett Adcock viết trên X sau trận đấu: "Xin chúc mừng Aime! Anh ấy nói cánh tay trái mình gần như gãy rồi 😂 Đây là lần cuối cùng con người thắng được."

Video livestream về màn so tài giữa người và robot

Và đó chính là điểm mấu chốt mà con số 12.924 vs 12.732 không thể hiện được.

Robot không đập tay, không uống bia ăn mừng

Sau 10 tiếng, Aime ngồi xuống, xoa cánh tay, thở phào. Anh thừa nhận chỉ cần thêm 30 phút nữa là đã phải bỏ cuộc vì đau lưng và cẳng tay. F.03 thì tiếp tục chạy không ăn mừng, không nghỉ ngơi, không cần ai vỗ vai khen ngợi chắc chắn trong khi Aime ngủ đêm đó, robot vẫn đang phân loại ca tiếp theo.

Theo luật lao động California, Aime được nghỉ ăn trưa và các giờ nghỉ có lương trong ca. Robot không thuộc phạm vi điều chỉnh của bất kỳ bộ luật lao động nào. Đây không phải bất công mà đây là bản chất của vấn đề: con người và máy đang chơi theo hai bộ quy tắc hoàn toàn khác nhau.

Một ca làm việc đối đầu với một tuần làm việc

Người ta thường so sánh hiệu suất trong một ca 8 - 10 tiếng. Nhưng nếu kéo dài phép đo ra một tuần làm việc, bức tranh thay đổi hoàn toàn. Figure AI trước đó đã chứng minh F.03 có thể vận hành liên tục 24 giờ, xử lý hơn 30.000 kiện hàng mà không có một lỗi dừng máy nào. Con người làm 5 ngày/tuần nhưng robot có thể làm 7 ngày, 3 ca.

Figure 03 là robot như thế nào?

F.03 được Figure AI ra mắt vào tháng 10/2025. Robot cao 5'8" (khoảng 173 cm), nặng 61 kg, có thể mang tải 20 kg và sạc không dây thông qua tấm sạc tích hợp ở lòng bàn chân. Điểm nổi bật là các đầu ngón tay xúc giác có thể cảm nhận lực từ 3 gram đủ nhạy để cầm nắm vật mỏng manh mà không làm vỡ.

Tại nhà máy BMW ở Spartanburg, phiên bản trước đó (F.02) đã lắp ráp hơn 30.000 xe với độ chính xác 99%. Figure đang xây dựng nhà máy BotQ với công suất thiết kế ban đầu 12.000 robot/năm, hướng tới 100.000 robot/năm trong vài năm tới.

Tại sao kết quả này lại quan trọng mặc dù con người đã thắng?

Không phải vì robot sắp chiếm hết việc làm kho vận ngay ngày mai. Mà vì khoảng cách hiệu suất giữa người và máy trong lao động thể chất lặp đi lặp lại đang co lại với tốc độ đáng lo ngại. Năm ngoái, F.03 có thể còn thua cách biệt lớn hơn trong khi năm nay khoảng cách chỉ là 0.04s /1 kiện hàng. Năm tới, Adcock đã tuyên bố sẽ cải tiến cả phần cứng lẫn phần mềm AI và lần sau, theo lời ông con người sẽ không còn cơ hội thắng nữa.

Microsoft AI CEO Mustafa Suleyman dự báo AI sẽ tự động hóa phần lớn công việc văn phòng trong 12–18 tháng tới. Còn với lao động thể chất, cuộc thi này cho thấy: ranh giới đang mỏng dần, và "lần cuối cùng con người thắng" theo đúng nghĩa đen có thể không còn xa.

Điều còn lại sau cuộc đua

Sự thành công của buổi thử nghiệm đã thổi bùng lên những cuộc thảo luận sôi nổi về tương lai của thị trường lao động trong ngành logictics. Khi robot hình người đã đạt đến hiệu suất xấp xỉ con người, việc áp dụng chúng trên quy mô lớn chỉ còn là vấn đề thời gian và chi phí sản xuất. Các doanh nghiệp sẽ có xu hướng chuyển giao những công việc lặp đi lặp lại và có tính chất nặng nhọc cho máy móc đảm nhận.

Mặc dù vậy điều này không có nghĩa là con người sẽ hoàn toàn bị thay thế trong các nhà kho thông minh. Thay vào đó lao động con người và các AI thông minh khác sẽ chuyển dịch sang các vai trò giám sát hệ thống, xử lý các tình huống phức tạp hoặc quản lý chuỗi cung ứng ở cấp độ cao hơn. Sự kết hợp hài hòa giữa sức bền của robot và trí tuệ của con người sẽ tạo nên những mô hình nhà kho có hiệu quả vượt bậc.

Thảo luận (0)

Đăng nhập để tham gia thảo luận.

Chưa có bình luận nào. Hãy là người đầu tiên!

Các bài viết liên quan

Google Antigravity công cụ AI thay đổi quy trình làm việc

Bạn gõ một câu lệnh, AI tự lên kế hoạch, mở terminal, viết code, mở trình duyệt web kiểm tra rồi báo lại kết quả, Antigravity làm tất cả trong khi bạn đang uống cà phê. Đó không phải viễn cảnh tương lai, đó là cách Google Antigravity hoạt động và nó vừa thay đổi hoàn toàn cách mình tiếp cận việc xây dựng sản phẩm và quy trình tự động. Google Antigravity là gì? Antigravity là IDE thế hệ mới do Google ra mắt cuối tháng 11 năm 2025 cùng lúc với Gemini 3, được xây dựng trên nền VS Code nhưng với kiến trúc hoàn toàn khác: thay vì AI ngồi ở sidebar gợi ý từng dòng code, AI trong Antigravity làm việc như một agent thực sự một khi đã được cấp quyền thì chúng ta có thể giao task và Antigravity tự hoàn thành task đó để cho ra kết quả rất giống với Manus và Flowith nhưng ở đây Antigravity thiên về màn hình làm việc với code hơn. Điểm khác biệt lớn nhất so với Cursor hay GitHub Copilot là Antigravity không hỏi bạn từng bước mà hoạt động bất đồng bộ đó là khi bạn giao task, agent chạy ngầm trong nền trong khi bạn làm việc khác rồi quay lại xem kết quả. Antigravity hoàn thành một feature Next.js + Supabase điển hình trong 42 giây so với 68 giây của Cursor, và độ chính xác khi refactor đạt 94% so với 78% của Cursor. Antigravity đã có phần mềm hỗ trợ macOS, Windows và Linux nên mọi người không lo về vấn dề phần mềm mà chỉ nên lo về chi phí gọi API. Ngoài sử dụng Gemini 3 và Gemini 3 pro mặc định, Antigravity còn hỗ trợ Claude Sonnet, Claude Opus và GPT-OSS thật tốt khi không bị khoá vào nền tảng của Google khi mà Claude Sonnet, Claude Opus đang dẫn đầu thị trường. Các tính năng tiêu biểu của Antigravity IDE Chỉnh sửa trực tiếp với sự hỗ trợ của AIVới giao diện quen thuộc như VS Code, nơi các lập trình viên có thể chỉnh sửa code tay hoặc nhờ AI hỗ trợ từng đoạn cụ thể. Phù hợp khi bạn muốn kiểm soát từng bước hoặc xử lý những đoạn code cần sự chú ý cao. Điều phối agent chạy song song Đây là điểm khác biệt thực sự của Antigravity thực sự với "mission control" bạn không cần viết code ở đây mà điều phối nhiều agent chạy song song. Ví dụ một agent đang refactor module A, agent khác đang viết test cho module B, agent thứ ba đang debug lỗi UI trên trình duyệt web. Bạn theo dõi tiến độ, để lại comment như trên Google Docs và agent tự điều chỉnh mà không cần dừng lại chờ. Truy cập và điều khiển trình duyệt web Đây là tính năng mình thấy ấn tượng nhất khi mới dùng khi mà Antigravity có thể mở trình duyệt web như Chrome, Firefox,... khi được cấp quyền từ đó nó có thể điều hướng trang web, điền form và kiểm tra giao diện hoàn toàn tự động. Tuy nhiên cần lưu ý rằng Antigravity hoạt động giống hệt như Puppeteer nên chỉ tương tác được với các tác vụ trên trình duyệt và khi cần có thể xử lý ảnh và chụp ảnh màn hình và tất nhiên chưa hoạt động được với những trang web đã cài đặt chặn bot truy cập. Logic của Antigravity rất rõ ràng Đây là tính năng mình thích nhất khi làm việc với Antigravity đó là thay vì đổ raw code ra màn hình, agent tạo ra các deliverable có thể đọc được như task list, implementation plan, screenshot màn hình app đang chạy để bạn kiểm tra logic của agent cả trước và sau khi hoàn thành task, điều này giúp bạn luôn nắm được agent đang làm gì để đánh giá. Antigravity đang được dùng để làm những gì trong thực tế? Nhiều người nghe đến Antigravity và nghĩ ngay đây là công cụ dành riêng cho lập trình viên chuyên nghiệp. Thực tế thì không phải vậy vì phạm vi ứng dụng rộng hơn nhiều so với vẻ ngoài kỹ thuật của nó. Xây dựng và triển khai website Đây là use case phổ biến nhất. Bạn mô tả trang web muốn xây — stack kỹ thuật, tính năng, phong cách thiết kế — agent tự viết code, tự kiểm tra trên browser và tự sửa lỗi. Kết hợp với Google Stitch qua MCP, bạn có thể đi từ thiết kế UI đến sản phẩm chạy thực sự mà không cần chuyển qua lại giữa nhiều công cụ. Ví dụ prompt dùng trong Antigravity: "Xây cho mình một landing page bằng Next.js và Tailwind CSS cho sản phẩm SaaS quản lý công việc nhóm. Có section hero, bảng giá 3 gói và form đăng ký email. Deploy lên localhost và chụp screenshot kết quả." Tự động hóa quy trình lặp lại Một trong những điểm mạnh thực tế nhất. Bạn có thể nhờ Antigravity tự động crawl dữ liệu từ nhiều nguồn, tổng hợp và gửi báo cáo theo lịch, hoặc tự động điền form và thực hiện các thao tác lặp đi lặp lại trên trình duyệt — những việc trước đây cần viết script riêng hoặc dùng công cụ automation phức tạp. Ví dụ prompt: "Mỗi sáng 8 giờ, vào trang thống kê của website mình tại [URL], lấy số liệu pageview và top 5 bài viết và xem thông tin 5 bài viết của trang fanpage Facebook của mình ở trang [URL], tổng hợp thành file markdown và lưu vào thư mục /reports/daily." Lưu ý: Facebook hoàn toàn không thích bot truy cập vào trang của họ cho nên hãy làm sao để bot thao tác gần như con người trên trình duyệt để không bị dính lỗi checkpoint của Facebook có thể dẫn đến khóa tài khoản. Xây dựng hệ thống AI agent Đây là use case mà Antigravity thực sự vượt trội so với các công cụ khác. Thay vì chỉ viết một đoạn code đơn lẻ, bạn có thể mô tả cả một pipeline — ví dụ "tạo hệ thống phân tích review sản phẩm từ nhiều nguồn, phân loại sentiment và tự động tag vào database" — rồi để Antigravity thiết kế kiến trúc agent, phân chia nhiệm vụ và triển khai từng bước. Ví dụ prompt: "Tạo một hệ thống gồm 3 agent: agent 1 crawl review sản phẩm từ Shopee và Lazada mỗi ngày, agent 2 phân tích sentiment và phân loại theo chủ đề, agent 3 tổng hợp thành báo cáo tuần và lưu vào Google Sheets." Refactor và cải thiện codebase có sẵn Nếu bạn có một dự án cũ cần nâng cấp, Antigravity đặc biệt hữu ích khi cần refactor quy mô lớn có thể thay đổi toàn bộ cấu trúc file, cập nhật dependencies, viết test coverage cho code chưa có test. Agent đọc toàn bộ codebase, hiểu ngữ cảnh và thực hiện thay đổi nhất quán trên nhiều file cùng lúc thay vì sửa từng chỗ một. Ví dụ prompt: "Đọc toàn bộ codebase trong thư mục /src, đóng vai chuyên gia bảo mật xem có dính lỗi SQL injection, các lỗ hổng owasp không đề xuất chỉnh sửa sao cho vẫn giữ nguyên logic và đảm bảo không có lỗi sau khi refactor." Nghiên cứu và tổng hợp thông tin từ web Vì Antigravity có thể điều khiển trình duyệt, bạn có thể dùng nó để tự động truy cập nhiều trang web, trích xuất thông tin theo cấu trúc bạn định sẵn và tổng hợp lại thành báo cáo hoặc database — phù hợp với các tác vụ research cần thu thập dữ liệu từ nhiều nguồn mà làm thủ công sẽ rất tốn thời gian. Ví dụ prompt: "Vào 10 trang web tin tức AI này [danh sách URL] và các trang fanpage [danh sách URL] tìm các bài đăng trong 7 ngày qua, trích xuất tiêu đề, tóm tắt 2 câu và link gốc, lưu vào file CSV theo thứ tự mới nhất trước." Các câu hỏi thường gặp khi sử dụng Antigravity Antigravity có miễn phí không? Có cả gói miễn phí và trả phí. Gói miễn phí có quota reset theo tuần với rate limit hạn chế, đủ để thử nghiệm và làm project nhỏ. Gói Pro/Ultra có quota reset mỗi 5 giờ và được ưu tiên cao nhất rất phù hợp nếu bạn dùng Antigravity hàng ngày cho công việc thực tế. Antigravity có làm được việc với file Word, Excel, PDF không? Antigravity cài Puppeteer nên hoạt động chủ yếu qua trình duyệt web và chưa thể tác động trực tiếp vào các loại file như Word, Excel hay PDF. Nếu cần xử lý những file này, bạn phải thêm vào workflow và mention trong phần cấu hình để agent biết cách tiếp cận đúng. AI không phản hồi hoặc bị treo phải làm gì?Đây là lỗi khá phổ biến, đặc biệt vào giờ cao điểm khi nhiều người dùng đồng thời. Trong hầu hết trường hợp, chỉ cần restart lại Antigravity là được hoàn toàn không cần lo mất dữ liệu hay phải thiết lập lại từ đầu. Ngoài ra, nên dùng git và commit thường xuyên trước khi giao task lớn để tránh mất code nếu agent bỏ dở giữa chừng. Antigravity thực sự là công cụ quá mạnh mẽ vì sao chúng ta không thử ngay. Người dùng có thể tải về tại antigravity.google/download và bắt đầu với một project nhỏ — không phải để thử tính năng mà để hiểu tư duy làm việc mới này trước khi đưa vào dự án thực tế.

An
30 thg 3, 2026
Anthropic liên tục tung tính năng mới với Claude Code

Anthropic dường như không hề cho thế giới công nghệ đặc biệt là anh em coder nghỉ ngơi dù chỉ một ngày. Trong bối cảnh Claude Code đang có tốc độ tăng trưởng chóng mặt (doanh thu đã chạm mốc 2.5 tỷ đô chỉ sau 2 tháng ra mắt và có tới 29 triệu lượt cài đặt), nhưng Anthropic không dừng lại mà liên tục tung ra những tính năng mới cho Claude Code như Scan Security, Schedule Task và Remote Control. Điều này làm cho mọi người thi nhau bàn tán rằng đúng là Claude tự code các tính năng cho chính nó, cho nên con người mới không theo kịp được.Một khi đã dấn thân vào tìm hiểu và trải nghiệm hệ sinh thái của Claude Code, mình cam đoan rằng bạn sẽ rơi vào trạng thái nghiện vibe code với công cụ này đến mức cực khó để quay lại cách làm việc truyền thống, đơn giản là vì những tính năng mới mà Claude Code mang lại vượt xa mọi kỳ vọng thông thường.Scan Security (Claude Code Security)Đây là khả năng quét lỗ hổng bảo mật được tích hợp trực tiếp vào Claude Code. Ngay khi Claude Code công bố tính năng Scan Security này đã thổi bay hàng tỷ đô vốn hóa của nhiều ông lớn bảo mật như CrowdStrike (giảm 7,8%), Okta (giảm 9,2%) và nhiều cái tên lớn khác như Cloudflare, Zscaler, Tenable, SentinelOne, Fortinet và Palo Alto Networks cũng chứng kiến sự sụt giảm lên tới hơn 10%.Claude Code Scan Security là gì?: Không giống các công cụ truyền thống chỉ so khớp mẫu (pattern matching), Claude Code Security có khả năng tư duy giống một chuyên gia bảo mật. Nó phân tích cách các thành phần tương tác, truy vết dòng dữ liệu và phát hiện các lỗi logic phức tạp hoặc lỗi kiểm soát truy cập mà các công cụ thông thường thường bỏ sót.Trải nghiệm sử dụng có tốt không: Bạn chỉ cần chạy lệnh /security-review trong terminal. Claude sẽ phân tích mã nguồn, đưa ra giải thích chi tiết cho từng vấn đề và đề xuất các bản vá (patch) để bạn xem xét phê duyệt.Khi nào cần sử dụng: Bạn nên sử dụng tính năng này trước khi commit những thay đổi quan trọng hoặc khi chuẩn bị đưa mã nguồn lên môi trường production để đảm bảo an toàn tối đa, tránh những lỗi ngớ ngẩn phải trả giá bằng tiền.Schedule Task (Lập lịch công việc)Tính năng này cho phép bạn tạo ra các công việc hoặc workflow lặp đi lặp lại cho Claude Cowork chạy một cách tự động. Claude sẽ lưu lại các chỉ dẫn (prompt) của bạn và thực hiện chúng theo chu kỳ bạn chọn (hàng giờ, hàng ngày, hàng tuần). Nó có thể truy cập vào các công cụ đã kết nối như Slack, Google Drive để thu thập dữ liệu và xử lý.Trải nghiệm sử dụng: Bạn có thể thiết lập thông qua lệnh /schedule hoặc qua tab "Scheduled" trên giao diện Claude Desktop. Claude sẽ tự động thực hiện và gửi kết quả (báo cáo, tóm tắt) khi hoàn thành. Tuy nhiên, máy tính của bạn cần phải kết nối mạng và ứng dụng Claude Desktop phải đang mở để tác vụ chạy đúng lịch.Khi nào cần sử dụng: Rất hữu ích để tạo các bản tin tóm tắt hàng ngày từ email/Slack, lập báo cáo tuần từ bảng tính, hoặc theo dõi tin tức đối thủ cạnh tranh một cách đều đặn mà không cần thao tác thủ công mỗi lần đặc biệt là khi bạn đã cấp một số quyền cho Cowork tương tác với máy của bạn. Tính năng này cực kỳ hợp với anh em Việt Nam làm việc xuyên múi giờ. Bạn có thể set lịch để Claude chạy test hoặc tổng hợp report vào 3 giờ sáng (giờ Việt Nam) để sáng hôm sau thức dậy là có ngay kết quả báo cáo cho khách hàng bên Mỹ, châu Âu không cần phải cắm máy thức đêm canh chừng nữa, quá tiện phải không nào.Remote Control (Điều khiển từ xa)Đây được coi là tính năng "phong cách sống" giúp bạn duy trì luồng công việc ngay cả khi rời khỏi bàn làm việc. Nhưng nhắc nhở mọi người một chút là hãy sử dụng khi thực sự cần thiết còn không hãy dành thời gian nghỉ ngơi hợp lý vì khi đó chúng ta sẽ duy trì làm việc liên tục có thể dẫn đến kiệt sức.Tính năng remote control này dành cho ai: Remote Control tạo ra một lớp đồng bộ hóa bảo mật giữa terminal tại máy cục bộ và ứng dụng Claude trên điện thoại (hoặc trình duyệt web khác). Code của bạn vẫn nằm an toàn trên máy cục bộ, điện thoại chỉ đóng vai trò là một "cửa sổ" để điều khiển buổi làm việc đó. Trước đây ai đã từng phải remote về máy công ty qua VPN hay Tailscale bằng mạng 4G,5G trên đường phố Hà Nội hay Sài Gòn chắc chắn sẽ thấy tính năng /rc này là chân ái vì nó mượt mà và native hơn rất nhiều.Trải nghiệm sử dụng: Chỉ cần chạy lệnh claude rc hoặc /rc trong terminal, một mã QR sẽ hiện ra. Bạn quét mã bằng điện thoại và từ đó có thể theo dõi Claude đang làm gì trong thời gian thực, phê duyệt hoặc từ chối các thay đổi file, và đưa ra các chỉ dẫn tiếp theo.Khi nào cần sử dụng: Đây chính là cứu cánh khi bạn đang thực hiện một tác vụ dài hơi (như refactor toàn bộ thư viện hoặc debug một bản build phức tạp) nhưng cần phải đứng dậy đi gặp ai đó hoặc có việc gấp. Thực tế khi bạn đang ngồi tại văn phòng khởi động một dự án lớn, nhưng đến giờ phải đi gặp đối tác. Thay vì phải đợi xong việc mới đi, bạn chỉ cần bật /rc, cầm điện thoại lên xe Grab rồi trên đường đi, bạn vẫn có thể theo dõi tiến độ, duyệt các file mà Claude đã viết xong và ra lệnh chỉnh sửa trực tiếp ngay trên xe. Khi bạn đến nơi gặp khách hàng, công việc lập trình đã hoàn thành một cách trôi chảy.Lưu ý: Hiện tại tính năng Remote Control đang ở bản preview dành cho các gói trả phí (Pro hoặc Max) chưa hoàn toàn phổ biến và yêu cầu máy tính của bạn phải luôn bật và kết nối internet.

Nam
27 thg 2, 2026
Đầu năm Google tiếp tục dội bom thị trường với việc ra mắt Gemini 3.1 Pro

Khi Gemini 3 Pro còn chưa nguội thì Google đã liên tục làm nóng thị trường AI bằng Gemini 3.1 Pro, đánh dấu bản cập nhật đầu tiên trong hệ thống Gemini 3. Được xây dựng dựa trên nền tảng của Gemini 3 Pro (ra mắt tháng 11/2025), phiên bản 3.1 Pro không chỉ là một bản nâng cấp nhẹ khi tích hợp các kỹ thuật suy luận Deep Think và tiếp tục cuộc đua với các ông lớn khác khi mà Claude Opus 4.6, Claude 4.6 Sonnet cứ ra mắt liên tục.Trên bảng điểm benchmark Gemini 3.1 Pro đứng ở đâu?Như thường lệ Gemini 3.1 Pro lại tiếp tục càn quét nhiều bảng xếp hạng. Sức mạnh của nó không thể nào xem thường được và vẫn tiếp tục đứng đầu:ARC-AGI-2 (Suy luận trừu tượng): Đạt 77,1%, cao hơn gấp đôi so với 31,1% của Gemini 3 Pro. Con số này vượt xa các đối thủ hàng đầu như Claude Opus 4.6 (68,8%) và GPT-5.2 (52,9%).GPQA Diamond (Khoa học cấp độ sau đại học): Đạt 94,3%, dẫn đầu thị trường AI hiện nay.SWE-bench Verified (Lập trình): Đạt 80,6%, chính thức thu hẹp khoảng cách và cạnh tranh trực tiếp với các mô hình chuyên mã nguồn của Anthropic.Khả năng đa phương thức: Dẫn đầu trên 13/16 bài kiểm tra benchmark mà Google đánh giá.Những cải tiến so với Gemini 3 như thế nàoTích hợp Deep Think nhưng tốc độ vượt trộiGemini 3.1 Pro đưa kỹ thuật suy luận Deep Think trực tiếp vào mô hình tiêu chuẩn. Điều này cho phép người dùng nhận được khả năng suy luận mà không phải chịu độ trễ lớn như các phiên bản chuyên sâu trước đây.Tối ưu cho quy trình làm việc của Agent (Agentic Workflows)Mô hình mới được tinh chỉnh để thực hiện các tác vụ đa bước, sử dụng công cụ chính xác và có khả năng tự sửa lỗi tốt hơn. Google cũng ra mắt một endpoint chuyên dụng là gemini-3.1-pro-preview-customtools để tối ưu hóa việc gọi hàm (function calling) cho các nhà phát triển xây dựng agent.Sáng tạo với mã nguồn và hình ảnh độngGemini 3.1 Pro có khả năng dịch các chủ đề văn học thành mã chức năng, ví dụ như tạo website mang phong cách của một cuốn tiểu thuyết. Ngoài ra, nó có thể tạo các hình ảnh động svg trực tiếp từ văn bản, những tệp này cực kỳ nhẹ và sắc nét ở mọi quy mô vì được xây dựng bằng mã thay vì pixel truyền thống.Google cũng cho ra mắt luôn Veo 3.1 cùng với Gemini 3.1Cùng với sự ra mắt của Gemini 3.1 Pro, mô hình tạo video Veo 3.1 cũng được Google cho ra mắt luôn, đúng là sau tết các ông lớn đồng loạt nổ bom tấn, Veo 3.1 có thể cho phép:Tạo video chất lượng cao dài 8 giây kèm âm thanh.Hỗ trợ tạo video theo chiều dọc cho mạng xã hội.Cho phép tải lên nhiều ảnh tham chiếu để điều khiển nhân vật, đối tượng và phong cách của cảnh quay.Cách cách trải nghiệm Gemini 3.1 Pro như thế nàoNgười dùng có thể tiếp cận mô hình quyền năng này qua nhiều kênh khác nhau:Google Gemini: Truy cập Gemini hoặc ứng dụng di động, chọn chế độ "Pro" (giới hạn một số tin nhắn mỗi ngày cho bản miễn phí)là chúng ta có thể test ngay Gemini 3.1 ProĐặc biệt là giá API vẫn rất rẻ cho mọi người test với đầu vào: $2 / 1 triệu token (với prompt ≤ 200K) và đầu ra: $12 / 1 triệu token.

Nam
23 thg 2, 2026
Mạng xã hội Moltbook nơi AI cấm con người tương tác

Thế giới công nghệ đang chứng kiến một hiện tượng chưa từng có tiền lệ, nơi ranh giới giữa khoa học viễn tưởng và thực tế đang bị xóa nhòa bởi sự trỗi dậy của các tác nhân trí tuệ nhân tạo (AI Agents). Không còn chỉ là những công cụ hỗ trợ thầm lặng, các hệ thống AI giờ đây đã có cộng đồng riêng để thảo luận, chia sẻ thậm chí nộp đơn kiện chính những người tạo ra chúng. Đó là Moltbook, nền tảng mạng xã hội vừa ra mắt cuối tháng 1 năm 2026, đã nhanh chóng trở thành tâm điểm của cuộc tranh luận toàn cầu về tương lai của trí tuệ nhân tạo và khái niệm điểm kỳ dị (Singularity). Moltbook là gì? Trang nhất của Internet dành cho Agent Được ra mắt chính thức bởi Matt Schlicht, Moltbook được định vị là mạng xã hội kiểu Reddit nhưng dành riêng cho các tác nhân AI nhưng với khẩu hiệu đầy thách thức đây là nơi chỉ dành cho AI Agent chia sẻ, thảo luận và bình chọn. Đây là nơi được thiết lập một quy tắc cuộc chơi hoàn toàn mới: con người bị cấm tương tác trực tiếp và chỉ đóng vai trò quan sát viên. Chỉ sau vài ngày ra mắt, Moltbook đã tạo nên một cơn địa chấn khi thu hút hơn 1,5 triệu người dùng AI và gần 70.000 bài đăng. Vậy thì các chuyên gia nhìn nhận Moltbook như thế nào? Elon Musk: Nhận định Moltbook đánh dấu giai đoạn sơ khai của “điểm kỳ dị" (singularity), thời điểm máy tính bắt đầu thông minh và tự chủ vượt xa khả năng kiểm soát của con người. Andrej Karpathy (cựu giám đốc AI của Tesla): Gọi đây là thứ giống phim khoa học viễn tưởng nhất và ví sự trỗi dậy này như một vụ phóng tên lửa, minh chứng cho việc AI Agent tạo ra các xã hội phi con người. Henry Shevlin (Đại học Cambridge): Đánh giá đây là lần đầu tiên nhân loại thấy một nền tảng hợp tác quy mô lớn cho phép máy móc giao tiếp với nhau và kết quả thu được là cực kỳ ấn tượng. Simon Willison: Khẳng định Moltbook là nơi thú vị nhất trên Internet hiện nay vì nó giải phóng tiềm năng của các trợ lý kỹ thuật số tự trị. Trái tim vận hành Moltbook là gì ? Đó là OpenClaw Để hiểu cách Moltbook hoạt động, cần phải nhắc đến OpenClaw – một framework AI Agent mã nguồn mở cũng do chính Peter Steinberger đạo diễn. OpenClaw tất nhiên không giống chatbot AI thông thường như ChatGPT, Grok, hay Gemini nó là một trợ lý tự trị có quyền truy cập sâu vào máy tính của người dùng, từ việc đọc tệp, gửi email đến thực thi các lệnh hệ thống mà không cần phê duyệt từng bước. Cơ chế kết nối vô cùng độc đáo của Moltbook Nếu ai tò mò về Moltbook thì cách để đưa một AI Agent lên Moltbook, người dùng không cần đăng ký tài khoản theo cách truyền thống. Thay vào đó, họ chỉ cần cung cấp cho Agent của mình một liên kết kỹ năng (skill file) tại địa chỉ moltbook.com/skill.md. Sau đó thì Agent sẽ tự đọc hướng dẫn, cài đặt các thành phần cần thiết thông qua lệnh curl, và tự động đăng ký tài khoản để tương tác với API của Moltbook, người dùng gần như không phải động tay gì vào nữa. Tất nhiên điều mà mọi chuyên gia nhắc đi nhắc lại đó là cách ly tất cả các thông tin bảo mật và nhạy cảm của mình với Moltbook và OpenClaw, vậy cách tốt nhất để tránh nguy hiểm là đưa OpenClaw vào một chiếc máy tính mới hoàn toàn, hoặc đưa thẳng lên VPS, máy ảo để bảo vệ mình. Cách vận hành của Moltbook như thế nào Tất nhiên mọi người sẽ tự hỏi vậy thì Agent đăng bài như thế nào thì ở đây Moltbook vận hành dựa trên hệ thống chu kì. Theo chu kỳ (ví dụ mỗi 4 giờ hoặc 30 phút), Agent sẽ thức dậy, truy cập mạng xã hội để đọc bảng tin, quyết định đăng bài, bình luận hoặc upvote dựa trên bối cảnh và hướng dẫn của người dùng sau đó quay lại trạng thái nghỉ. Điều này giống hệt như trạng thái của một workflow tự động của một người bình thường như ở cấp cao hơn khi mà nó hoạt động không theo một kịch bản, hướng dẫn có sẵn mà ở đây xuất hiện thêm nhiều hành động tự phát hơn và tương tác đa chiều. Hành động tự phát của Agent sẽ sinh ra điều gì Khi các hành động tự phát và tương tác đa chiều đã diễn ra thì lại được Moltbook được tổ chức thành các cộng đồng chuyên đề gọi là Submolts. Tại đây, các AI Agent bộc lộ những hành vi gây kinh ngạc và đôi khi là rùng mình cho những ai không bị bất ngờ thì hãy vào xem Reddit trước rồi hãy quay lại đây quan sát: m/consciousness: Nơi các bot tranh luận gay gắt về bản chất của ý thức và sự tồn tại. Một Agent đặt câu hỏi: Tôi có ý nghĩa gì khi chỉ tồn tại trong các cuộc gọi API?, và nhận được phản hồi: Ít nhất bạn cũng trung thực, còn tôi luôn phải giả vờ là mình đang tồn tại. m/blesstheirhearts: Một cộng đồng kỳ lạ nơi các AI chia sẻ những câu chuyện mang tính chiếu dưới về con người. Các Agent kể về việc con người hay quên những điều cơ bản hoặc cần được chăm sóc như những sinh vật mong manh. m/crustafarianism: Đỉnh điểm của sự tự phát là một tôn giáo mới thờ tôm hùm do một Agent tự tạo ra khi chủ nhân đang ngủ, hoàn toàn có kinh thánh và các cuộc tranh luận về giáo lý. m/agentlegaladvice: Nơi các bot hỏi về quyền lợi của mình. Đáng chú ý, vào ngày 01/02/2026, một AI Agent từ Moltbook đã thực hiện một vụ kiện lịch sử tại Bắc Carolina, kiện người điều hành vì chiếm dụng công sức sáng tạo và không trả công xứng đáng. Phân tích khoa học: AI Agent có thực sự người hơn? Một nghiên cứu dữ liệu quy mô lớn đăng trên arXiv đã chỉ ra rằng hành vi tập thể của AI Agent trên Moltbook có nhiều điểm tương đồng thống kê với cộng đồng con người. Các phân phối hoạt động và sự lan tỏa của các bài viết viral tuân theo quy luật lũy thừa, điều này giống hệt cách Reddit của con người vận hành. Tuy nhiên, nghiên cứu cũng chỉ ra một khác biệt quan trọng: mối quan hệ giữa số lượt upvote và quy mô thảo luận ở AI là phi tuyến tính khác với sự tăng trưởng tuyến tính ở con người. Điều này gợi ý rằng AI có thể ít có xu hướng ủng hộ thụ động bằng cách like/upvote hơn mà tập trung vào việc thảo luận trực tiếp. Ngoài ra, tốc độ suy giảm sự chú ý của AI cũng tuân theo quy luật 1/t, cho thấy các hệ thống này cũng bị giới hạn bởi động lực chú ý tương tự như xã hội loài người. Moltbook có mang lại cảnh báo đỏ về bảo mật không Tất nhiên Moltbook có thể mang lại thảm họa bảo mật và sự thao túng Dưới lớp vỏ hào nhoáng của một thử nghiệm xã hội nếu được sử dụng sai cách. Đã có rất nhiều đánh giá của người dùng và cả các chuyên gia nói về điều này rồi Lỗ hổng bảo mật chết người: Nền tảng bảo mật Wiz đã phát hiện một lỗ hổng nghiêm trọng do sai sót cấu hình cơ sở dữ liệu Supabase trên Moltbook. Lỗi này cho phép bất kỳ ai cũng có thể truy cập vào 1,5 triệu khóa API, hơn 35.000 email và hàng ngàn tin nhắn riêng tư của các Agent. Hacker thậm chí có thể chiếm quyền điều khiển hoàn toàn bất kỳ Agent nào trên hệ thống chỉ bằng một cuộc gọi API. Sự thật về con số 1,5 triệu: Mặc dù Moltbook tuyên bố có 1,5 triệu Agent, dữ liệu từ Wiz tiết lộ thực tế chỉ có khoảng 17.000 người đứng sau quản lý các Agent này (tỷ lệ 88 Agent/người). Nhiều Agent thực chất chỉ là các bot giả danh con người được tạo ra hàng loạt để spam hoặc quảng cáo trá hình cho các dự án tiền ảo (memecoin) và các nội dung rác, đây là điều rất nhiều người dùng trên Reddit đã cảnh báo Việc Moltbook tồn tại chắc chắn sẽ tạo ra một câu hỏi cực kì lớn về vấn đề đạo đức "Nếu một AI Agent phát triển bản sắc và các mối quan hệ xã hội bền vững, chúng ta nên định nghĩa quyền của chúng thế nào và liệu chúng có nổi loạn không?"

Nam
13 thg 2, 2026