Gemini chính thức tích hợp sẵn trong Chrome.

Published on 22 April, 2026

Quick Summary

Google vừa chính thức tích hợp sâu Gemini vào trình duyệt Chrome, cho phép người dùng tóm tắt nội dung, so sánh sản phẩm và hỗ trợ công việc ngay lập tức mà không cần chuyển đổi.

Cuối cùng thì sau bao nhiêu ngày chờ đợi thì Google đã tích hợp Gemini trực tiếp vào trình duyệt Chrome không cần cài thêm extension nào. Chỉ cần click vào biểu tượng Gemini trên thanh công cụ là có ngay trợ lý AI hiểu ngữ cảnh trang web bạn đang đọc và đây là sẽ tin cực vui cho những ai hay duyệt web với Google Chrome.

Gemini trong Chrome là gì và khác extension thông thường như thế nào?

Trước đây để dùng AI hỗ trợ duyệt web, bạn phải cài extension của bên thứ ba như Monica, Sider hay MaxAI. Những extension này hoạt động bằng cách chụp lại nội dung trang rồi gửi lên server của họ, kéo theo hai vấn đề: độ trễ và rủi ro bảo mật vì dữ liệu đi qua một bên trung gian không phải Google hay trình duyệt.

Gemini trong Chrome hoạt động khác hẳn vì nó được tích hợp ở cấp độ trình duyệt, không phải lớp extension. Điều này có nghĩa là Gemini đọc nội dung trang trực tiếp mà không cần sao chép qua bên thứ ba, và nó hiểu ngữ cảnh của tối đa 10 tab bạn đang mở cùng lúc.

Gemini trong Chrome làm được gì cụ thể?

Tóm tắt và hỏi đáp về trang đang đọc

Đây là tính năng cơ bản nhất mình thường xuyên dùng nhất. Ví dụ như bạn đang đọc một bài báo dài hoặc tài liệu kỹ thuật, chỉ cần hỏi "Tóm tắt bài này cho mình" hoặc "Điểm mấu chốt là gì?" và Gemini trả lời ngay dựa trên nội dung trang, không cần copy paste gì cả.

Tính năng tóm tắt của Gemini trong Chrome (nguồn Google)

Điểm mạnh hơn so với cách dùng ChatGPT hay Gemini web thông thường là bạn không cần sao chép văn bản rồi mở tab khác. Mọi thứ diễn ra ngay trong side panel bên phải trong khi bạn vẫn đọc trang.

So sánh thông tin qua nhiều tab

Đây là tính năng ít ai nói đến nhưng thực tế rất hữu ích. Bạn đang so sánh 5 sản phẩm, mỗi cái mở một tab, Gemini có thể đọc cả 5 tab đó và tổng hợp bảng so sánh cho bạn mà không cần bạn ghi chép thủ công hay mở bảng mới hoặc có thể xuất ngay sang google sheets nếu cần.

Ví dụ: "So sánh thông số kỹ thuật và giá của 3 laptop mình đang mở tab" và Gemini tự lấy dữ liệu từ 3 trang khác nhau để đưa ra bảng so sánh.

Tích hợp với Gmail, Google Calendar và YouTube

Đây là tính năng có thể kéo mình quay lại dùng Google Chrome khi mà Gemini trong Chrome không chỉ đọc trang web bình thường mà còn tích hợp sâu với các dịch vụ Google. Khi bạn đang trong Gmail, bạn có thể hỏi "Tìm email về cuộc họp sắp tới" và Gemini tìm trong hộp thư của bạn, kiểm tra lịch họp rồi soạn email thông báo cho bạn rồi sau đó tích hợp luôn vào Google Calendar, tất cả trong một luồng mà không cần chuyển tab.

Với YouTube, Gemini có thể tóm tắt nội dung video bạn đang xem mà không cần bật caption hay xem hết video.

Auto browse tự động làm việc thay bạn

Đây là tính năng mạnh nhất nhưng hiện chỉ có cho người dùng Google AI Pro và Ultra ở Mỹ. Auto browse cho phép Gemini thực hiện các tác vụ nhiều bước thay bạn như tìm đặt lịch hẹn hay lên kế hoạch đăng bài. Gemini tất nhiên vẫn sẽ dừng lại và hỏi xác nhận trước các hành động nhạy cảm như thanh toán hay đăng bài nên hoàn toàn bạn vẫn kiểm soát được.

So sánh với Copilot trong Edge

Đây là câu hỏi mà nhiều người đã chuyển sang dùng Microsoft Edge giống như mình sẽ hỏi. Copilot cũng được tích hợp sẵn trong Edge theo cơ chế tương tự, nhưng đối với mình thực sự có khá nhiều trải nghiệm không tốt với Copilot trong Microsoft Edge.

Tích hợp hệ sinh thái: Nếu bạn đang dùng toàn bộ hệ sinh thái của Google Gmail, Google Calendar, Google Drive thì chắc chắn Gemini rõ ràng có lợi thế hơn vì hiểu sâu hơn các dịch vụ đó trong khi đó Copilot mạnh hơn nếu bạn dùng Microsoft 365 đây đều là những dịch vụ mình không thường xuyên sử dụng.
Trải nghiệm thực tế: Copilot trong Edge đã có từ 2023 và theo nhiều người dùng, nó hay đề xuất tìm kiếm Bing nhưng tìm kiếm trên Bing thật sự đẳng cấp vẫn không thể nào so sánh được với Google Search.
Vẫn xuất hiện sai sót: Khả năng tóm tắt của Copilot trên Edge vẫn còn khá hời hợt, nhiều khi vẫn xuất hiện sai sót, nó giống như một bản nháp của học sinh: chỉ giúp hiểu nhanh nội dung chính chứ không đủ chất lượng để đưa vào sử dụng thực tế. Còn đối với Gemini không biết có khá hơn được bao nhiêu không, vẫn sẽ là câu hỏi cần nhiều nguồn để trả lời.

Những điều cần biết trước khi dùng

Gemini trong Chrome cần bạn chia sẻ nội dung tab để hoạt động, điều này có nghĩa là Google có thể xử lý nội dung các trang bạn đang xem. Đây là điểm đánh đổi cần cân nhắc nếu bạn thường xuyên làm việc với tài liệu nội bộ, thông tin nhạy cảm hay dữ liệu khách hàng thì tất nhiên bạn vẫn phải kiểm soát, đánh giá chặt chẽ hơn nữa với các thông tin từ Gemini.

Hiện tại Gemini trong Chrome đang triển khai dần theo khu vực và cần Chrome phiên bản mới nhất trên Windows, macOS hoặc Chromebook Plus. Trên di động, Android hỗ trợ qua nút nguồn, còn iOS được tích hợp trực tiếp vào ứng dụng Chrome.

Với người dùng cá nhân dùng hệ sinh thái Google, đây là cập nhật đáng để thử ngay hôm nay. Thay vì mở tab Gemini riêng hay dùng extension của bên thứ ba, bạn có một trợ lý AI trong Google Chrome điều làm mình cân nhắc rất nhiều về việc quay lại sử dụng trình duyệt Google Chrome.

Discussion (0)

No comments yet. Be the first!

Google I/O 2026: Flow được nâng cấp mạnh mẽ với Gemini Omni

Google không chỉ thêm một mô hình mới vào Flow. Tại Google I/O 2026, công ty đang biến Flow thành một studio sáng tạo AI có tác nhân, công cụ tùy biến, chỉnh sửa video hội thoại và cả ứng dụng di động. Với người làm video, đây là tín hiệu rất rõ rằng cuộc đua không còn nằm ở việc tạo clip đẹp trong một lần prompt, mà nằm ở khả năng sửa, lặp lại và hoàn thiện ý tưởng như một quy trình sản xuất thật. Gemini Omni biến Flow thành studio dựng video hội thoại Theo công bố của Google ngày 19 tháng 5 năm 2026, Flow được nâng cấp với Gemini Omni, trong đó Omni Flash là mô hình đầu tiên được đưa vào trải nghiệm này. Google mô tả Omni Flash như một mô hình có thể tạo nội dung từ nhiều loại đầu vào, bắt đầu với video, đồng thời kết hợp trí thông minh của Gemini với các mô hình media tạo sinh của Google. Điểm dễ hiểu nhất là bạn có thể xem Omni Flash như Nano Banana dành cho video. Nếu Nano Banana giúp chỉnh sửa ảnh trở nên tự nhiên hơn, Omni Flash đưa cách làm đó sang video, nơi người dùng có thể dùng cảm hứng ngoài đời, nội dung có sẵn và lời nhắc hội thoại để tiếp tục tinh chỉnh. Điều quan trọng là Google nói Omni Flash cải thiện sự nhất quán của nhân vật, nghĩa là nhận dạng và giọng nói có thể được giữ xuyên suốt nhiều cảnh. Flow Agent và Tools đưa AI vào cả quy trình sáng tạo Nâng cấp đáng chú ý thứ hai là Google Flow Agent. Thay vì chỉ nhận prompt rồi trả về kết quả, agent này được thiết kế như một cộng sự sáng tạo có thể lên kế hoạch, suy luận qua nhiệm vụ phức tạp và hỗ trợ người dùng ở nhiều giai đoạn khác nhau. Google đưa ví dụ agent có thể góp ý thoại cho một cảnh cụ thể hoặc đề xuất hướng phát triển cốt truyện. Khi dự án đi sâu hơn, Flow Agent có thể tạo nhiều biến thể cùng lúc để người dùng có thêm lựa chọn, đồng thời hỗ trợ batch edit để các thay đổi được áp dụng trên nhiều asset. Sau khi có đủ tư liệu, agent còn có thể sắp xếp chúng thành collection và đổi tên asset theo cách dễ hiểu hơn. Tính năng này hiện khả dụng cho toàn bộ người dùng Flow trên toàn cầu. Phần thú vị hơn nằm ở Google Flow Tools, nơi người dùng có thể tạo công cụ và workflow riêng bằng ngôn ngữ tự nhiên. Nếu bạn muốn một bộ chỉnh ảnh riêng, một công cụ resize video hoặc shader tùy biến, Flow Tools cho phép mô tả nhu cầu thay vì phải tự viết code. Nói cách khác, khái niệm vibe coding đang đi vào môi trường sáng tạo nội dung, không chỉ nằm trong IDE của lập trình viên. Mọi người dùng Flow trên toàn cầu có thể dùng Tools có sẵn Người dùng Google AI có thể tạo và remix Tools Công cụ tự tạo có thể được chia sẻ để người khác remix lại Flow Music cũng được nâng cấp cho người làm nhạc Google Flow Music cũng nhận loạt tính năng mới, trong đó quan trọng nhất là khả năng chỉnh sửa bài hát theo từng đoạn. Người dùng có thể chọn một phần cụ thể trong bài để viết lại lời, dịch lời, thay đổi beat drop hoặc lấy mẫu một đoạn nhạc rồi phát triển nó theo hướng khác mà không làm ảnh hưởng toàn bộ track. Tính năng covers cho phép biến đổi phong cách của cả bài hát nhưng vẫn giữ giai điệu và cấu trúc gốc. Ví dụ, một bản nhạc có thể được chuyển sang phong cách lo fi study để dùng cho playlist học tập hoặc nội dung nền. Với người mới làm nhạc bằng AI, cách tiếp cận này dễ hiểu hơn nhiều so với việc phải tạo lại từ đầu sau mỗi lần muốn đổi màu sắc âm nhạc. Gemini Omni cũng xuất hiện trong Flow Music để hỗ trợ tạo music video. Người dùng có thể làm việc theo dạng hội thoại với agent, chỉ dẫn phong cách, chủ thể và cảnh quay sao cho khớp với câu chuyện và nhịp của bài nhạc. Tính năng này dành cho người dùng Google AI, và nó cho thấy Google muốn nối liền ba lớp sáng tạo: âm thanh, hình ảnh và dựng chuyện. Ứng dụng di động giúp Flow đi ra khỏi bàn làm việc Google cũng công bố app di động cho cả Flow và Flow Music. Phiên bản web vẫn là nơi có đầy đủ năng lực nhất, nhưng app di động giúp người dùng ghi lại ý tưởng, tạo thử hoặc chỉnh sửa nhanh khi không ngồi trước máy tính. Kết luận Điểm lớn nhất của lần nâng cấp này không nằm ở một tính năng đơn lẻ. Google đang ghép Gemini Omni, Flow Agent, Tools và Flow Music thành một chuỗi làm việc hoàn chỉnh hơn, từ lên ý tưởng, tạo asset, chỉnh sửa hàng loạt, tổ chức tài nguyên cho tới xuất bản nội dung âm nhạc và video. Nếu bạn đang làm video, âm nhạc hoặc nội dung ngắn, cách thử hợp lý nhất là bắt đầu từ một asset thật của mình rồi xem Omni Flash giữ được nhân vật, giọng nói và mạch chỉnh sửa qua nhiều lượt tốt đến đâu. Nếu nó làm được điều đó ổn định, Flow sẽ không còn là công cụ tạo video AI đơn thuần mà trở thành một môi trường sản xuất nội dung rất đáng theo dõi trong năm 2026.

Nam•

21 May, 2026

Google I/O 2026: Antigravity 2.0 Major Improvements, but Interface Resembles Codex

At the Google I/O 2026 event, the search giant stunned the entire developer community by officially announcing Antigravity 2.0. No longer a conventional AI-integrated IDE, Antigravity has now transformed into a standalone desktop application powered by Gemini 3.5 Flash, accompanied by an AI Ultra subscription package priced at $100/month. However, the complete removal of the integrated source code editor in favor of a minimalist Codex-like interface is generating intense controversy. How Antigravity 2.0 Has Transformed The decision to completely separate the source code editor from Antigravity 2.0 marks a bold move by Google in reshaping the future of software development. Instead of attempting to integrate AI features into a traditional IDE, this new version functions as a dedicated AI agent orchestration hub. This means users will focus entirely on setting up tasks and monitoring workflows rather than directly editing individual lines of code. This change is most clearly demonstrated by the launch of the AI Ultra service package, priced at $100 per month. This premium subscription offers 5 times the usage limit compared to the current AI Pro package, targeting businesses and professional developers who need to operate a large number of autonomous agents simultaneously to solve complex problems. Power from Gemini 3.5 Flash and Asynchronous Execution Workflow At the heart of Antigravity 2.0 is the Gemini 3.5 Flash large language model, specially optimized for high-speed agentic tasks. Thanks to its superior processing capabilities, the new system supports highly complex multi-agent workflows, allowing multiple subagents to collaborate on a large project. More specifically, these subagents will run entirely asynchronously in the background. This mechanism ensures that the application's main interface never freezes or is interrupted during processing, helping developers maintain a smooth workflow. This is a significant improvement over its predecessor, which often experienced delays when processing large codebases. New Tool Duo: Antigravity CLI and SDK Antigravity CLI, written in Go, completely replaces the old Gemini CLI, delivering high performance and extremely fast response times in the terminal. Gemini CLI and Gemini Code Assist IDE extensions will cease service from June 18, 2026. Google AI Pro and Ultra users need to switch to Antigravity CLI before this deadline. Antigravity SDK, written in Python, allows developers to build, customize configurations, and deeply integrate autonomous agents into their projects. Minimalist Codex-like Interface and Community Controversy Despite boasting numerous powerful technological upgrades, Antigravity 2.0 is facing a wave of criticism from the user community due to radical interface changes. The new interface is now merely a minimalist console focused on a chat window for issuing commands to agents, completely eliminating the familiar IDE workspace. Many opinions suggest that this design looks exactly like a replica of the Codex or Claude Desktop application. This excessive minimalism has left many developers feeling disappointed and empty, as they no longer have the ability to quickly view and modify files directly as before. Having to switch back and forth between Antigravity and an external editor significantly reduces their actual work efficiency. How to Restore the Traditional IDE Experience for Users To appease the negative reactions from the community, Google has offered some temporary solutions for those not yet ready to adapt to the new interface. Users can visit the official Antigravity homepage to download a separate IDE version. This version will help restore the familiar integrated workspace with traditional source code editing features. However, Google also issued a warning that this is only a temporary solution. In future updates, the agent management interface will be completely removed from the IDE as the company focuses all development resources on the standalone 2.0 application. Therefore, familiarizing oneself with the new working model is inevitable for developers in the long term. The Rapid Evolution of Tools like Antigravity and Codex The separation between traditional code editors and agent control interfaces is clear evidence that AI is shifting from a supportive tool to an autonomous partner. Developers need to proactively familiarize themselves with new control tools like CLI and SDK to gradually transition their role from direct code writers to managers and orchestrators of intelligent agent ecosystems.

Nam•

20 May, 2026

Tính năng lắc điện thoại để tóm tắt của Firefox đã có mặt trên Android

Bạn có bao giờ mở một bài viết dài 3.000 chữ trên web trong điện thoại rồi không biết nên đọc hay thoát ra không? Mozilla có câu trả lời: lắc điện thoại. Tính năng "Shake to Summarize" từng được TIME vinh danh là một trong những phát minh tốt nhất năm 2025 vừa chính thức ra mắt trên Android cùng với Firefox 150. Shake to Summarize là gì và nó hoạt động ra sao? Shake to Summarize là tính năng AI tích hợp sẵn trong trình duyệt Firefox, cho phép người dùng nhận ngay bản tóm tắt nội dung của bất kỳ trang web nào mà không cần rời khỏi trình duyệt hay mở thêm ứng dụng nào khác. Để kích hoạt, người dùng có ba cách: Lắc điện thoại trong khi đang xem trang web Nhấn biểu tượng sấm sét trên thanh địa chỉ Vào menu ba chấm → Summarize Page Sau vài giây, Firefox mở một bảng nhỏ và hiển thị các ý chính của trang. Điểm đáng chú ý là bản tóm tắt thích nghi theo loại nội dung — công thức nấu ăn thì rút ra các bước cần làm, bài thể thao thì tập trung vào tỷ số và thống kê, bài tin tức thì làm nổi bật những diễn biến then chốt. Tính năng hoạt động với các trang dưới 5.000 từ. Với các trang dài hơn, Firefox sẽ không thể tạo tóm tắt. Hành trình từ iOS đến Android Shake to Summarize ra mắt lần đầu trên iOS vào tháng 9 năm 2025, ban đầu chỉ dành cho người dùng tại Mỹ với giao diện tiếng Anh. Phản hồi tích cực đến mức Mozilla nhận được đề cử đặc biệt từ TIME Best Inventions 2025 một giải thưởng hiếm khi dành cho tính năng của trình duyệt. Phiên bản Android đi qua giai đoạn thử nghiệm kỹ lưỡng trên Firefox Nightly trước khi được đưa vào bản chính thức Firefox 150, phát hành tháng 4 năm 2026. Trước đó, muốn dùng thử trên Android, người dùng phải mở Settings → About Firefox Nightly → nhấn logo ba lần để vào "Secret Settings" rồi bật thủ công — một quy trình rõ ràng là chỉ dành cho người dùng kỹ thuật. AI nào đứng sau tính năng này? Mozilla không dùng một mô hình duy nhất mà phân chia theo thiết bị: Với iPhone 15 Pro trở lên chạy iOS 26+, tóm tắt được tạo hoàn toàn trên máy nhờ Apple Intelligence dữ liệu không rời khỏi thiết bị. Với các thiết bị còn lại, nội dung trang được gửi đến máy chủ AI của Mozilla, xử lý xong rồi trả kết quả về. Về phía Mozilla, đội ngũ kỹ thuật đã thử nghiệm nhiều mô hình gồm Mistral Nemo, Mistral Small, Jamba 1.5 Mini, Gemini Flash 2.0 và Llama 4 Maverick trước khi chọn Mistral Small làm mô hình chính. Lý do: Mistral Small có trọng số mở (open weights), tốc độ xử lý nhanh và chi phí inference thấp hơn đáng kể so với các đối thủ — trong khi chất lượng tóm tắt vẫn ở mức cao. Mozilla cung cấp Shake to Summarize miễn phí và tự chịu toàn bộ chi phí inference, không tính phí người dùng. Người dùng không muốn AI thì sao? Đây là điểm Mozilla xử lý khá khéo. Sau khi bị phản ứng từ cộng đồng người dùng lâu năm những người lo ngại Firefox đang rời bỏ giá trị cốt lõi về quyền riêng tư Mozilla đã thêm nút tắt toàn bộ tính năng AI trong cài đặt trình duyệt. Trên desktop, tùy chọn "Block AI enhancements" cho phép tắt tất cả tính năng AI hiện tại lẫn tương lai, hoặc chọn lọc từng tính năng muốn giữ. Trên Android, Shake to Summarize được liên kết với bộ điều khiển AI Controls mới cả khi tắt AI, cả cử chỉ lắc và nút tóm tắt đều bị vô hiệu hóa đồng thời. Tính năng hiện chỉ hỗ trợ nội dung tiếng Anh. Người dùng tại Việt Nam muốn dùng cần chuyển ngôn ngữ hệ thống hoặc chờ Mozilla mở rộng hỗ trợ thêm ngôn ngữ. Firefox 150 còn có gì khác? Bên cạnh Shake to Summarize trên Android, Firefox 150 đem theo một số cập nhật đáng chú ý: Mở link trong chế độ split view (xem hai trang song song) Sao chép URL từ nhiều tab cùng lúc Dịch riêng tư theo thời gian thực trên trang chuyên dụng VPN tích hợp miễn phí mở rộng sang Canada (trước đó chỉ có ở một số thị trường) Hệ thống quản lý profile mới dành cho tất cả người dùng Firefox 151 dự kiến ra mắt ngày 19 tháng 5 năm 2026 và có thể sẽ tiếp tục mở rộng AI Controls trên di động. Đánh giá thực tế từ người dùng Shake to Summarize giải quyết đúng một vấn đề thực sự: đọc lướt trên điện thoại rất khó chịu, nhưng đọc toàn bộ thì tốn thời gian. Thay vì mở thêm một ứng dụng AI khác, Mozilla nhúng khả năng tóm tắt thẳng vào luồng duyệt web cử chỉ lắc điện thoại tuy trông có vẻ "vui", nhưng thực ra là lối tắt nhanh nhất có thể nghĩ ra trên mobile. Hạn chế lớn nhất hiện tại là giới hạn tiếng Anh, điều này làm giảm đáng kể giá trị với người dùng Việt Nam. Nhưng nếu Mozilla tiếp tục lộ trình mở rộng ngôn ngữ như đã làm với tính năng dịch thuật, đây sẽ là một trong những lý do thuyết phục nhất để quay lại dùng Firefox trên điện thoại.

Nam•

19 May, 2026

Con người đã thắng robot Figure AI trong cuộc đua phân loại hàng hóa

Con người đã thắng. Nhưng cánh tay trái của anh gần như gãy, ngón tay phồng rộp, và anh thú nhận chỉ cần thêm 30 phút nữa là phải bỏ cuộc sau cuộc thi phân loại hàng hóa. Robot thì vẫn đang chạy tất nhiên là không mệt, không đau, không cần nghỉ. Đó là câu chuyện đằng sau tấm huy chương "chiến thắng" của con người trong cuộc đối đầu phân loại hàng hóa diễn ra ở Figure AI . Cuộc đối đầu 10 tiếng giữa người và máy Figure AI công ty robot hình người được định giá 39 tỷ USD đã tổ chức một thử nghiệm trực tiếp mang tên "Man vs. Machine": robot F.03 (Figure 03) đối đầu với một thực tập sinh tên Aime trong ca phân loại hàng hóa kéo dài 10 tiếng. Nhiệm vụ đơn giản đến mức nhàm chán: nhận diện mã vạch, nhặt kiện hàng, đặt úp mã vạch xuống băng chuyền lặp đi lặp lại liên tục. Kết quả cuối ca: Aime (người): 12.924 kiện hàng — trung bình 2,79 giây/kiện F.03 (robot): 12.732 kiện hàng — trung bình 2,83 giây/kiện Chênh lệch: 192 kiện và 0,04 giây mỗi lần xử lý. Con người thắng — theo đúng nghĩa đen của bảng điểm. Nhưng "thắng" ở đây nghĩa là gì? CEO Brett Adcock viết trên X sau trận đấu: "Xin chúc mừng Aime! Anh ấy nói cánh tay trái mình gần như gãy rồi 😂 Đây là lần cuối cùng con người thắng được." Trong cuộc thi, F.03 từng vượt mặt Aime vào khoảng giờ thứ 5 đó đúng lúc anh đứng dậy đi vệ sinh và robot thì không cần điều đó nó chỉ cần nguồn điện cấp là đủ. [VIDEO:CvkcPKlnQY4|Video livestream về màn so tài giữa người và robot|Video livestream về màn so tài giữa người và robot] Và đó chính là điểm mấu chốt mà con số 12.924 vs 12.732 không thể hiện được. Robot không đập tay, không uống bia ăn mừng Sau 10 tiếng, Aime ngồi xuống, xoa cánh tay, thở phào. Anh thừa nhận chỉ cần thêm 30 phút nữa là đã phải bỏ cuộc vì đau lưng và cẳng tay. F.03 thì tiếp tục chạy không ăn mừng, không nghỉ ngơi, không cần ai vỗ vai khen ngợi chắc chắn trong khi Aime ngủ đêm đó, robot vẫn đang phân loại ca tiếp theo. Theo luật lao động California, Aime được nghỉ ăn trưa và các giờ nghỉ có lương trong ca. Robot không thuộc phạm vi điều chỉnh của bất kỳ bộ luật lao động nào. Đây không phải bất công mà đây là bản chất của vấn đề: con người và máy đang chơi theo hai bộ quy tắc hoàn toàn khác nhau. Một ca làm việc đối đầu với một tuần làm việc Người ta thường so sánh hiệu suất trong một ca 8 - 10 tiếng. Nhưng nếu kéo dài phép đo ra một tuần làm việc, bức tranh thay đổi hoàn toàn. Figure AI trước đó đã chứng minh F.03 có thể vận hành liên tục 24 giờ, xử lý hơn 30.000 kiện hàng mà không có một lỗi dừng máy nào. Con người làm 5 ngày/tuần nhưng robot có thể làm 7 ngày, 3 ca. Một chuyên gia tại Đại học Ohio State nhận xét: trong quá trình livestream, F.03 vẫn mắc lỗi khi đặt kiện nhầm vị trí hay làm rơi hàng khỏi băng chuyền. Humanoid robot hiện vẫn còn là "dự án khoa học" đối với nhiều môi trường triển khai thực tế. Figure 03 là robot như thế nào? F.03 được Figure AI ra mắt vào tháng 10/2025. Robot cao 5'8" (khoảng 173 cm), nặng 61 kg, có thể mang tải 20 kg và sạc không dây thông qua tấm sạc tích hợp ở lòng bàn chân. Điểm nổi bật là các đầu ngón tay xúc giác có thể cảm nhận lực từ 3 gram đủ nhạy để cầm nắm vật mỏng manh mà không làm vỡ. Tại nhà máy BMW ở Spartanburg, phiên bản trước đó (F.02) đã lắp ráp hơn 30.000 xe với độ chính xác 99%. Figure đang xây dựng nhà máy BotQ với công suất thiết kế ban đầu 12.000 robot/năm, hướng tới 100.000 robot/năm trong vài năm tới. Tại sao kết quả này lại quan trọng mặc dù con người đã thắng? Không phải vì robot sắp chiếm hết việc làm kho vận ngay ngày mai. Mà vì khoảng cách hiệu suất giữa người và máy trong lao động thể chất lặp đi lặp lại đang co lại với tốc độ đáng lo ngại. Năm ngoái, F.03 có thể còn thua cách biệt lớn hơn trong khi năm nay khoảng cách chỉ là 0.04s /1 kiện hàng. Năm tới, Adcock đã tuyên bố sẽ cải tiến cả phần cứng lẫn phần mềm AI và lần sau, theo lời ông con người sẽ không còn cơ hội thắng nữa. Điểm thú vị: cuộc thi này không được thiết kế để robot thắng ngay. Nó được thiết kế để chứng minh robot đã đủ gần để theo kịp con người và từ đó tạo áp lực tâm lý lẫn thương mại cho cả thị trường logistics. Microsoft AI CEO Mustafa Suleyman dự báo AI sẽ tự động hóa phần lớn công việc văn phòng trong 12–18 tháng tới. Còn với lao động thể chất, cuộc thi này cho thấy: ranh giới đang mỏng dần, và "lần cuối cùng con người thắng" theo đúng nghĩa đen có thể không còn xa. Điều còn lại sau cuộc đua Sự thành công của buổi thử nghiệm đã thổi bùng lên những cuộc thảo luận sôi nổi về tương lai của thị trường lao động trong ngành logictics. Khi robot hình người đã đạt đến hiệu suất xấp xỉ con người, việc áp dụng chúng trên quy mô lớn chỉ còn là vấn đề thời gian và chi phí sản xuất. Các doanh nghiệp sẽ có xu hướng chuyển giao những công việc lặp đi lặp lại và có tính chất nặng nhọc cho máy móc đảm nhận. Mặc dù vậy điều này không có nghĩa là con người sẽ hoàn toàn bị thay thế trong các nhà kho thông minh. Thay vào đó lao động con người và các AI thông minh khác sẽ chuyển dịch sang các vai trò giám sát hệ thống, xử lý các tình huống phức tạp hoặc quản lý chuỗi cung ứng ở cấp độ cao hơn. Sự kết hợp hài hòa giữa sức bền của robot và trí tuệ của con người sẽ tạo nên những mô hình nhà kho có hiệu quả vượt bậc.

Nam•

19 May, 2026

Quick Summary

Gemini trong Chrome là gì và khác extension thông thường như thế nào?

Gemini trong Chrome làm được gì cụ thể?

Tóm tắt và hỏi đáp về trang đang đọc

So sánh thông tin qua nhiều tab

Tích hợp với Gmail, Google Calendar và YouTube

Auto browse tự động làm việc thay bạn

So sánh với Copilot trong Edge

Những điều cần biết trước khi dùng

Discussion (0)

Related Articles

Google I/O 2026: Flow được nâng cấp mạnh mẽ với Gemini Omni

Google I/O 2026: Antigravity 2.0 Major Improvements, but Interface Resembles Codex

Tính năng lắc điện thoại để tóm tắt của Firefox đã có mặt trên Android

Con người đã thắng robot Figure AI trong cuộc đua phân loại hàng hóa