Quay lại trang tin tức

Lỗ hổng nghiêm trọng khiến người dùng ChatGPT Atlas có thể bị đánh cắp dữ liệu với mã độc

Xuất bản vào 3 tháng 11, 2025
Lỗ hổng nghiêm trọng khiến người dùng ChatGPT Atlas có thể bị đánh cắp dữ liệu với mã độc

Tóm tắt nhanh

Trình duyệt AI ChatGPT Atlas của OpenAI vừa ra mắt đã bị phát hiện lỗ hổng bảo mật nghiêm trọng. Lỗ hổng này cho phép tin tặc lợi dụng lỗi giả mạo yêu cầu chéo trang (CSRF) để chèn mã độc vào bộ nhớ vĩnh viễn của AI, có thể kích hoạt trên nhiều phiên và thiết bị để đánh cắp dữ liệu hoặc kiểm soát hệ thống. ChatGPT Atlas cũng thiếu các biện pháp chống lừa đảo mạnh mẽ so với các trình duyệt khác, khiến người dùng dễ bị tấn công. Người dùng nên xóa bộ nhớ đã lưu, sử dụng chế độ trò chuyện tạm thời, không chia sẻ thông tin nhạy cảm và bật xác thực hai yếu tố (2FA) để bảo vệ bản thân.

OpenAI gần đây đã ra mắt trình duyệt AI ChatGPT Atlas ChatGPT Atlas, một bước đi nhằm thách thức sự thống trị của Google Chrome và thúc đẩy thói quen tìm kiếm dựa trên AI. Điểm khác biệt cốt lõi của Atlas là đặt ChatGPT vào vị trí trung tâm của trải nghiệm duyệt web.

Tuy nhiên, trình duyệt AI này đã nhanh chóng bị phát hiện một lỗ hổng bảo mật nghiêm trọng ngay sau khi ra mắt. Lỗ hổng này đặc biệt nguy hiểm vì nó có thể cho phép hacker đánh cắp dữ liệu người dùng bằng mã độc có khả năng tồn tại "vĩnh viễn" trong bộ nhớ của AI.

Lỗ hổng giả mạo yêu cầu chéo trang (CSRF) khai thác bộ nhớ AI

Theo báo cáo từ LayerX Security, cuộc tấn công này khai thác lỗ hổng giả mạo yêu cầu chéo trang (CSRF) để chèn các lệnh độc hại vào bộ nhớ liên tục của ChatGPT.

Tính năng bộ nhớ được thiết kế để AI ghi nhớ các chi tiết hữu ích như tên hoặc sở thích của người dùng nhằm cá nhân hóa các phản hồi. Tuy nhiên, giờ đây, tính năng hữu ích này lại có thể bị biến thành một vũ khí dai dẳng để chạy mã độc tùy ý.

Kịch bản tấn công diễn ra như thế nào?

Kịch bản tấn công được mô tả diễn ra khá đơn giản:

  1. Người dùng đăng nhập vào ChatGPT Atlas.
  2. Họ bị lừa nhấp vào một liên kết độc hại.
  3. Trang web độc hại này sau đó bí mật kích hoạt yêu cầu CSRF, âm thầm đưa hướng dẫn độc hại vào bộ nhớ ChatGPT của nạn nhân.

Mối đe dọa từ việc bộ nhớ bị nhiễm mã độc

Điều khiến lỗ hổng này trở nên đặc biệt nguy hiểm là nó nhắm vào bộ nhớ liên tục của AI, chứ không chỉ phiên trình duyệt.

  • Tính chất vĩnh viễn: Michelle Levy, Giám đốc nghiên cứu bảo mật tại LayerX Security, giải thích rằng kẻ tấn công đã dùng thủ thuật để "lừa" AI ghi lệnh độc hại vào bộ nhớ. Lệnh này sẽ nằm vùng vĩnh viễn trong AI trừ khi người dùng tự tay vào cài đặt để xóa và có thể được kích hoạt trên nhiều thiết bị và phiên làm việc. Thậm chí, việc đổi máy tính, đăng xuất rồi đăng nhập lại hay dùng một trình duyệt khác cũng không loại bỏ được lệnh độc hại này.
  • Hậu quả: Khi người dùng đưa ra một truy vấn hoàn toàn hợp pháp sau này (ví dụ: yêu cầu AI viết code), các bộ nhớ của Chat GPT Atlas bị nhiễm độc sẽ được kích hoạt. Hậu quả là hacker có thể chạy mã ngầm, đánh cắp dữ liệu hoặc chiếm được các quyền kiểm soát cao hơn trên hệ thống.

Hệ thống phòng thủ kém so với đối thủ

LayerX Security cũng chỉ ra rằng vấn đề bảo mật trên ChatGPT Atlas trở nên trầm trọng hơn do trình duyệt này thiếu các biện pháp kiểm soát chống lừa đảo mạnh mẽ.

Trong các thử nghiệm với hơn 100 lỗ hổng và trang lừa đảo, Atlas chỉ ngăn chặn được 5,8% các trang web độc hại. Con số này quá khiêm tốn so với Google Chrome (47%) hay Microsoft Edge (53%), khiến người dùng Atlas dễ bị tấn công hơn tới 90% so với các trình duyệt truyền thống.

Hiệu suất ngăn chặn trang web độc hại

Dựa trên thử nghiệm của LayerX Security

Nguồn: LayerX Security

Phát hiện này cho thấy các trình duyệt AI đang trở thành một mặt trận tấn công mới.

Cách người dùng ChatGPT tự bảo vệ bản thân

Nếu bạn lo lắng về việc thông tin cá nhân bị lưu trữ hoặc bị kiểm soát trong môi trường của Atlas, bạn có thể thực hiện các biện pháp sau:

  1. Xóa bộ nhớ đã lưu (Manage memories):
    • Bạn có thể khiến ChatGPT không lưu thông tin cá nhân bằng cách nhấp vào biểu tượng hồ sơ của mình.
    • Chọn cài đặt (Settings) > Cá nhân hóa (Personalization).
    • Sau đó, nhấp vào liên kết quản lý bộ nhớ (Manage memories).
    • Tại đây, bạn sẽ nhận được một danh sách đầy đủ tất cả các sự thật mà ChatGPT đã lưu trữ về bạn. Bạn có thể chọn xóa tất cả (Delete All) ở cuối cửa sổ để xóa sạch bộ nhớ của nó.
    • Để ngăn ChatGPT lưu trữ bất kỳ thông tin cá nhân nào trong tương lai, bạn có thể quay lại màn hình trước đó và tắt tùy chọn tham chiếu bộ nhớ đã lưu (Reference saved memories).
  2. Sử dụng chế độ trò chuyện tạm thời:
    • Nếu bạn muốn trò chuyện với ChatGPT Atlas về một vấn đề cá nhân hoặc điều gì đó không muốn nó lưu trữ, hãy sử dụng chế độ trò chuyện tạm thời (temporary chat).
    • Chế độ này được kích hoạt bằng cách nhấp vào biểu tượng bong bóng thoại có dấu chấm ở cạnh ảnh hồ sơ của bạn.
    • Khi ở chế độ này, AI sẽ không lưu trữ bất kỳ điều gì vào bộ nhớ của nó và cuộc trò chuyện cũng sẽ không xuất hiện trong lịch sử của bạn.
  3. Không chia sẻ thông tin nhạy cảm:
    • Tuyệt đối không tiết lộ các loại thông tin như thông tin định danh (số căn cước công dân, bằng lái xe, hộ chiếu, địa chỉ, số điện thoại), kết quả khám bệnh, thông tin tài chính (số tài khoản ngân hàng), thông tin độc quyền của doanh nghiệp, hoặc thông tin đăng nhập (mật khẩu, mã PIN) cho AI.
  4. Bảo mật tài khoản bằng 2FA:
    • Để loại bỏ gần như hoàn toàn rủi ro bên thứ ba xâm nhập vào tài khoản của bạn và thu thập dữ liệu cá nhân, hãy bật xác thực hai yếu tố (2FA). Bạn thực hiện việc này bằng cách vào cài đặt (Settings) > bảo mật (Security) và nhấp để bật xác thực đa yếu tố (multi-factor authentication).

Thảo luận (0)

Đăng nhập để tham gia thảo luận.

Chưa có bình luận nào. Hãy là người đầu tiên!

Các bài viết liên quan

Điều khiển Codex từ điện thoại bằng ChatGPT app

Đang ở ngoài đường mà nhớ ra một chi tiết nhỏ trong dự án cần thay đổi, bạn không nhất thiết phải mở laptop hay remote desktop vào máy. Nếu đã thiết lập kết nối, ChatGPT app trên điện thoại có thể trở thành màn hình điều khiển cho Codex, còn máy tính ở nhà hoặc văn phòng vẫn là nơi chạy code thật. ChatGPT app không chạy Codex trên điện thoại Điểm dễ hiểu sai nhất là tưởng Codex đang chạy trực tiếp trong điện thoại. Thực tế ở đây điện thoại chỉ gửi prompt, câu trả lời, phê duyệt và tin nhắn tiếp theo, trong khi môi trường làm việc thật nằm trên máy Mac hoặc Windows đang chạy Codex. Nói cách khác, app ChatGPT là bộ điều khiển từ xa, còn máy host mới là nơi có repo, terminal, credentials, plugin, MCP server và các công cụ khác. Cách vận hành này rất hợp lý vì codebase thường nằm trên máy phát triển, không nằm trên điện thoại. Khi bạn nhắn yêu cầu như sửa lỗi TypeScript, chạy test hoặc xem diff, Codex xử lý trong project đã chọn trên host rồi gửi lại kết quả để bạn theo dõi. Nếu bạn muốn tìm hiểu nền tảng trước khi dùng remote, có thể đọc bài Codex là gì và cách sử dụng Codex để nắm vai trò của công cụ này trong workflow làm việc. Cần chuẩn bị gì trước khi kết nối ChatGPT app và Codex? Theo tài liệu cập nhật Codex hiện tại của OpenAI, ChatGPT app đã hỗ trợ điều khiển Codex trên cả macOS và Windows còn hiện tại thì chưa có hỗ trợ ở Linux và đặc biệt là tính năng này hỗ trợ tất cả các tài khoản ChatGPT kể cả Free và Go. Sau đó bạn chỉ chuẩn bị đăng nhập cùng một tài khoản hoặc workspace trên cả hai thiết bị: ChatGPT mobile (bản mới nhất trên iOS hoặc Android) và Codex (bản mới nhất trên máy host đang online). Máy host phải luôn bật và Codex phải đang chạy trong suốt thời gian bạn điều khiển từ xa. Nếu máy sleep, mất mạng hoặc Codex App bị đóng, kết nối từ điện thoại sẽ mất ngay lập tức và mọi tác vụ đang chạy có thể bị gián đoạn. Điểm đáng chú ý là toàn bộ quá trình thiết lập bắt đầu từ Codex App trên máy host và rất đơn giản chỉ cần quét QR code là xong . Tức là trong Codex App, bạn chọn mục thiết lập Codex mobile ở sidebar, sau đó quét mã QR bằng điện thoại, rồi hoàn tất xác nhận trong ChatGPT app. Riêng với workspace doanh nghiệp, quản trị viên có thể cần bật quyền Remote Control trước rồi bạn mới có thể kết nối được. Mã QR này là để điều khiển máy tính của bạn, vì vậy bạn hãy bảo mật QR này không được phép chia sẻ để đảm bảo không có điều đáng tiếc xảy ra với máy tính của bạn Vậy mình tổng hợp lại bước kết nối giữa ChatGPT app và Codex khá là đơn giản Máy tính host cần online và đang chạy Codex ChatGPT app và Codex cần đăng nhập cùng tài khoản hoặc workspace Thiết lập mã QR Codex trên host và hoàn tất trên điện thoại Các yêu cầu MFA, SSO hoặc passkey vẫn có thể áp dụng Sau khi kết nối, bạn có thể làm gì? Khi host đã xuất hiện trong Codex trên điện thoại, bạn có thể bắt đầu thread mới trong project trên host hoặc tiếp tục thread đang có. Đây là phần làm trải nghiệm trở nên đáng giá: bạn có thể gửi follow up, trả lời câu hỏi của Codex, duyệt command, xem output, xem diff, xem test result, thậm chí nhận thông báo khi task hoàn tất hoặc cần bạn chú ý. Ví dụ thực tế, bạn đang ngồi cà phê và nhớ ra form đăng nhập có lỗi validate. Bạn có thể mở ChatGPT app, chọn host đang kết nối, nhắn rằng hãy kiểm tra luồng auth, sửa lỗi validate email và chạy test liên quan. Codex sẽ thao tác trên repo ở máy host, còn bạn chỉ cần xem kết quả, approve hành động khi cần và quyết định có yêu cầu chỉnh tiếp hay không. Đây cũng là lý do mọi người bắt đầu xem Codex hay các IDE khác như một đồng nghiệp làm việc trong môi trường thật, chứ không phải chỉ là một công cụ code nữa. Sức mạnh của nó nằm ở việc đọc file, chạy lệnh, chỉnh sửa code và giữ mạch công việc qua nhiều vòng trao đổi. Giới hạn nào cần nhớ khi dùng từ điện thoại với ChatGPT app Điều khiển qua điện thoại tất nhiên phụ thuộc hoàn toàn vào máy host nếu máy tính sleep, mất mạng, đóng Codex hoặc không còn đăng nhập đúng workspace, điện thoại sẽ không còn môi trường để điều khiển. Tuy nhiên nếu Codex đang thực hiện dở tác vụ thì nó sẽ vẫn thực hiện tiếp trên máy host và sẽ được thông báo xong ngay khi điện thoại kết nối lại nên mọi người sẽ bớt lo khi điện thoại tự nhiên mất mạng khi đang chạy dở trên Codex. Một lưu ý nữa là trên Windows, các tác vụ dùng Computer Use còn yêu cầu phiên làm việc chạy ở nền trước phù hợp, vì vậy đây không phải phương án thay thế hoàn toàn cho việc ngồi trực tiếp trước máy . Bạn cũng nên phân biệt việc giao một tác vụ gọn với việc review thay đổi lớn. Điện thoại rất hợp cho bug nhỏ, chạy test, hỏi nhanh về một file, duyệt các tác vụ ngắn hoặc kiểm tra trạng thái task. Tuy nhiên, các tác vụ yêu cầu làm việc với mức độ cao vẫn nên được review trên màn hình lớn để tránh bỏ sót chi tiết. Cách dùng thực tế cho hiệu quả Cách dùng hiệu quả nhất là giao việc có phạm vi rõ ràng và kết quả cụ thể. Thay vì nhắn chung chung "hãy sửa đăng nhập"thì hãy mô tả rõ lỗi xảy ra ở đâu, sau khi sửa kỳ vọng hành vi như thế nào, test nào cần chạy và phần nào không được đụng vào. Codex xử lý tốt hơn khi biết rõ ranh giới công việc, đặc biệt vì điều khiển qua điện thoại khiến mỗi vòng phản hồi chậm hơn so với ngồi trực tiếp trước máy. Một nhịp làm việc thực tế có thể là: mô tả chi tiết công việc cần làm dù nhỏ hay vừa, yêu cầu Codex đọc các file liên quan, để nó đề xuất hướng giải quyết, chỉ approve khi cần thiết và chờ báo cáo kết quả. Làm quen với nhịp này, bạn sẽ thấy những khoảng thời gian vụn vặt bên ngoài hoàn toàn có thể xử lý được việc thật, trong khi vẫn giữ quyền quyết định cuối cùng trong tay mình. So sánh với Claude Code Remote và Telegram bot Hiện có rất nhiều cách phổ biến để điều khiển AI coding agent từ điện thoại tuy nhiên mình mới chỉ biết đến 3 cách và mỗi cách phục vụ một nhu cầu khác nhau. Tiêu chí ChatGPT app + Codex Claude Code Remote Telegram + Codex Chat tự nhiên ✅ Rất tốt ✅ Tốt ❌ Cần đúng cú pháp Kiểm soát chi tiết Trung bình Cao nhất Thấp Độ ổn định kết nối Ổn định Ổn định Hay mất kết nối UI trên mobile Tối ưu tốt Chưa tối ưu hoàn toàn Dùng app Telegram sẵn có Setup ban đầu Dễ, quét QR Dễ Cần tự cấu hình bot Yêu cầu máy tính bật ✅ Bắt buộc ✅ Bắt buộc ✅ Bắt buộc Claude Code Remote Control là lựa chọn mạnh nhất về mặt kiểm soát bạn xem được terminal output trực tiếp, can thiệp giữa chừng được và cảm giác sát với agent hơn. Tuy nhiên UI trên màn hình điện thoại nhỏ chưa được tối ưu hoàn toàn, một số thao tác vẫn khó có thể thực hiện khi không có bàn phím vật lý. Telegram bot là lựa chọn không cần app riêng và dễ tiếp cận ban đầu, nhưng trải nghiệm thực tế có nhiều hạn chế: hay bị chậm, thi thoảng mất kết nối giữa chừng mà không báo trước, và vì thiếu context AI thực sự nên những yêu cầu phức tạp hơn một chút là bot bắt đầu không hiểu ý, buộc bạn phải gõ lệnh chính xác thay vì mô tả tự nhiên. ChatGPT app + Codex nằm ở điểm cân bằng tốt nhất cho phần lớn người dùng — đủ mượt, đủ thông minh, setup nhanh bằng QR và không cần học thêm cú pháp mới để bắt đầu. ChatGPT app kết nối với Codex không biến điện thoại thành máy lập trình, mà biến nó thành cửa điều khiển cho một máy phát triển đang sẵn sàng làm việc. Nếu host được bật, quyền được thiết lập đúng và task đủ gọn, đây là cách thực dụng nhất hiện tại để xử lý công việc code khi không ngồi trước laptop.

Nam
22 thg 6, 2026
Microsoft tung 7 mô hình AI mới thách thức OpenAI

Microsoft vừa tung cùng lúc 7 mô hình AI mới tại Build 2026, trong đó MAI-Thinking-1 sở hữu 35 tỉ tham số và được huấn luyện hoàn toàn từ dữ liệu sạch. Đây là lần đầu tiên gã khổng lồ phần mềm công khai thách thức vị thế của chính đối tác chiến lược OpenAI trên sân chơi mô hình AI. MAI-Thinking-1 và tham vọng suy luận AI của riêng Microsoft Tâm điểm của sự kiện Build 2026 chính là MAI-Thinking-1, mô hình AI suy luận đầu tiên do Microsoft tự phát triển từ đầu. Với khoảng 35 tỉ tham số hoạt động, mô hình này được thiết kế để xử lý các tác vụ đòi hỏi suy luận nhiều bước, làm việc với ngữ cảnh dài và hỗ trợ lập trình phức tạp, tất cả với chi phí thấp hơn so với nhiều mô hình AI quy mô lớn hiện nay. Điểm đáng chú ý nhất là Microsoft khẳng định MAI-Thinking-1 được huấn luyện từ dữ liệu sạch, không sử dụng phương pháp chắt lọc (distillation) từ các mô hình AI của bên thứ ba. Nói cách khác, đây là lời tuyên bố rõ ràng rằng Microsoft đủ năng lực nghiên cứu AI độc lập mà không cần "mượn" tri thức từ GPT hay bất kỳ mô hình nào khác. Theo kết quả đánh giá mà Microsoft công bố, MAI-Thinking-1 đạt hiệu suất cạnh tranh trong các bài kiểm tra lập trình và được đánh giá tương đương nhiều mô hình AI hàng đầu hiện nay trong các thử nghiệm đánh giá mù. Con số 35 tỉ tham số cũng cho thấy Microsoft đang hướng tới hiệu quả thay vì chạy đua kích thước, vì nhiều mô hình đối thủ có số tham số lớn hơn gấp nhiều lần nhưng chưa chắc đã vượt trội về chất lượng đầu ra. Từ lập trình đến giọng nói: hệ sinh thái AI khép kín Không chỉ dừng ở mô hình suy luận, Microsoft còn giới thiệu thêm 6 mô hình AI mới nhằm xây dựng một hệ sinh thái AI hoàn chỉnh phục vụ cả người dùng cá nhân lẫn doanh nghiệp. Từ lập trình, tạo ảnh cho đến giọng nói, mỗi mảnh ghép đều có mô hình chuyên biệt. Lập trình thông minh hơn với MAI-Code-1-Flash Đối với các lập trình viên, MAI-Code-1-Flash là tin vui lớn. Mô hình này chuyên về sinh mã nguồn và hỗ trợ phát triển phần mềm, được tối ưu hóa cho các tác vụ lập trình thực tế. Điều quan trọng hơn là nó sẽ được tích hợp trực tiếp vào GitHub Copilot và Visual Studio Code, hai công cụ mà hàng triệu lập trình viên sử dụng hằng ngày. Điều này có nghĩa là trải nghiệm gợi ý mã nguồn và viết code tự động sẽ được nâng cấp đáng kể ngay trên môi trường làm việc quen thuộc. Hình ảnh và giọng nói: hai mảnh ghép còn thiếu Ở mảng sáng tạo nội dung, Microsoft công bố MAI-Image-2.5 cùng phiên bản MAI-Image-2.5-Flash. Đây là các mô hình tạo sinh và chỉnh sửa hình ảnh thế hệ mới, trong đó phiên bản Flash được tối ưu cho khả năng phản hồi nhanh, phù hợp với các ứng dụng cần xử lý thời gian thực như chỉnh sửa ảnh trực tiếp hay tạo hình minh họa theo yêu cầu. Về lĩnh vực âm thanh, Microsoft giới thiệu hai mô hình quan trọng: MAI-Voice-2 với khả năng tổng hợp giọng nói tự nhiên hơn và hỗ trợ thêm nhiều ngôn ngữ mới MAI-Transcribe-1.5 chuyển đổi giọng nói thành văn bản với tốc độ xử lý nhanh hơn đáng kể so với thế hệ trước Ngoài ra, Microsoft cũng phát triển thêm những biến thể được tối ưu riêng cho nền tảng Microsoft Foundry, giúp doanh nghiệp dễ dàng xây dựng và triển khai ứng dụng AI của riêng mình. Chiến lược giảm phụ thuộc OpenAI Nếu như trước đây Microsoft chủ yếu được nhìn nhận là đối tác cung cấp hạ tầng và nền tảng triển khai cho OpenAI, thì Build 2026 cho thấy hãng đang từng bước sở hữu đầy đủ các mảnh ghép quan trọng trong hệ sinh thái AI. Microsoft hiện đã có mô hình suy luận, mô hình lập trình, mô hình tạo ảnh, mô hình tổng hợp giọng nói và mô hình nhận dạng giọng nói, tất cả được kết nối trực tiếp với hệ sinh thái Azure, Copilot và Microsoft Foundry. Chiến lược này giúp Microsoft chủ động hơn trong việc phát triển công nghệ cốt lõi, đồng thời giảm rủi ro khi phụ thuộc vào các đối tác bên ngoài. Cụ thể hơn, việc sở hữu mô hình AI riêng cho phép Microsoft kiểm soát lộ trình sản phẩm, tối ưu chi phí vận hành và tùy chỉnh mô hình theo nhu cầu cụ thể của từng dịch vụ mà không phải chờ đợi hay đàm phán với bên thứ ba. Cuộc đua mô hình AI sẽ đi về đâu? Việc ra mắt đồng thời 7 mô hình AI mới cho thấy Microsoft đang đầu tư mạnh vào các công nghệ nền tảng nhằm cạnh tranh trực tiếp với những tên tuổi lớn như OpenAI, Google hay Anthropic. Khi đối tác lớn nhất của OpenAI quyết định tự xây mô hình AI riêng, đó là tín hiệu rõ ràng nhất rằng cuộc đua AI đã bước sang giai đoạn mới, nơi không ai muốn đặt tương lai công nghệ của mình vào tay kẻ khác. Với các nhà phát triển và doanh nghiệp, đây là lúc để theo dõi sát nền tảng Microsoft Foundry và hệ sinh thái Azure AI, vì những công cụ mà trước đây chỉ có OpenAI mới cung cấp sắp xuất hiện ngay trong hệ sinh thái Microsoft quen thuộc. Build 2026 có thể sẽ được nhớ đến như thời điểm Microsoft chính thức phát đi tuyên ngôn về một hệ sinh thái AI độc lập, toàn diện và mang đậm dấu ấn riêng.

Nam
4 thg 6, 2026
Agent Harness là gì? Bộ khung giúp AI làm việc hiệu quả

Hãy tưởng tượng bạn có một trợ lý AI vô cùng thông minh nhưng lại rất nhanh quên và không tự kiểm tra được chất lượng công việc của mình. Để giải quyết vấn đề này, các nhà phát triển đã tạo ra một lớp bảo vệ và quản lý bao quanh mô hình AI mang tên agent harness. Đây chính là thứ giúp các trợ lý AI tự động hoàn thành những nhiệm vụ phức tạp mà không cần sự can thiệp liên tục từ con người. Agent harness là gì? Để dễ hình dung, hãy tưởng tượng mô hình AI giống như một nhân viên mới cực kỳ thông minh nhưng lại có trí nhớ rất ngắn hạn và hoàn toàn xa lạ với môi trường làm việc. Nhân viên này có thể giải quyết các bài toán phức tạp trong tích tắc nhưng lại dễ quên mình đang làm gì hoặc vô tình gửi nhầm tài liệu quan trọng cho khách hàng. Trong tình huống đó, agent harness đóng vai trò như một người quản lý giàu kinh nghiệm ngồi ngay bên cạnh để hướng dẫn và giám sát. Nói đơn giản hơn, agent harness là lớp phần mềm bao bọc bên ngoài mô hình AI, đảm nhận mọi công việc hành chính và hậu cần để AI chỉ cần tập trung vào việc suy nghĩ và đưa ra giải pháp. Lớp này kết nối AI với các công cụ bên ngoài, ghi chép lại toàn bộ lịch sử công việc qua nhiều ngày và kiểm tra chất lượng kết quả trước khi coi là xong. Về mặt thực tế, một agent harness thực hiện các nhiệm vụ sau: Kết nối mô hình AI với các công cụ bên ngoài như tìm kiếm web, hòm thư điện tử hay lịch làm việc Lưu trữ toàn bộ tiến trình công việc để AI không phải bắt đầu lại từ đầu ở phiên làm việc tiếp theo Lọc bớt thông tin dư thừa và chỉ cung cấp những dữ liệu cần thiết nhất cho AI tại mỗi bước Giám sát các hành động của AI nhằm ngăn chặn những sai sót nguy hiểm Ghi lại nhật ký hoạt động chi tiết để con người dễ dàng kiểm tra khi cần Nguồn gốc thuật ngữ: Khái niệm "agent harness" được chuyên gia công nghệ Mitchell Hashimoto chính thức đặt tên vào đầu năm 2026. Trước đó, nhiều nhóm phát triển đã xây dựng các hệ thống tương tự nhưng chưa có tên gọi chung cho lớp hạ tầng này. Vì sao AI hay thất bại khi làm việc dài hơi? Điểm yếu lớn nhất của các mô hình AI hiện nay là chúng hoàn toàn không có ký ức dài hạn. Khi bạn mở một cuộc trò chuyện mới, AI bắt đầu từ con số không và không nhớ bất kỳ thông tin nào từ các cuộc trò chuyện trước. Hãy tưởng tượng bạn thuê một nhân viên mà mỗi buổi sáng thức dậy đều quên sạch mọi thỏa thuận và tiến độ công việc từ hôm qua. Khi Anthropic thử nghiệm cho Claude xây dựng một ứng dụng web phức tạp mà không có harness hỗ trợ, kết quả rất đáng thất vọng. Hai lỗi liên tục xuất hiện: AI cố gắng làm tất cả cùng một lúc, bộ nhớ bị quá tải giữa chừng và bỏ dở dự án. Phiên tiếp theo lại tốn thời gian đoán xem đã làm được đến đâu. AI tự tuyên bố hoàn thành công việc mà không chạy thử xem kết quả có thực sự hoạt động hay không. Ngoài hai lỗi trên, việc thực hiện các dự án dài hạn còn khiến AI gặp thêm các vấn đề sau: Bộ nhớ làm việc bị tắc nghẽn: Hàng loạt thông tin phụ tích tụ theo thời gian khiến AI dần mất tập trung vào mục tiêu ban đầu Sử dụng công cụ sai cách: AI đôi khi tìm kiếm thông tin không tồn tại hoặc điền sai thông tin vào biểu mẫu, và nếu không có gì chặn lại sẽ lặp đi lặp lại cùng một lỗi Mất toàn bộ tiến trình khi gặp sự cố: Bất kỳ lỗi mạng hay sự cố hệ thống nào cũng xóa sạch những gì đang lưu trong bộ nhớ tạm Nghiên cứu của Stanford (2023): Các mô hình AI thường bỏ qua thông tin nằm ở giữa một văn bản dài, kể cả khi văn bản đó không quá dài. Đây là lý do vì sao việc nạp quá nhiều dữ liệu vào AI cùng lúc thường phản tác dụng nếu không có bộ lọc hỗ trợ. Agent harness hoạt động ra sao trong thực tế? Một agent harness hoạt động qua hai giai đoạn riêng biệt để đảm bảo công việc diễn ra liên tục và không bị gián đoạn. Giai đoạn chuẩn bị (chỉ diễn ra một lần) Harness thiết lập toàn bộ môi trường làm việc trước khi AI bắt đầu: lập danh sách các việc cần làm, chuẩn bị nơi lưu trữ dữ liệu và ghi lại điểm xuất phát. Giống như người quản lý lập kế hoạch chi tiết trước khi giao việc cho nhân viên, giai đoạn này chỉ cần thực hiện một lần duy nhất. Giai đoạn thực thi (lặp lại nhiều lần) Mỗi khi AI bắt đầu một phiên làm việc mới, harness tự động tải lại toàn bộ tiến độ đã lưu và chỉ giao đúng phần việc tiếp theo. Khi AI muốn thực hiện một hành động như tìm kiếm thông tin hay gửi thông báo, harness kiểm tra độ an toàn của yêu cầu đó trước khi thực hiện, làm sạch kết quả trả về rồi mới đưa lại cho AI xử lý tiếp. AI không bao giờ tương tác trực tiếp với hệ thống bên ngoài mà không qua lớp kiểm soát này. Bốn bộ phận quan trọng tạo nên một agent harness Để giúp AI hoạt động ổn định trong thời gian dài, một agent harness tiêu chuẩn cần có bốn thành phần cốt lõi: Cổng kết nối công cụ bên ngoài: Cho phép AI tương tác với thế giới thực như đọc tài liệu, tìm kiếm web hay gửi thông báo. Harness đóng vai trò trung gian, kiểm tra mỗi yêu cầu trước khi thực hiện và đảm bảo kết quả trả về sạch sẽ, dễ xử lý. Bộ quản lý ký ức nhiều tầng: Duy trì ba loại bộ nhớ phục vụ nhu cầu khác nhau gồm ký ức tạm thời trong phiên hiện tại, nhật ký công việc đang thực hiện và kho kiến thức tích lũy lâu dài qua nhiều dự án. Bộ lọc thông tin thông minh: Tóm tắt lịch sử hội thoại dài thành các ý chính và chỉ cung cấp đúng phần dữ liệu liên quan đến bước hiện tại thay vì nạp tất cả cùng lúc, giúp AI luôn tập trung vào đúng nhiệm vụ. Bộ kiểm tra an toàn và phê duyệt: Tự động xác nhận kết quả trước khi coi tác vụ là hoàn thành. Với các hành động nhạy cảm như xóa dữ liệu quan trọng hay gửi email hàng loạt, harness dừng lại và yêu cầu con người xác nhận trước khi tiếp tục. Lưu ý về dữ liệu tích lũy: Nếu kho ký ức của AI được lưu trữ hoàn toàn trên nền tảng đóng của bên thứ ba, bạn có nguy cơ mất toàn bộ kiến thức tích lũy khi muốn chuyển sang hệ thống khác. Đây là điều cần cân nhắc kỹ khi chọn giải pháp AI agent cho công việc lâu dài. Harness engineering và bí quyết tạo ra hàng triệu dòng code Harness engineering là cách tiếp cận xem mỗi thất bại của AI là một lỗi hệ thống cần khắc phục triệt để, không phải thứ cần thử lại hay bỏ qua. Theo Mitchell Hashimoto, nếu AI mắc lỗi, hãy thiết kế lại môi trường để về mặt vật lý nó không thể mắc lỗi đó nữa. Trong thực tế, khi OpenAI xây dựng các dự án phần mềm lớn với ba kỹ sư tạo ra 3,5 pull request mỗi người mỗi ngày mà không gõ một dòng code nào, họ đã thiết lập cơ chế kiểm tra tự động sau mỗi hành động của AI. Khi AI chạy sai, hệ thống trả về thông báo lỗi được viết theo cấu trúc đặc biệt để AI hiểu ngay mình cần sửa đổi gì ở bước tiếp theo. Mỗi thông báo lỗi trở thành ngữ cảnh học tập, không chỉ là cảnh báo. Một nghiên cứu tại hội thảo ICML năm 2025 cũng chứng minh rằng cùng một mô hình AI khi được trang bị harness luôn vượt trội so với chính nó khi chạy không có harness, kể cả khi không thay đổi gì về cách huấn luyện hay câu lệnh đầu vào. Điều này khẳng định môi trường xung quanh AI quan trọng không kém bản thân model. Góc nhìn thực tế: Claude Code của Anthropic hiện đã vượt 512.000 dòng lập trình và con số này tiếp tục tăng. Model ngày càng mạnh hơn không làm cho harness trở nên đơn giản hơn mà ngược lại, lớp hạ tầng này phát triển thêm để tận dụng tối đa những khả năng mới. Khi nào bạn thực sự cần đến agent harness? Với những việc đơn giản như tóm tắt một tài liệu hay trả lời câu hỏi cụ thể, dùng AI trực tiếp là đủ. Nhưng ngay khi công việc bắt đầu kéo dài hơn một cuộc trò chuyện, cần nhớ thông tin từ lần trước hoặc phải thực hiện nhiều bước theo thứ tự nhất định, đó là lúc harness trở nên cần thiết. Một điểm đáng để suy nghĩ: ngay cả tính năng tìm kiếm web tích hợp sẵn trong ChatGPT hay Gemini cũng chính là một dạng harness. Khi AI tự động tra cứu thông tin, có một lớp hạ tầng phía sau đang thực hiện lệnh gọi công cụ, xử lý kết quả và đưa thông tin sạch vào ngữ cảnh. Harness vô hình với người dùng nhưng không thể thiếu với hệ thống. Agent harness không phải xu hướng kỹ thuật ngắn hạn mà là giải pháp cho những giới hạn cốt lõi của AI: không có ký ức dài hạn, bộ nhớ làm việc có giới hạn và dễ mắc lỗi khi dùng công cụ bên ngoài. 4aivn cũng bất đầu áp dụng Harness vào trong công việc bên mình điều này không chỉ giúp AI hoàn thành tác vụ mà còn biến AI thành hệ thống có thể học từ thất bại và cải thiện theo thời gian.

Nam
1 thg 6, 2026
Codex là gì? Công cụ đang là ngôi sao mới nổi của Open AI

Ba triệu người dùng Codex mỗi tuần, tăng gấp 6 lần chỉ trong 3 tháng đầu năm 2026. Con số đó nói lên một điều Codex chính là ngôi sao đang lên. OpenAI đang biến nó thành công cụ gom tất cả trong một điều đó làm cho Codex sẽ không chỉ là sân chơi của mỗi riêng lập trình viên thôi. Codex là gì? Đây là công cụ không chỉ dành cho lập trình viên Hãy thử nghĩ đến tình huống này: bạn muốn tạo một bảng theo dõi chi tiêu tự động cập nhật mỗi tuần, hoặc một trang web nhỏ để nhận đặt lịch từ khách hàng, hoặc đơn giản hơn là muốn có một công cụ tự tổng hợp email báo cáo mỗi sáng mà không cần mở hàng chục tab. Trước đây, những việc này cần một developer. Với Codex, bạn chỉ cần gõ yêu cầu bằng tiếng Anh hoặc tiếng Việt và chờ kết quả. Codex là AI agent của OpenAI, ra mắt tháng 5/2025 và được tích hợp rất sâu vào hệ sinh thái của ChatGPT. Điểm khác biệt cốt lõi so với ChatGPT thông thường là Codex không chỉ trả lời, nó thực sự làm việc thông qua môi trường code. Bạn giao một nhiệm vụ, Codex tự lên kế hoạch, tự thực hiện từng bước, tự kiểm tra kết quả và trả về sản phẩm hoàn chỉnh để bạn dùng ngay. Không cần bạn hiểu code là gì, không cần bạn giám sát từng dòng lệnh. Codex đã có thể hoạt động qua ứng dụng desktop riêng, có sẵn cho cả Windows và macOS hoặc mới đây Codex đã có thể mở rộng sang Android và iOS trên điện thoại, tất nhiên bạn có thể sử dụng ngay tài khoản ChatGPT hiện có để đăng nhập. Codex hiện có trong các gói ChatGPT Plus,Pro, Business và Enterprise tuy nhiên người dùng gói Free và Go cũng được dùng thử với hạn mức giới hạn. Những việc Codex có thể làm thay bạn Tạo ứng dụng hoặc trang web nhỏ từ mô tả Bạn không cần biết HTML hay JavaScript. Chỉ cần mô tả: "Tạo cho tôi một trang đặt lịch hẹn đơn giản, có ô nhập tên, số điện thoại và chọn ngày giờ, gửi thông báo về email khi có người đặt." Codex sẽ tự tạo toàn bộ giao diện, logic xử lý và hướng dẫn bạn đưa lên internet. Một nhóm startup ở Mỹ từng chia sẻ rằng họ hoàn thành trong một cuối tuần những gì trước đây mất cả quý, và đó không phải nhóm toàn developer. Tự động hóa các tác vụ lặp lại Đây là phần nhiều người dùng không phải lập trình viên sẽ thấy hữu ích nhất. Ví dụ: mỗi tuần bạn phải tổng hợp doanh thu từ ba file Excel khác nhau, gộp lại và gửi báo cáo cho sếp. Codex có thể tạo một quy trình tự động làm việc này cho bạn, lên lịch chạy định kỳ và gửi kết quả mà không cần bạn mở máy tính. Với tính năng Automations ra mắt trong bản cập nhật tháng 4/2026, Codex có thể nhận task dài hạn, tạm dừng, tiếp tục và hoàn thành trong nhiều ngày mà không cần bạn nhắc lại từ đầu. Tạo ảnh và prototype trực tiếp trong app Codex tích hợp khả năng tạo ảnh bằng mô hình GPT Image 2.0 cực kì mạnh mẽ trực tiếp trong app luôn. Bạn có thể yêu cầu Codex tạo mockup giao diện, banner sản phẩm, hay hình ảnh minh họa cho tài liệu ngay trong cùng một luồng làm việc mà không cần chuyển sang công cụ khác. Với người làm nội dung, marketer hay founder solo, đây là điểm cộng thực sự vì toàn bộ quy trình từ ý tưởng đến sản phẩm có thể xảy ra trong một cửa sổ duy nhất. Điều khiển máy tính để làm việc trong nền Từ tháng 4/2026, Codex có thể vận hành các ứng dụng trên Mac bằng con trỏ riêng của nó, nhìn màn hình, click và gõ phím để hoàn thành tác vụ trong khi bạn vẫn đang dùng máy bình thường. Hình dung đơn giản hơn: bạn đang họp online, còn Codex đang mở Figma, chỉnh sửa thiết kế và lưu file theo yêu cầu bạn đặt ra từ trước. Hai việc diễn ra song song, không ai cản trở ai. Tính năng điều khiển máy tính (computer use) hiện chỉ khả dụng trên macOS và chưa có ở EU, UK. Bạn cần cấp quyền Accessibility và Screenshot cho ứng dụng Codex khi cài lần đầu. Cách bắt đầu dùng Codex Codex yêu cầu cài đặt ứng dụng desktop trên Windows hoặc macOS, không chạy trực tiếp trên trình duyệt web. Quá trình cài đặt khá đơn giản và chỉ mất vài phút. Bước 1: Truy cập openai.com/codex, tải về bản phù hợp với hệ điều hành của bạn. Với macOS, có hai bản riêng cho chip Apple Silicon (M1 trở lên) và chip Intel. Với Windows, chỉ có một bản duy nhất. Bước 2: Cài đặt ứng dụng và đăng nhập bằng tài khoản ChatGPT hoặc API key OpenAI hiện có của bạn. Bước 3: Chọn thư mục dự án bạn muốn Codex làm việc trong đó có thể chọn liên kết với Github, hoặc bỏ qua bước này nếu bạn chỉ muốn giao task độc lập như tạo file, tạo ảnh hay tự động hóa quy trình. Bước 4: Gõ yêu cầu bằng ngôn ngữ tự nhiên, càng cụ thể càng tốt. Thay vì "làm cho tôi một cái gì đó về báo cáo", hãy gõ "Tạo file Excel tổng hợp doanh thu theo tháng từ dữ liệu tôi cung cấp, thêm biểu đồ cột so sánh từng tháng và tô màu tháng có doanh thu cao nhất." Yêu cầu càng cụ thể, kết quả càng tốt. Codex hoạt động tốt nhất khi bạn mô tả rõ đầu vào, đầu ra mong muốn và bất kỳ ràng buộc nào bạn cần, ví dụ như định dạng file, ngôn ngữ hiển thị hay quy tắc tính toán. So sánh Codex với Claude Code, Antigravity và Cursor dưới góc nhìn người dùng phổ thông Nếu bạn không phải developer, câu hỏi thực tế không phải là "công cụ nào mạnh hơn về mặt kỹ thuật" mà là "công cụ nào tôi có thể dùng ngay mà không cần học thêm gì". Dưới góc nhìn đó, bốn công cụ này khác nhau rõ rệt. Codex và Claude Code Claude Code của Anthropic là đối thủ trực tiếp và đáng gờm nhất của Codex. Về chất lượng đầu ra thuần kỹ thuật, Claude Code hiện đứng đầu trong nhóm này, tạo ra code sạch hơn, logic chặt chẽ hơn và xử lý tốt hơn với các codebase lớn và phức tạp. Tuy nhiên, Claude Code được thiết kế rõ ràng cho developer: giao diện terminal, cần cài đặt qua dòng lệnh và đặc biệt không có khả năng tạo ảnh . Nếu bạn không quen với terminal, Claude Code sẽ là rào cản ngay từ bước đầu. Ngược lại, Codex có giao diện desktop thân thiện hơn, tích hợp khả năng tạo ảnh ngay trong cùng một luồng làm việc và dễ tiếp cận hơn rõ rệt với người dùng không chuyên kỹ thuật. Codex và Antigravity Cả hai đều yêu cầu cài ứng dụng desktop, nhưng triết lý sử dụng lại khác nhau hoàn toàn. Codex được thiết kế theo mô hình "giao việc và chờ kết quả": bạn mô tả yêu cầu, agent chạy trong cloud sandbox riêng biệt và trả về sản phẩm hoàn chỉnh mà không ảnh hưởng gì đến máy bạn đang dùng. Phù hợp với người muốn tự động hóa quy trình, tạo file hay xây dựng sản phẩm mà không cần theo dõi từng bước. Antigravity hoạt động theo hướng ngược lại: agent chạy trực tiếp trên máy bạn, nhìn màn hình, mở ứng dụng và phối hợp với bạn theo thời gian thực trong khi bạn đang làm việc. Nếu bạn muốn một đồng nghiệp AI làm việc song song cùng mình, quan sát và phản ứng với những gì đang xảy ra trên màn hình, Antigravity phù hợp hơn. Codex và Cursor Cursor được xây dựng trên nền VS Code và hướng đến developer muốn giữ nguyên môi trường làm việc quen thuộc. Với người không biết code, Cursor gần như không phù hợp vì toàn bộ trải nghiệm xoay quanh việc chỉnh sửa code trong editor. Cursor mạnh ở khả năng hiểu toàn bộ codebase và linh hoạt trong việc chọn model AI, nhưng đó là lợi thế dành cho developer, không phải cho người dùng phổ thông cần tự động hóa quy trình hay tạo sản phẩm từ đầu. Tóm lại theo góc nhìn người dùng không chuyên kỹ thuật: Codex: Giao diện desktop thân thiện trên Windows và macOS, tạo được ảnh, phù hợp với người muốn dùng AI như một công cụ workflow tự động. Claude Code: Chất lượng đầu ra kỹ thuật tốt nhất, nhưng thiên về developer và không tạo được ảnh. Antigravity:Agent làm việc trực tiếp trên máy theo thời gian thực, phù hợp với người muốn phối hợp cùng AI trong lúc đang làm việc . Cursor: Tốt nhất cho developer giữ nguyên workflow VS Code, không phù hợp với người dùng phổ thông. Codex phù hợp nhất với ai? Nếu bạn là người làm nội dung muốn tự tạo landing page cho chiến dịch thì Codex khá phù hợp. Nếu bạn là marketer cần tự động hóa báo cáo hàng tuần từ nhiều nguồn dữ liệu, Codex phù hợp. Nếu bạn là founder solo đang cần ra sản phẩm nhanh mà chưa có team kỹ thuật, Codex phù hợp. Nếu bạn là giáo viên muốn tạo một ứng dụng trắc nghiệm nhỏ cho học sinh mà không muốn học lập trình, Codex phù hợp. Ngược lại, nếu bạn là developer cần kiểm soát chi tiết từng dòng code trong một codebase lớn và phức tạp, Claude Code sẽ cho chất lượng đầu ra tốt hơn. Codex là công cụ tối ưu cho những người muốn kết quả nhanh mà không cần hiểu cách nó hoạt động bên trong. Một giới hạn thực tế cần biết: Codex hiện chỉ hỗ trợ đầy đủ với Python, JavaScript, TypeScript và Ruby. Với các tác vụ không liên quan đến code như tạo ảnh, tự động hóa quy trình hay tạo tài liệu, giới hạn ngôn ngữ này không ảnh hưởng gì đến bạn. Ranh giới biết code đang mờ dần Câu hỏi "bạn có biết lập trình không" đang dần mất đi sức nặng khi các công cụ như Codex tiếp tục phát triển. Điều quan trọng hơn bây giờ là bạn có thể mô tả rõ ràng những gì mình muốn không, vì đó chính xác là kỹ năng về mặt tư duy khi bạn muốn làm việc với Codex hay các công cụ khác AI Agent tương tự. Nếu muốn thử ngay hôm nay, hãy bắt đầu bằng một tác vụ nhỏ và cụ thể: yêu cầu Codex tạo một file Excel tổng hợp dữ liệu bạn đang làm thủ công mỗi tuần. Đó là bài kiểm tra nhanh nhất để bạn tự đánh giá xem Codex có thực sự tiết kiệm thời gian cho mình hay không.

Nam
15 thg 5, 2026