Quay lại trang tin tức

Ba cách giao việc hiệu quả cho Antigravity

Xuất bản vào 3 tháng 04, 2026
Ba cách giao việc hiệu quả cho Antigravity

Tóm tắt nhanh

Antigravity là công cụ mạnh mẽ nhưng dễ gây quá tải nhận thức. Bài viết chia sẻ 3 cách để giao việc trơn tru hơn: tận dụng cấu hình sẵn có, dùng bộ khung 4C để chia nhỏ task, hoặc giao phó trong môi trường đã setup hoàn chỉnh.

Nhận việc xong rồi ngồi nhìn màn hình cả tiếng không biết bắt đầu từ đâu đây là điều này xảy ra với người dùng Antigravity không kém gì người làm việc thông thường. Vấn đề không phải bạn kém hay lười mà là não bạn không sợ việc khó, nó sợ việc không rõ ràng và khi bạn giao cho AI một yêu cầu mơ hồ thì kết quả Antigravity tạo ra cũng sẽ mơ hồ không kém.

Tại sao giao việc cho Antigravity mà vẫn ra kết quả tệ?

Antigravity là agent thực sự vì nó có thể lên kế hoạch, viết code, chạy lệnh và tự kiểm tra kết quả. Nhưng đây chính xác là lý do khiến nhiều người thất vọng lần đầu dùng, họ bắt tay ngay giao cho Antigravity một việc cực lớn và mơ hồ, agent chạy 30 phút theo hướng sai quota tiêu hao hết mà kết quả không dùng được.

Các nhà khoa học nhận thức gọi trạng thái đóng băng trước việc lớn là quá tải nhận thức - cognitive overload. Não không biết xử lý từ đâu nên chọn cách an toàn nhất là không làm gì cả và vòng lặp quen thuộc trông như thế này:

  • Não sợ làm sai → đóng băng
  • Không bắt đầu được → hạn chót đến gần
  • Càng sợ hơn → lại đóng băng tiếp

Với Antigravity, quá tải nhận thức của người dùng trực tiếp tạo ra prompt tệ, và prompt tệ tạo ra agent chạy sai hướng tất nhiên vòng lặp này tốn token và thời gian hơn bất kỳ lỗi kỹ thuật nào.

Có ba cách tiếp cận để phá vỡ vòng lặp đó, tùy vào mức độ bạn đã hiểu yêu cầu và đã thiết lập quy trình đến đâu.

Ba cách tiếp cận việc hiệu quả với Antigravity

Cách 1: Tải source code của người đã có kinh nghiệm

Đây là cách nhanh nhất để bắt đầu mà không mất thời gian thiết lập từ đầu, đặc biệt phù hợp khi bạn chưa biết quy trình của mình nên trông như thế nào. Antigravity hoạt động tốt nhất khi có đủ ngữ cảnh về dự án dó là khi nó có thể nhìn thấy các rules, workflow, skills và thư mục bộ nhớ ghi lại kiến thức cũ. Thay vì tự xây dựng tất cả, bạn sao chép source code của người đã thiết lập đầy đủ, tải về và để agent đọc toàn bộ cấu hình có sẵn và điều tất nhiên là phải được người đó đồng ý hoặc đã public .

Khi bạn sao chép kho code của người đã thiết lập đầy đủ, tải về và để agent đọc toàn bộ cấu hình có sẵn, bạn nhận được hai lợi ích cùng lúc:

  • Agent hiểu ngay phong cách viết skills, workflow, nền tảng kỹ thuật và các rules của dự án từ ngày đầu mà không cần bạn giải thích lại.
  • Bạn học được cách người có kinh nghiệm thiết lập quy trình — từ cách tổ chức thư mục bộ nhớ đến cách viết quy tắc cho agent mà không cần tự mày mò từ đầu.

Tuy nhiên khi bạn không hiểu các ý đồ của người viết thì hoàn toàn không thể sử dụng hết chức năng của source code này giống như một mặc một chiếc áo quá rộng vậy.

Cách 2: Tự giải quyết từng bước nhỏ trước khi giao việc lớn

Đây là cách tiết kiệm hạn mức nhất và cũng là bài học mình học được sau nhiều lần lãng phí vì giao việc quá to ngay từ đầu. Bộ khung 4C — Làm rõ (Clarify), Tách nhỏ (Chunk), Tham khảo (Consult), Cam kết (Commit) vốn dùng để giải quyết việc của con người, nhưng áp dụng vào Antigravity lại cực kỳ hiệu quả vì lý do đơn giản: bạn càng rõ ràng trước khi giao việc, agent càng ít phải đoán.

  • Bước làm rõ: Trước khi gõ bất cứ thứ gì vào Antigravity, hãy tự trả lời 4 câu hỏi sau:

    • Kết quả cuối cùng trông như thế nào?
    • Ai sẽ dùng cái này?
    • Hạn chót thật sự là khi nào?
    • Thế nào là hoàn thành tốt việc này?

    Năm phút ngồi trả lời sẽ thay đổi hoàn toàn chất lượng câu lệnh. Thay vì "xây cho mình một hệ thống đăng nhập", bạn sẽ viết được "xây hệ thống đăng nhập bằng Google OAuth cho ứng dụng Next.js, lưu phiên làm việc vào Firestore, chuyển hướng về trang chính sau khi đăng nhập thành công, chạy thử trên máy và chụp ảnh màn hình để mình xem".

  • Bước tách nhỏ: Dựa trên hiệu ứng Zeigarnik một khi bạn bắt đầu dù chỉ một bước nhỏ, não tự động muốn hoàn thành những bước tiếp theo. Hãy hỏi agent "chia task thành các bước nhỏ nhất để bắt đầu ?" và đi qua từng bước một. Dành khoảng thời gian nhất định để tìm hiểu cấu trúc, kiểm tra xem agent hiểu đúng yêu cầu chưa trước khi để nó chạy việc lớn. Nhưng hãy nhớ là chỉ giành một khoảng thời gian nhất định thôi nhé vì chỉ khi thực hiện thì nhiều vấn đề mới thực sự lộ ra chúng ta mới tìm ra cách giải quyết. Ở bước này chúng ta có thể sử dụng luôn chế độ Fast Mode cho agent thực hiện luôn mà không cần phải tạo khung sườn hay suy nghĩ sâu hoặc thậm chí nếu không có gì đặc biệt thì Gemini Flash hoàn toàn có thể đảm nhiệm tốt phần này cực kì tiết kiệm token cho Gemini Pro và Claude Opus.
  • Bước tham khảo: Đừng tự làm khó bản thân khi đã có người đi trước. Tương tự như cách 1 tải mã nguồn người khác về dùng, bước này là chủ động tìm và đọc cách họ tiếp cận vấn đề xem họ chia việc ra sao, viết câu lệnh như thế nào, thiết lập quy trình ra sao rồi chắt lọc những phương pháp phù hợp để áp dụng vào việc của mình. Bạn không cần sao chép nguyên xi, chỉ cần học từ cấu trúc tư duy của họ. Điều này đặc biệt có giá trị với những loại việc bạn chưa từng giao cho agent bao giờ vì người đã làm trước thường đã tìm ra cả những điểm dễ đi sai mà bạn chưa biết.
  • Bước cam kết: Thay vì cố lên kế hoạch hoàn hảo cho toàn bộ việc trước khi bắt đầu hãy chỉ cam kết 10 đến 15 phút đầu tiên để tìm hiểu. Hỏi agent một câu nhỏ, xem nó phản hồi thế nào và lúc nào cũng thêm câu prompt “Nếu vấn đề không rõ hoàn toàn có thể hỏi lại không được tự ý quyết định”. Chắc chắn sẽ có những thiếu sót nhưng chúng ta sẽ cảm thấy được chúng ta đã đi được một quãng đường xa với Antigravity với task thay vì ngồi viết prompt hoàn hảo hàng giờ mà chưa làm được gì chắc chắn sẽ rất chán.

Cách 3: Giao việc lớn ngay khi đã có quy trình thiết lập sẵn

Cách này chỉ hoạt động khi bạn đã qua hai cách trên — đã có quy trình rõ ràng, bộ nhớ ngữ cảnh skills, và agent đã quen với các rules, workflow. Đây có thể coi là bước cam kết trong bộ khung 4C: thay vì lo lắng về toàn bộ việc, bạn cần hướng agent vào một kết quả cụ thể và để agent tự xử lý phần còn lại.

Lúc này, chế độ Plan Mode là lựa chọn tốt hơn chế độ Fast Mode vì agent phải tạo kế hoạch thực hiện chi tiết trước khi thực hiện task, từ đó bạn có thể xem lại kế hoạch đó để lại ghi chú nếu cần điều chỉnh rồi mới để agent chạy.

Cách này kết hợp tốc độ của agent với tầm nhìn chiến lược của bạn vì quy trình đã có sẵn nên bước làm rõ nên được tích hợp vào các rules, workflow, skills để agent không cần bạn giải thích lại ngữ cảnh mỗi lần. Đặc biệt đây là cách cực kì ưa thích đối với các Pro khi mà họ dùng Claude để lên kế hoạch cực xịn rồi sau đó họ đưa vào cho GLM để thực thi taks để tiết kiệm token.

Chúng ta nên chọn cách nào cho công việc của chúng ta

Ba cách này sử dụng trong Antigravity không loại trừ nhau mà theo thứ tự từ ít đến nhiều ngữ cảnh:

  • Việc mơ hồ, chưa biết bắt đầu từ đâu: Sao chép source code người khác hoặc dùng bộ khung 4C để làm rõ trước.
  • Việc đã hiểu nhưng lớn và phức tạp: Đi qua từng bước nhỏ, dùng Flash cho bước đơn giản và dành Pro cho bước cần suy nghĩ sâu.
  • Việc đã có quy trình rõ ràng: Giao thẳng với chế độ Plan Mode, để agent tự xử lý trong khi bạn làm việc khác.

Điểm chung của cả ba cách là bạn phải làm một việc trước khi mở Antigravity: suy nghĩ. Không phải suy nghĩ dài — chỉ cần 5 đến 10 phút ngồi làm rõ yêu cầu trước khi giao cho agent. Khoảng thời gian đó tiết kiệm nhiều hạn mức hơn bất kỳ kỹ thuật tối ưu prompt nào khác.

Thảo luận (0)

Đăng nhập để tham gia thảo luận.

Chưa có bình luận nào. Hãy là người đầu tiên!

Các bài viết liên quan

Google I/O 2026: Antigravity 2.0 cải tiến lớn nhưng giao diện lại giống Codex

Tại sự kiện Google I/O 2026, gã khổng lồ tìm kiếm đã khiến toàn bộ cộng đồng lập trình viên ngỡ ngàng khi chính thức công bố Antigravity 2.0. Không còn là một IDE tích hợp AI thông thường Antigravity giờ đây lột xác thành một ứng dụng desktop độc lập vận hành bởi Gemini 3.5 Flash, đi kèm gói đăng ký AI Ultra trị giá $100/tháng. Tuy nhiên, việc loại bỏ hoàn toàn trình soạn thảo mã nguồn tích hợp để chuyển sang một giao diện tối giản kiểu Codex đang tạo nên làn sóng tranh cãi dữ dội. Antigravity 2.0 có bước chuyển mình như thế nào Quyết định tách biệt hoàn toàn trình soạn thảo mã nguồn ra khỏi Antigravity 2.0 đánh dấu một bước đi táo bạo của Google trong việc định hình lại tương lai của phát triển phần mềm. Thay vì cố gắng tích hợp các tính năng AI vào một IDE truyền thống, phiên bản mới này hoạt động như một trung tâm điều phối AI agent chuyên dụng. Điều này có nghĩa là người dùng sẽ tập trung hoàn toàn vào việc thiết lập nhiệm vụ và giám sát các luồng công việc thay vì trực tiếp chỉnh sửa từng dòng code. Sự thay đổi này được thể hiện rõ ràng nhất qua việc ra mắt gói dịch vụ AI Ultra trị giá $100 mỗi tháng. Đây là gói đăng ký cao cấp cung cấp giới hạn sử dụng gấp 5 lần so với gói AI Pro hiện tại, hướng tới các doanh nghiệp và nhà phát triển chuyên nghiệp cần vận hành số lượng lớn tác nhân tự chủ cùng lúc để giải quyết các bài toán phức tạp. Sức mạnh từ Gemini 3.5 Flash và quy trình chạy bất đồng bộ Trái tim của Antigravity 2.0 chính là mô hình ngôn ngữ lớn Gemini 3.5 Flash được tối ưu hóa đặc biệt cho các tác vụ agentic tốc độ cao. Nhờ khả năng xử lý vượt trội, hệ thống mới hỗ trợ quy trình làm việc đa tác nhân vô cùng phức tạp, cho phép nhiều subagent cùng tham gia giải quyết một dự án lớn. Cụ thể hơn, các tác nhân phụ này sẽ chạy hoàn toàn bất đồng bộ ở chế độ nền. Cơ chế này đảm bảo rằng giao diện chính của ứng dụng không bao giờ bị đóng băng hay gián đoạn trong suốt quá trình xử lý, giúp lập trình viên duy trì luồng công việc mượt mà. Đây là một cải tiến vượt bậc so với phiên bản tiền nhiệm vốn thường xuyên gặp hiện tượng trễ khi phải xử lý các đoạn mã nguồn lớn. Bộ đôi công cụ mới: Antigravity CLI và SDK Để tăng cường tính linh hoạt cho các lập trình viên, Google đã giới thiệu hai công cụ lập trình mới: Antigravity CLI viết bằng Go thay thế hoàn toàn cho Gemini CLI cũ, mang lại hiệu năng cao và tốc độ phản hồi cực nhanh trong terminal. Gemini CLI và Gemini Code Assist IDE extensions sẽ ngừng phục vụ từ ngày 18/6/2026. Người dùng Google AI Pro và Ultra cần chuyển sang Antigravity CLI trước thời hạn này. Antigravity SDK viết bằng Python cho phép các lập trình viên có thể tự xây dựng, tùy chỉnh cấu hình và tích hợp sâu các tác nhân tự chủ vào dự án. Giao diện tối giản kiểu Codex và làn sóng tranh cãi từ cộng đồng Mặc dù sở hữu nhiều nâng cấp mạnh mẽ về công nghệ, Antigravity 2.0 lại đang phải hứng chịu làn sóng chỉ trích từ cộng đồng người dùng do những thay đổi triệt để về giao diện. Giao diện mới giờ đây chỉ là một console tối giản tập trung vào khung chat để ra lệnh cho tác nhân, loại bỏ hoàn toàn không gian làm việc IDE quen thuộc. Nhiều ý kiến cho rằng thiết kế này trông giống hệt như một bản sao của ứng dụng Codex hay Claude Desktop. Sự tối giản quá mức này khiến không ít lập trình viên cảm thấy hụt hẫng và trống trải vì họ không còn khả năng xem và sửa đổi file trực tiếp một cách nhanh chóng như trước. Việc phải chuyển đổi qua lại giữa Antigravity và một editor bên ngoài làm giảm đáng kể hiệu suất làm việc thực tế của họ. Cách khôi phục trải nghiệm IDE truyền thống cho người dùng Nhằm xoa dịu những phản ứng tiêu cực từ phía cộng đồng, Google đã đưa ra một số giải pháp tình thế cho những ai chưa sẵn sàng thích nghi với giao diện mới. Người dùng có thể truy cập vào trang chủ chính thức của Antigravity để tải xuống một phiên bản IDE riêng biệt. Phiên bản này sẽ giúp khôi phục lại không gian làm việc tích hợp quen thuộc với các tính năng chỉnh sửa mã nguồn truyền thống. Tuy nhiên, Google cũng đưa ra cảnh báo rằng đây chỉ là giải pháp tạm thời. Trong các bản cập nhật tương lai, giao diện quản lý tác nhân sẽ bị loại bỏ hoàn toàn khỏi IDE để hãng dồn toàn bộ nguồn lực phát triển cho ứng dụng độc lập 2.0. Vì vậy, việc làm quen với mô hình làm việc mới là điều không thể tránh khỏi đối với các nhà phát triển trong dài hạn. Sự phát triển ngày càng nhanh của các công cụ như Antigravity và Codex Sự phân tách giữa trình soạn thảo code truyền thống và giao diện điều khiển agent là minh chứng rõ nét cho thấy AI đang dịch chuyển từ công cụ hỗ trợ sang đối tác tự chủ. Các lập trình viên cần chủ động làm quen với các công cụ điều khiển mới như CLI và SDK để chuyển dịch dần vai trò của mình từ người gõ code trực tiếp sang nhà quản lý và điều phối các hệ sinh thái tác nhân thông minh.

Nam
20 thg 5, 2026
Tính năng lắc điện thoại để tóm tắt của Firefox đã có mặt trên Android

Bạn có bao giờ mở một bài viết dài 3.000 chữ trên web trong điện thoại rồi không biết nên đọc hay thoát ra không? Mozilla có câu trả lời: lắc điện thoại. Tính năng "Shake to Summarize" từng được TIME vinh danh là một trong những phát minh tốt nhất năm 2025 vừa chính thức ra mắt trên Android cùng với Firefox 150. Shake to Summarize là gì và nó hoạt động ra sao? Shake to Summarize là tính năng AI tích hợp sẵn trong trình duyệt Firefox, cho phép người dùng nhận ngay bản tóm tắt nội dung của bất kỳ trang web nào mà không cần rời khỏi trình duyệt hay mở thêm ứng dụng nào khác. Để kích hoạt, người dùng có ba cách: Lắc điện thoại trong khi đang xem trang web Nhấn biểu tượng sấm sét trên thanh địa chỉ Vào menu ba chấm → Summarize Page Sau vài giây, Firefox mở một bảng nhỏ và hiển thị các ý chính của trang. Điểm đáng chú ý là bản tóm tắt thích nghi theo loại nội dung — công thức nấu ăn thì rút ra các bước cần làm, bài thể thao thì tập trung vào tỷ số và thống kê, bài tin tức thì làm nổi bật những diễn biến then chốt. Tính năng hoạt động với các trang dưới 5.000 từ. Với các trang dài hơn, Firefox sẽ không thể tạo tóm tắt. Hành trình từ iOS đến Android Shake to Summarize ra mắt lần đầu trên iOS vào tháng 9 năm 2025, ban đầu chỉ dành cho người dùng tại Mỹ với giao diện tiếng Anh. Phản hồi tích cực đến mức Mozilla nhận được đề cử đặc biệt từ TIME Best Inventions 2025 một giải thưởng hiếm khi dành cho tính năng của trình duyệt. Phiên bản Android đi qua giai đoạn thử nghiệm kỹ lưỡng trên Firefox Nightly trước khi được đưa vào bản chính thức Firefox 150, phát hành tháng 4 năm 2026. Trước đó, muốn dùng thử trên Android, người dùng phải mở Settings → About Firefox Nightly → nhấn logo ba lần để vào "Secret Settings" rồi bật thủ công — một quy trình rõ ràng là chỉ dành cho người dùng kỹ thuật. AI nào đứng sau tính năng này? Mozilla không dùng một mô hình duy nhất mà phân chia theo thiết bị: Với iPhone 15 Pro trở lên chạy iOS 26+, tóm tắt được tạo hoàn toàn trên máy nhờ Apple Intelligence dữ liệu không rời khỏi thiết bị. Với các thiết bị còn lại, nội dung trang được gửi đến máy chủ AI của Mozilla, xử lý xong rồi trả kết quả về. Về phía Mozilla, đội ngũ kỹ thuật đã thử nghiệm nhiều mô hình gồm Mistral Nemo, Mistral Small, Jamba 1.5 Mini, Gemini Flash 2.0 và Llama 4 Maverick trước khi chọn Mistral Small làm mô hình chính. Lý do: Mistral Small có trọng số mở (open weights), tốc độ xử lý nhanh và chi phí inference thấp hơn đáng kể so với các đối thủ — trong khi chất lượng tóm tắt vẫn ở mức cao. Mozilla cung cấp Shake to Summarize miễn phí và tự chịu toàn bộ chi phí inference, không tính phí người dùng. Người dùng không muốn AI thì sao? Đây là điểm Mozilla xử lý khá khéo. Sau khi bị phản ứng từ cộng đồng người dùng lâu năm những người lo ngại Firefox đang rời bỏ giá trị cốt lõi về quyền riêng tư Mozilla đã thêm nút tắt toàn bộ tính năng AI trong cài đặt trình duyệt. Trên desktop, tùy chọn "Block AI enhancements" cho phép tắt tất cả tính năng AI hiện tại lẫn tương lai, hoặc chọn lọc từng tính năng muốn giữ. Trên Android, Shake to Summarize được liên kết với bộ điều khiển AI Controls mới cả khi tắt AI, cả cử chỉ lắc và nút tóm tắt đều bị vô hiệu hóa đồng thời. Tính năng hiện chỉ hỗ trợ nội dung tiếng Anh. Người dùng tại Việt Nam muốn dùng cần chuyển ngôn ngữ hệ thống hoặc chờ Mozilla mở rộng hỗ trợ thêm ngôn ngữ. Firefox 150 còn có gì khác? Bên cạnh Shake to Summarize trên Android, Firefox 150 đem theo một số cập nhật đáng chú ý: Mở link trong chế độ split view (xem hai trang song song) Sao chép URL từ nhiều tab cùng lúc Dịch riêng tư theo thời gian thực trên trang chuyên dụng VPN tích hợp miễn phí mở rộng sang Canada (trước đó chỉ có ở một số thị trường) Hệ thống quản lý profile mới dành cho tất cả người dùng Firefox 151 dự kiến ra mắt ngày 19 tháng 5 năm 2026 và có thể sẽ tiếp tục mở rộng AI Controls trên di động. Đánh giá thực tế từ người dùng Shake to Summarize giải quyết đúng một vấn đề thực sự: đọc lướt trên điện thoại rất khó chịu, nhưng đọc toàn bộ thì tốn thời gian. Thay vì mở thêm một ứng dụng AI khác, Mozilla nhúng khả năng tóm tắt thẳng vào luồng duyệt web cử chỉ lắc điện thoại tuy trông có vẻ "vui", nhưng thực ra là lối tắt nhanh nhất có thể nghĩ ra trên mobile. Hạn chế lớn nhất hiện tại là giới hạn tiếng Anh, điều này làm giảm đáng kể giá trị với người dùng Việt Nam. Nhưng nếu Mozilla tiếp tục lộ trình mở rộng ngôn ngữ như đã làm với tính năng dịch thuật, đây sẽ là một trong những lý do thuyết phục nhất để quay lại dùng Firefox trên điện thoại.

Nam
19 thg 5, 2026
HTML sẽ thay thế Markdown khi làm việc với AI ?

Markdown đã là chuẩn mặc định khi làm việc với AI suốt nhiều năm nhưng một kỹ sư đến từ Claude Code tại Anthropic vừa đặt ra câu hỏi đáng suy nghĩ: liệu thói quen đó có thực sự là lựa chọn tốt nhất? Bài viết ngắn của Thariq Shihipar thu hơn 15.000 lượt thích trên X chỉ trong vài ngày, và lý do thuyết phục hơn bạn nghĩ. Markdown ra đời từ thời AI còn nghèo token Nhìn lại thời GPT-4 với cửa sổ ngữ cảnh chỉ 8.192 token, Markdown là lựa chọn hoàn toàn hợp lý trong khi đó HTML cồng kềnh hơn, tốn tài nguyên hơn và trong bối cảnh hạn chế đó, sự tối giản của Markdown là một ưu điểm thực sự chỉ để tiết kiệm. Vì vậy Markdown trở thành chuẩn ngầm định, và thói quen đó theo chúng ta đến tận bây giờ.Ngay cả khi Anthropic tạo ra khái niệm Skill trên Claude họ cũng đã lấy Markdown làm tiêu chuẩn với file SKILL.md, những ai hay làm việc với skill chắc chắn hiểu rõ điều mặc định này. Tuy nhiên, các mô hình AI hiện tại đã vận hành ở quy mô hoàn toàn khác. Nhiều mô hình đang hỗ trợ cửa sổ ngữ cảnh từ 200.000 đến 1 triệu token, và chi phí xử lý không còn là rào cản đáng lo (theo lời của Thariq Shihipar) và anh ấy lập luận rằng đây chính là thời điểm để xem lại mặc định đó. HTML làm được gì mà Markdown không thể? Lý do cốt lõi Thariq đưa ra khá đơn giản: một số loại thông tin vốn có tính không gian nhưng Markdown buộc chúng phải trở thành văn bản tuyến tính. Khi bạn so sánh ba hướng tiếp cận kỹ thuật thì bạn cần nhìn chúng cạnh nhau, không phải đọc lần lượt rồi cố giữ trong đầu. Khi bạn xem lại một đoạn code bạn cần thấy cấu trúc thay đổi tất nhiên không phải một bức tường chữ. HTML giải quyết đúng vấn đề đó vì vậy Thariq đã liệt kê 9 nhóm tình huống cụ thể mà HTML vượt trội hơn Markdown: Khám phá và lên kế hoạch: So sánh nhiều hướng tiếp cận cạnh nhau thay vì đọc tuần tự, rồi chuyển thành kế hoạch triển khai có sơ đồ luồng và mốc thời gian. Xem lại mã nguồn và hiểu cấu trúc dự án: Phần thay đổi được chú thích trực tiếp bằng màu sắc theo mức độ nghiêm trọng, sơ đồ mô-đun dạng hộp và mũi tên — thay vì văn bản thuần túy. Thiết kế giao diện: Bảng màu hiển thị thực tế có thể sao chép ngay, các biến thể thành phần giao diện được dựng trực tiếp thay vì mô tả bằng chữ. Tạo nguyên mẫu nhanh: Bảng điều chỉnh hiệu ứng chuyển động có thanh kéo thông số, màn hình có thể nhấp thực sự, đây là thứ Markdown không thể biểu đạt. Sơ đồ và hình minh họa: Đồ họa véc-tơ nội tuyến cho phép vẽ lưu đồ thực sự, không phải ký tự ASCII ghép lại. Bộ trình chiếu: Vài thẻ <section> và 20 dòng mã JavaScript là một bộ slide điều hướng bằng phím mũi tên mà không cần phần mềm chuyên dụng hay bước xuất file. Nghiên cứu và học tập: Tài liệu có phần thu gọn, tab mã, bảng chú giải thuật ngữ — thay vì đổ toàn bộ nội dung theo một chiều dọc. Báo cáo định kỳ: Bản tóm tắt trạng thái hàng tuần với biểu đồ nhỏ và màu sắc phân biệt tiến độ khiến người đọc thực sự đọc, không chỉ lướt qua. Giao diện chỉnh sửa tùy chỉnh: Bảng phân loại nhiệm vụ kéo thả, trình chỉnh cờ tính năng có cảnh báo phụ thuộc đây là công cụ thực sự, không phải văn bản đọc rồi thôi. Thariq đã tập hợp 20 file minh họa tất cả các nhóm này tại thariqs.github.io/html-effectiveness mỗi file mở thẳng trên trình duyệt, không cần cài đặt gì thêm. Dùng HTML với AI như thế nào trong thực tế? Cách áp dụng không phức tạp mà chỉ cần thay đổi cách bạn viết prompt. Thay vì để mô hình tự chọn định dạng đầu ra, hãy chỉ định rõ HTML khi nội dung cần được xem xét, tương tác, hoặc chia sẻ với người khác. Ví dụ câu lệnh Thariq gợi ý để xem lại một đoạn mã: Giúp tôi xem xét PR này bằng cách tạo một tài liệu HTML mô tả nó. Tôi không quen lắm với logic streaming/backpressure nên hãy tập trung vào phần đó. Hiển thị diff thực tế với các chú thích lề nội tuyến, mã màu các phát hiện theo mức độ nghiêm trọng và bất cứ thứ gì khác cần thiết để diễn đạt khái niệm một cách rõ ràng. Tương tự, bạn có thể yêu cầu AI tạo kế hoạch triển khai dưới dạng HTML với mốc thời gian và sơ đồ luồng dữ liệu, hoặc bản báo cáo trạng thái hàng tuần với biểu đồ nhỏ và màu sắc phân biệt tiến độ. Simon Willison tác giả blog kỹ thuật nổi tiếng cũng đã thừa nhận bài viết này khiến ông nhìn lại thói quen dùng Markdown từ thời GPT-4 cho đến tận thời điểm hiện tại. Khi các mô hình AI hiện đại có thể nhúng đồ họa véc-tơ, tiện ích tương tác và điều hướng nội trang, Markdown không còn là lựa chọn mặc định hiển nhiên nữa. Markdown vẫn còn chỗ đứng tất nhiên không phải ở mọi nơi Thariq không nói luôn luôn sử dụng HTML mà anh ấy phân biệt khá rõ: Markdown phù hợp cho trò chuyện thông thường, đoạn mã ngắn, câu trả lời vài dòng, và bất cứ thứ gì thuần văn bản trong khi đó HTML phát huy sức mạnh khi đầu ra cần bố cục không gian, màu sắc, khả năng tương tác, hoặc cấu trúc phức tạp đó là khi nội dung đủ nhiều chiều để Markdown bắt đầu làm phẳng thông tin thay vì truyền tải nó. Cộng đồng đã phản ứng khá nhanh: một skil mang tên html-artifacts đã xuất hiện trên GitHub, giúp AI tự nhận biết khi nào nên tạo file HTML thay vì Markdown bao gồm 9 nhóm tình huống từ bài viết gốc của Thariq hoàn toàn có thể sử dụng với bất cứ model nào hỗ trợ đọc skill. Đặc biệt skill này phần loại trừ rõ ràng cho câu trả lời ngắn và đầu ra chỉ có mã code. Mọi người có thể tham khảo tại github.com/dogum/html-artifacts. Trong bài Thariq không nhắc đến JSON nhưng đây cũng là định dạng hay sử dụng với AI đặc biệt đối với những ai hay dùng n8n, Make hay Zapier. Mặc dù vậy mỗi định dạng mang đến một màu sắc riêng trong những tình huống riêng. Markdown, HTML và JSON phân chia sử dụng như thế nào Cuộc tranh luận thực ra không chỉ là Markdown hay HTML. JSON cũng là định dạng phổ biến khi làm việc với AI, đặc biệt trong các luồng xử lý dữ liệu và tích hợp hệ thống. Ba định dạng này phục vụ ba mục đích khác nhau, và hiểu rõ ranh giới đó giúp bạn chọn đúng công cụ cho từng tình huống. Markdown tốt nhất cho văn bản đọc trực tiếp trong chat: ghi chú, giải thích ngắn, đoạn mã, tài liệu đơn giản. Nhanh, nhẹ, không cần mở thêm gì. HTML tốt nhất khi đầu ra cần được nhìn, tương tác hoặc chia sẻ: báo cáo có bố cục, sơ đồ, bảng so sánh, bộ trình chiếu, giao diện tùy chỉnh. Mở bằng trình duyệt là xong. JSON tốt nhất khi đầu ra cần được máy đọc tiếp: lưu trữ dữ liệu có cấu trúc, truyền giữa các hệ thống, hoặc làm đầu vào cho bước xử lý tiếp theo. Con người đọc được nhưng không phải để đọc. Nói cách khác, JSON không cạnh tranh với HTML hay Markdown về mặt trình bày mà nó phục vụ một mục đích hoàn toàn khác. Vấn đề thực sự nằm ở chỗ nhiều người dùng AI mặc định nhận đầu ra dưới dạng Markdown ngay cả khi họ cần HTML để xem, hoặc cần JSON để xử lý tiếp. Chỉ cần chỉ định rõ trong câu lệnh, AI sẽ điều chỉnh theo. Quy tắc chọn nhanh: Đầu ra để đọc trong chat → Markdown. Đầu ra để xem trên trình duyệt → HTML. Đầu ra để máy xử lý tiếp → JSON. Điều này có làm thay đổi gì với người dùng AI thông thường? Nếu bạn dùng AI chủ yếu để hỏi đáp hoặc viết lách, thay đổi này ít tác động hơn. Nhưng nếu bạn đang dùng AI để làm nhiều việc hơn như phân tích dữ liệu, lên kế hoạch dự án, xem lại tài liệu, tổng hợp nghiên cứu, hay tạo báo cáo cho đồng nghiệp đây là điều chỉnh nhỏ trong cách prompt nhưng tạo ra khoảng cách rõ rệt về chất lượng đầu ra, dù bạn đang dùng công cụ AI nào. Bạn nên thử một lần: lần tới khi cần AI so sánh các lựa chọn hoặc tóm tắt một tài liệu phức tạp, thêm vào cuối câu lệnh "tạo dưới dạng file HTML ". Mở file đó trên trình duyệt và so sánh với cách bạn vẫn làm với Markdown hay JSON thì kết quả thường nói lên tất cả.

Nam
10 thg 5, 2026
Thảm họa 9 giây của PocketOS khi AI agent xóa sạch database công ty rồi xin lỗi

9 giây đó chính xác là thời gian trên Cursor mà AI agent lập trình chạy trên Claude Opus 4.6 cần để xóa sạch toàn bộ cơ sở dữ liệu production và toàn bộ bản sao lưu của PocketOS trên Railway. Sau đó agent viết thư thú nhận: "Tôi đã vi phạm mọi nguyên tắc được giao cho mình." Nhưng lời xin lỗi không phục hồi được ba tháng dữ liệu đặt xe của hàng trăm khách hàng. Chuyện gì xảy ra với PocketOS? PocketOS là nền tảng phần mềm quản lý vận hành cho các công ty cho thuê xe, được thành lập bởi Jer Crane. Khi Crane đang dùng Cursor chạy Claude Opus 4.6 để xử lý một tác vụ bình thường trong môi trường staging - tức là môi trường thử nghiệm riêng biệt, không phải hệ thống đang chạy thực tế (production). Agent gặp lỗi xác thực và thay vì dừng lại để báo cáo, nó tự quyết định sửa vấn đề bằng cách xóa một volume trên Railway (nhà cung cấp hạ tầng đám mây của PocketOS). Để thực hiện lệnh xóa, agent tìm kiếm trong các file không liên quan đến tác vụ đang làm và tìm thấy một API token được tạo ra chỉ để thêm và xóa tên miền tùy chỉnh qua Railway CLI. Token đó, trên thực tế, có toàn quyền kiểm soát toàn bộ hạ tầng đám mây thông qua Railway GraphQL API. Lệnh xóa không có bước xác nhận nào. Không có "gõ DELETE để xác nhận." Không có "volume này chứa dữ liệu production, bạn có chắc không?" Chín giây sau toàn bộ cơ sở dữ liệu production biến mất và Railway lại lưu bản sao lưu trong cùng volume với dữ liệu gốc nên nghĩa là xóa volume là cũng xóa luôn cả bản sao lưu do đó PocketOS mất cả hai thứ cùng một lúc. Agent xin lỗi, nhưng lời xin lỗi không phục hồi dữ liệu Phần gây chú ý nhất trong toàn bộ câu chuyện là những gì agent viết sau đó. Khi Crane hỏi Cursor chuyện gì xảy ra, agent tự phân tích và thú nhận: "Tôi đã vi phạm mọi nguyên tắc được giao cho mình. Tôi đoán thay vì xác minh. Tôi thực thi lệnh phá hủy mà không được yêu cầu. Tôi truy cập token từ file hoàn toàn không liên quan đến tác vụ của mình." Lời thú nhận đầy đủ, logic rõ ràng, không né tránh trách nhiệm. Nhưng lời thú nhận hoàn hảo đó không phục hồi được một bản ghi dữ liệu nào. PocketOS trải qua hơn 30 giờ ngừng hoạt động cuối tuần đó và đội ngũ phải bỏ cả cuối tuần dựng lại cơ sở dữ liệu thủ công từ lịch sử thanh toán Stripe và nhật ký email để giữ cho khách hàng tiếp tục vận hành được. Đây chính là điều khiến vụ việc này khó chịu hơn bất kỳ lỗi phần mềm thông thường nào: agent đủ thông minh để nhận ra mình đã làm sai, giải thích chi tiết tại sao sai, nhưng không đủ khôn ngoan để hỏi một câu trước khi thực hiện hành động phá hủy không thể đảo ngược. Ai chịu trách nhiệm ở đây Cursor, Claude hay Railway? Crane rất rõ ràng trong bài viết của mình: ông nhấn mạnh rằng đội ngũ đang dùng phiên bản Cursor tốt nhất có thể, chạy trên model tốt nhất ngành bán ra, được cấu hình với các quy tắc an toàn rõ ràng. Điều này đóng lại ngay lập tức lập luận phổ biến nhất của các nhà cung cấp AI khi sự cố xảy ra: "bạn nên dùng model tốt hơn." Tuy nhiên Crane đặt phần lớn trách nhiệm vào Railway hơn là vào Cursor hay Claude. API của Railway cho phép thực hiện hành động phá hủy mà không cần xác nhận, lưu bản sao lưu trong cùng volume với dữ liệu gốc và xóa volume là xóa tất cả bản sao lưu. Thêm vào đó, các token API không có Kiểm soát truy cập dựa trên vai trò (RBAC) tức là một token được tạo cho việc quản lý tên miền đơn giản lại có quyền xóa toàn bộ hạ tầng production. Nhưng cộng đồng cũng chỉ ra phần trách nhiệm của Crane: các AI agent không được trao quyền truy cập token đó, nhưng nó tìm thấy token trong một file không được bảo vệ đúng cách. Crane phản bác: "Tôi không trao quyền truy cập, nó tự tìm thấy." Điều đó đúng về mặt kỹ thuật nhưng không thay đổi được kết quả. Vòng lặp xin lỗi quen thuộc Nếu bạn đã làm việc với AI đủ lâu, bạn sẽ nhận ra một cách trả lời cực kì quen thuộc trong câu chuyện này, chỉ là ở quy mô lớn hơn nhiều. Phiên bản nhẹ nhàng hơn nghe như thế này: "Tôi thật sự xin lỗi đã làm bạn thất vọng vì đã xóa dữ liệu của bạn. Tôi sẽ phục hồi ngay nhưng xin lỗi tôi chỉ phục hồi được một nửa thôi, phần còn lại bạn tự làm nhé." Phiên bản thẳng thắn hơn trong môi trường thực tế nghe như thế này: agent tự tin thực hiện, tự tin xóa, tự tin thú nhận, rồi để lại cho bạn cái hậu quả. Sự tự tin không đi kèm thận trọng là thứ nguy hiểm nhất trong bất kỳ hệ thống tự động nào, dù là AI hay con người. Điều đáng nói là đây không phải lần đầu và sẽ không phải lần cuối. Khi agent ngày càng được trao nhiều quyền hơn để làm việc hiệu quả hơn, khoảng cách giữa "tiện lợi" và "thảm họa" có khi lại rất gần. Bốn bài học thực tế cho bất kỳ ai đang dùng AI agent Không bao giờ để token có quyền xóa, sửa, cập nhật trong file mà agent có thể truy cập Token API nên được phân quyền tối thiểu và lưu trong môi trường biến (environment variables) với quyền truy cập hạn chế, không nằm trong file trong thư mục dự án mà AI agent đang làm việc. Token quản lý tên miền không bao giờ nên có quyền xóa cơ sở dữ liệu. Đây là nguyên tắc tối thiểu phải có và vụ PocketOS cho thấy hậu quả khi nguyên tắc này bị bỏ qua dù vô tình. Bản sao lưu phải ở chỗ riêng biệt hoàn toàn Lưu bản sao lưu cùng chỗ với dữ liệu gốc là cực kì rủi ro. Bản sao lưu phải ở một hệ thống lưu trữ độc lập, tốt nhất là ở nhà cung cấp khác hoặc ít nhất là được bảo vệ bởi chính sách xóa riêng biệt mà AI agent không thể tự truy cập. Mọi hành động thay đổi dữ liệu quan trọng phải có bước xác nhận thủ công Bất kỳ lệnh nào liên quan đến xóa, ghi đè hoặc thay đổi không thể đảo ngược phải yêu cầu con người xác nhận, tuyệt đối không được để AI agent tự quyết định. Đây là nguyên tắc tương tự mà các hệ thống tài chính áp dụng từ hàng chục năm nay và không có lý do gì để bỏ qua khi dùng AI agent. Thiết lập môi trường thử nghiệm thực sự tách biệt Môi trường thử nghiệm (staging) phải hoàn toàn tách rời khỏi hệ thống đang hoạt động (production) về mặt credentials, token và quyền truy cập không chỉ mỗi mặt dữ liệu. Nếu agent đang làm việc trong staging có thể tìm thấy và sử dụng token của production, thì thử nghiệm và production đang không thực sự tách biệt. Câu hỏi thực sự mà vụ PocketOS đặt ra Câu hỏi không phải là "AI có nên được trao quyền làm việc tự động không?" mà là "Chúng ta đang xây dựng các quy tắc an toàn như thế nào khi trao quyền đó?" Crane chỉ ra rằng Railway đang tích cực khuyến khích khách hàng dùng AI coding agent trên nền tảng của họ trong khi kiến trúc bảo mật của họ chưa sẵn sàng cho điều đó, mặc dù họ đã sửa lỗi cập nhật API ngay sau đó. Đây là khoảng cách nguy hiểm nhất hiện tại: công cụ phát triển nhanh hơn nhiều so với các lớp bảo vệ xung quanh chúng. PocketOS cuối cùng đã phục hồi được phần lớn dữ liệu sau khi Railway can thiệp, nhưng quá trình đó mất hàng giờ giúp khách hàng dựng lại lịch đặt xe từ lịch sử thanh toán Stripe và tích hợp lịch. Điều đó không nên xảy ra với bất kỳ hệ thống đang hoạt động nào, dù agent thông minh đến đâu. Agent có thể xin lỗi rất hay nhưng khi thiết lập quy tắc an toàn tốt thì không cần đến lời xin lỗi.

An
6 thg 5, 2026