Paperclip cho phép bạn tạo ra công ty AI không cần nhân viên

Published on 12 March, 2026

Quick Summary

Paperclip AI là một nền tảng Node.js và React UI đột phá giúp tổ chức và điều phối các AI agent thành một mô hình công ty thu nhỏ để đạt các mục tiêu kinh doanh lớn. Chỉ sau vài tuần ra mắt, dự án đã bùng nổ trên GitHub với hàng chục nghìn stars và hàng trăm pull requests từ cộng đồng, nhờ khả năng giải quyết các vấn đề cấp bách về quản lý, kiểm soát chi phí và phối hợp khi vận hành nhiều agent AI. Bài viết đi sâu vào cách Paperclip mô hình hóa doanh nghiệp, so sánh với CrewAI, và đưa ra lời khuyên về việc triển khai hiệu quả.

Paperclip AI là gì tại sao nó lại thu hút đến vậy

Chỉ trong tuần đầu ra mắt, Paperclip AI đã gây chấn động cộng đồng developer với 14.2k GitHub stars và 1.6k forks. Đến thời điểm hiện tại, những con số này đã vọt lên 19.7k stars, 2.5k forks và hơn 230 pull requests đang mở, phần lớn đến từ các nhà phát triển bên ngoài team gốc. Đây không phải là kết quả của một dự án thử nghiệm nhỏ, mà là minh chứng rõ ràng cho việc Paperclip đang giải quyết một "nỗi đau" rất cụ thể trong thế giới AI agent.

Nỗi đau đó là gì? Hãy tưởng tượng bạn đang mở 20 cửa sổ Claude Code cùng lúc, nhưng không thể quản lý được chúng, không biết cái nào đang xử lý gì, và không có cách nào lưu lại ngữ cảnh dài hạn. Một vòng lặp tác nhân chạy "quá tay" có thể khiến bạn mất hàng trăm đô la trước khi kịp nhận ra. Người tạo ra Paperclip, @dotta, đã tóm gọn vấn đề này: "Bạn chỉ có thể quản lý một mớ tập lệnh lộn xộn đến một mức độ nào đó trước khi nhận ra phải có cách làm việc tốt hơn."

Paperclip là gì và tại sao lại thu hút đến vậy?

Paperclip là một sự kết hợp mạnh mẽ giữa Node.js server và React UI, được thiết kế để điều phối một đội ngũ AI agents vận hành một doanh nghiệp thu nhỏ. Thay vì chỉ là một công cụ quản lý tác vụ thông thường, Paperclip giúp bạn tổ chức các agent thành một "công ty" có cấu trúc rõ ràng. Ví dụ, bạn có thể đặt mục tiêu lớn như "Xây ứng dụng ghi chú AI và đạt 1 triệu đô doanh thu hàng tháng". Paperclip sẽ giúp bạn "thuê" các agent chuyên biệt:

CEO agent: Lên chiến lược tổng thể.
CTO agent: Quyết định kiến trúc kỹ thuật.
Engineer agent: Viết code và triển khai.
Marketer agent: Chạy chiến dịch nội dung.

Mỗi agent có vai trò, có "sếp", có ngân sách hàng tháng và mục tiêu cụ thể gắn liền với tầm nhìn chung. Paperclip cung cấp một dashboard toàn diện để bạn theo dõi toàn bộ bức tranh, duyệt chiến lược, điều chỉnh ngân sách và can thiệp khi cần, mà không phải mở từng tab agent một.

Điểm khác biệt cốt lõi là Paperclip không thay thế khả năng suy luận của AI, mà giúp bạn tổ chức và vận hành các suy luận đó theo một quy trình có kiểm soát. Nếu bạn muốn hiểu rõ hơn về cách các model AI hiện đại suy luận trước khi đưa vào Paperclip, bạn có thể tham khảo tài liệu hướng dẫn OpenAI về suy luận của GPT 5.4.

Paperclip còn nổi bật ở khả năng tương thích cao: nó không "kén chọn" agent runtime. Claude Code, OpenClaw, Python script, shell command, HTTP webhook – tất cả đều có thể chạy được. Miễn là nó có thể nhận tín hiệu nhịp hoạt động định kỳ, nó đều được "tuyển dụng". Paperclip mô hình hóa toàn bộ công ty làm đơn vị điều phối, với sơ đồ tổ chức, báo cáo, ngân sách và mục tiêu phân tầng từ cấp công ty xuống từng tác vụ cụ thể. Đây không phải là một công cụ xây dựng workflow, mà là một công ty thu nhỏ thực sự, vận hành bằng AI.

Cơn sốt thực tế từ cộng đồng developer

Tốc độ tăng trưởng sao trên GitHub chỉ là một phần câu chuyện. Điều đáng chú ý hơn là chất lượng và số lượng đóng góp từ cộng đồng. Hơn 230 pull requests đang mở không đến từ team gốc mà từ các nhà phát triển bên ngoài, cho thấy Paperclip là một công cụ mà người ta thực sự sử dụng và mong muốn cải thiện.

Phiên bản v0.3.0 vừa ra mắt vào ngày 9/3/2026 càng củng cố thêm tốc độ phát triển chóng mặt này. Bản cập nhật bổ sung các adapter cho Cursor, OpenCode và Pi, thêm hỗ trợ PWA, CLI sao lưu cơ sở dữ liệu và hàng loạt cải tiến cho giao diện di động.

Điều thú vị là cộng đồng đang đóng góp vào đúng những chỗ cần thiết nhất cho một dự án mới: theo dõi chi phí khi agent chạy "quá tay", duy trì phiên làm việc khi khởi động lại, và phối hợp khi nhiều agent cùng nhận một tác vụ. Những vấn đề này xuất hiện nhiều trong tracker cho thấy người dùng đang thực sự triển khai Paperclip trong môi trường thực tế, không chỉ là thử nghiệm cục bộ.

Paperclip giải quyết được gì trong thực tế?

Nhìn vào danh sách đóng góp và báo lỗi, cộng đồng đang tập trung vào những vấn đề rất cụ thể mà người dùng thực tế đang gặp phải khi triển khai AI agent. Hai tính năng được nhắc đến nhiều nhất là kiểm soát ngân sách và nhật ký hoạt động.

Kiểm soát ngân sách: Mỗi tác nhân có hạn mức chi tiêu hàng tháng riêng. Khi đạt 80% ngân sách, hệ thống sẽ cảnh báo; đến 100%, tác nhân tự động tạm dừng và không nhận nhiệm vụ mới. Điều này giúp loại bỏ hoàn toàn tình trạng "hóa đơn bất ngờ" hay các vòng lặp chạy "quá tay" mà bạn không hề hay biết.
Nhật ký hoạt động: Mọi chỉ thị, phản hồi, hành động và quyết định của agent đều được ghi lại theo dạng "chỉ thêm vào", không thể chỉnh sửa hay xóa. Đây là một điểm cộng lớn cho những ai cần giải thích được hệ thống AI đang làm gì, tăng cường tính minh bạch và khả năng kiểm toán.

Paperclip và CrewAI tạo ra hai trường phái quản lý AI Agent

Việc so sánh Paperclip với CrewAI công cụ điều phối AI Agent phổ biến hiện tại sẽ làm rõ hơn giá trị độc đáo của nó. CrewAI được thiết kế để hoàn thành một nhiệm vụ cụ thể, với tác nhân quản lý giám sát các tác nhân thực thi, hỗ trợ tự sửa lỗi và lưu trữ ngữ cảnh. Nó mạnh ở khả năng cài đặt nhanh và phù hợp với các workflow có đầu có đuôi rõ ràng. Tuy nhiên, CrewAI có giới hạn ở việc ít kiểm soát được từng bước thực thi và buộc người dùng phải tuân theo cách làm việc của nó.

Paperclip tiếp cận theo hướng khác hoàn toàn. Thay vì định nghĩa một workflow, bạn định nghĩa một tổ chức, với sơ đồ nhân sự, ngân sách, mục tiêu phân tầng và quy trình phê duyệt. Các tác nhân không chạy theo workflow mà hoạt động liên tục theo lịch, giống như những nhân viên thực sự hơn là một đoạn mã tự động. Nếu CrewAI là công cụ để hoàn thành một dự án, Paperclip là hệ thống để vận hành cả một công ty.

Ai nên dùng và ai không nên?

Chính Paperclip đã nói thẳng trong README của họ: "Nếu bạn chỉ có một agent, bạn không cần Paperclip. Nhưng nếu bạn có 20 agent, bạn chắc chắn cần đến nó."

Những người đã thực sự triển khai AI Agent trong vận hành thực tế khuyến nghị nên bắt đầu từ một tình huống cụ thể, có khối lượng công việc cao và lỗi có thể khắc phục được, rồi mở rộng dần sau khi có dữ liệu thực tế. Đây là lời khuyên thực tế hơn nhiều so với việc "lao" vào xây dựng một "công ty AI" đầy đủ ngay từ đầu.

Tuy nhiên, cần lưu ý rằng Paperclip hiện vẫn đang ở giai đoạn đầu phát triển. Lộ trình còn nhiều thứ chưa hoàn thiện, từ hỗ trợ tác nhân trên đám mây đến hệ thống mở rộng bằng plugin. Nếu bạn cần triển khai cho doanh nghiệp lớn với yêu cầu ổn định cao, có thể cần chờ thêm vài tháng để sản phẩm "chín" hơn.

Có nên thử Paperclip hay chưa?

Câu hỏi mà Paperclip đang đặt ra không phải là "bỏ qua nhà cung cấp SaaS", mà là "liệu bạn có thể tự xây công ty AI của mình không?". Với license MIT, self-hosted, và chỉ cần một lệnh npx paperclipai onboard --yes để bắt đầu, bạn có thể chạy thử toàn bộ trên máy của mình với localhost:3100.

Video cách cài đặt Paperclip AI lên VPS

Nếu bạn đang sử dụng nhiều hơn 3 AI agent cùng lúc và cảm thấy mất kiểm soát, đây chính là thời điểm thích hợp để thử Paperclip. Nếu bạn mới bắt đầu với AI agent, hãy chạy ổn một agent đơn trước, rồi quay lại đây sau.

Discussion (0)

No comments yet. Be the first!

Google I/O 2026: Antigravity 2.0 Major Improvements, but Interface Resembles Codex

At the Google I/O 2026 event, the search giant stunned the entire developer community by officially announcing Antigravity 2.0. No longer a conventional AI-integrated IDE, Antigravity has now transformed into a standalone desktop application powered by Gemini 3.5 Flash, accompanied by an AI Ultra subscription package priced at $100/month. However, the complete removal of the integrated source code editor in favor of a minimalist Codex-like interface is generating intense controversy. How Antigravity 2.0 Has Transformed The decision to completely separate the source code editor from Antigravity 2.0 marks a bold move by Google in reshaping the future of software development. Instead of attempting to integrate AI features into a traditional IDE, this new version functions as a dedicated AI agent orchestration hub. This means users will focus entirely on setting up tasks and monitoring workflows rather than directly editing individual lines of code. This change is most clearly demonstrated by the launch of the AI Ultra service package, priced at $100 per month. This premium subscription offers 5 times the usage limit compared to the current AI Pro package, targeting businesses and professional developers who need to operate a large number of autonomous agents simultaneously to solve complex problems. Power from Gemini 3.5 Flash and Asynchronous Execution Workflow At the heart of Antigravity 2.0 is the Gemini 3.5 Flash large language model, specially optimized for high-speed agentic tasks. Thanks to its superior processing capabilities, the new system supports highly complex multi-agent workflows, allowing multiple subagents to collaborate on a large project. More specifically, these subagents will run entirely asynchronously in the background. This mechanism ensures that the application's main interface never freezes or is interrupted during processing, helping developers maintain a smooth workflow. This is a significant improvement over its predecessor, which often experienced delays when processing large codebases. New Tool Duo: Antigravity CLI and SDK Antigravity CLI, written in Go, completely replaces the old Gemini CLI, delivering high performance and extremely fast response times in the terminal. Gemini CLI and Gemini Code Assist IDE extensions will cease service from June 18, 2026. Google AI Pro and Ultra users need to switch to Antigravity CLI before this deadline. Antigravity SDK, written in Python, allows developers to build, customize configurations, and deeply integrate autonomous agents into their projects. Minimalist Codex-like Interface and Community Controversy Despite boasting numerous powerful technological upgrades, Antigravity 2.0 is facing a wave of criticism from the user community due to radical interface changes. The new interface is now merely a minimalist console focused on a chat window for issuing commands to agents, completely eliminating the familiar IDE workspace. Many opinions suggest that this design looks exactly like a replica of the Codex or Claude Desktop application. This excessive minimalism has left many developers feeling disappointed and empty, as they no longer have the ability to quickly view and modify files directly as before. Having to switch back and forth between Antigravity and an external editor significantly reduces their actual work efficiency. How to Restore the Traditional IDE Experience for Users To appease the negative reactions from the community, Google has offered some temporary solutions for those not yet ready to adapt to the new interface. Users can visit the official Antigravity homepage to download a separate IDE version. This version will help restore the familiar integrated workspace with traditional source code editing features. However, Google also issued a warning that this is only a temporary solution. In future updates, the agent management interface will be completely removed from the IDE as the company focuses all development resources on the standalone 2.0 application. Therefore, familiarizing oneself with the new working model is inevitable for developers in the long term. The Rapid Evolution of Tools like Antigravity and Codex The separation between traditional code editors and agent control interfaces is clear evidence that AI is shifting from a supportive tool to an autonomous partner. Developers need to proactively familiarize themselves with new control tools like CLI and SDK to gradually transition their role from direct code writers to managers and orchestrators of intelligent agent ecosystems.

Nam•

20 May, 2026

Tính năng lắc điện thoại để tóm tắt của Firefox đã có mặt trên Android

Bạn có bao giờ mở một bài viết dài 3.000 chữ trên web trong điện thoại rồi không biết nên đọc hay thoát ra không? Mozilla có câu trả lời: lắc điện thoại. Tính năng "Shake to Summarize" từng được TIME vinh danh là một trong những phát minh tốt nhất năm 2025 vừa chính thức ra mắt trên Android cùng với Firefox 150. Shake to Summarize là gì và nó hoạt động ra sao? Shake to Summarize là tính năng AI tích hợp sẵn trong trình duyệt Firefox, cho phép người dùng nhận ngay bản tóm tắt nội dung của bất kỳ trang web nào mà không cần rời khỏi trình duyệt hay mở thêm ứng dụng nào khác. Để kích hoạt, người dùng có ba cách: Lắc điện thoại trong khi đang xem trang web Nhấn biểu tượng sấm sét trên thanh địa chỉ Vào menu ba chấm → Summarize Page Sau vài giây, Firefox mở một bảng nhỏ và hiển thị các ý chính của trang. Điểm đáng chú ý là bản tóm tắt thích nghi theo loại nội dung — công thức nấu ăn thì rút ra các bước cần làm, bài thể thao thì tập trung vào tỷ số và thống kê, bài tin tức thì làm nổi bật những diễn biến then chốt. Tính năng hoạt động với các trang dưới 5.000 từ. Với các trang dài hơn, Firefox sẽ không thể tạo tóm tắt. Hành trình từ iOS đến Android Shake to Summarize ra mắt lần đầu trên iOS vào tháng 9 năm 2025, ban đầu chỉ dành cho người dùng tại Mỹ với giao diện tiếng Anh. Phản hồi tích cực đến mức Mozilla nhận được đề cử đặc biệt từ TIME Best Inventions 2025 một giải thưởng hiếm khi dành cho tính năng của trình duyệt. Phiên bản Android đi qua giai đoạn thử nghiệm kỹ lưỡng trên Firefox Nightly trước khi được đưa vào bản chính thức Firefox 150, phát hành tháng 4 năm 2026. Trước đó, muốn dùng thử trên Android, người dùng phải mở Settings → About Firefox Nightly → nhấn logo ba lần để vào "Secret Settings" rồi bật thủ công — một quy trình rõ ràng là chỉ dành cho người dùng kỹ thuật. AI nào đứng sau tính năng này? Mozilla không dùng một mô hình duy nhất mà phân chia theo thiết bị: Với iPhone 15 Pro trở lên chạy iOS 26+, tóm tắt được tạo hoàn toàn trên máy nhờ Apple Intelligence dữ liệu không rời khỏi thiết bị. Với các thiết bị còn lại, nội dung trang được gửi đến máy chủ AI của Mozilla, xử lý xong rồi trả kết quả về. Về phía Mozilla, đội ngũ kỹ thuật đã thử nghiệm nhiều mô hình gồm Mistral Nemo, Mistral Small, Jamba 1.5 Mini, Gemini Flash 2.0 và Llama 4 Maverick trước khi chọn Mistral Small làm mô hình chính. Lý do: Mistral Small có trọng số mở (open weights), tốc độ xử lý nhanh và chi phí inference thấp hơn đáng kể so với các đối thủ — trong khi chất lượng tóm tắt vẫn ở mức cao. Mozilla cung cấp Shake to Summarize miễn phí và tự chịu toàn bộ chi phí inference, không tính phí người dùng. Người dùng không muốn AI thì sao? Đây là điểm Mozilla xử lý khá khéo. Sau khi bị phản ứng từ cộng đồng người dùng lâu năm những người lo ngại Firefox đang rời bỏ giá trị cốt lõi về quyền riêng tư Mozilla đã thêm nút tắt toàn bộ tính năng AI trong cài đặt trình duyệt. Trên desktop, tùy chọn "Block AI enhancements" cho phép tắt tất cả tính năng AI hiện tại lẫn tương lai, hoặc chọn lọc từng tính năng muốn giữ. Trên Android, Shake to Summarize được liên kết với bộ điều khiển AI Controls mới cả khi tắt AI, cả cử chỉ lắc và nút tóm tắt đều bị vô hiệu hóa đồng thời. Tính năng hiện chỉ hỗ trợ nội dung tiếng Anh. Người dùng tại Việt Nam muốn dùng cần chuyển ngôn ngữ hệ thống hoặc chờ Mozilla mở rộng hỗ trợ thêm ngôn ngữ. Firefox 150 còn có gì khác? Bên cạnh Shake to Summarize trên Android, Firefox 150 đem theo một số cập nhật đáng chú ý: Mở link trong chế độ split view (xem hai trang song song) Sao chép URL từ nhiều tab cùng lúc Dịch riêng tư theo thời gian thực trên trang chuyên dụng VPN tích hợp miễn phí mở rộng sang Canada (trước đó chỉ có ở một số thị trường) Hệ thống quản lý profile mới dành cho tất cả người dùng Firefox 151 dự kiến ra mắt ngày 19 tháng 5 năm 2026 và có thể sẽ tiếp tục mở rộng AI Controls trên di động. Đánh giá thực tế từ người dùng Shake to Summarize giải quyết đúng một vấn đề thực sự: đọc lướt trên điện thoại rất khó chịu, nhưng đọc toàn bộ thì tốn thời gian. Thay vì mở thêm một ứng dụng AI khác, Mozilla nhúng khả năng tóm tắt thẳng vào luồng duyệt web cử chỉ lắc điện thoại tuy trông có vẻ "vui", nhưng thực ra là lối tắt nhanh nhất có thể nghĩ ra trên mobile. Hạn chế lớn nhất hiện tại là giới hạn tiếng Anh, điều này làm giảm đáng kể giá trị với người dùng Việt Nam. Nhưng nếu Mozilla tiếp tục lộ trình mở rộng ngôn ngữ như đã làm với tính năng dịch thuật, đây sẽ là một trong những lý do thuyết phục nhất để quay lại dùng Firefox trên điện thoại.

Nam•

19 May, 2026

HTML sẽ thay thế Markdown khi làm việc với AI ?

Markdown đã là chuẩn mặc định khi làm việc với AI suốt nhiều năm nhưng một kỹ sư đến từ Claude Code tại Anthropic vừa đặt ra câu hỏi đáng suy nghĩ: liệu thói quen đó có thực sự là lựa chọn tốt nhất? Bài viết ngắn của Thariq Shihipar thu hơn 15.000 lượt thích trên X chỉ trong vài ngày, và lý do thuyết phục hơn bạn nghĩ. Markdown ra đời từ thời AI còn nghèo token Nhìn lại thời GPT-4 với cửa sổ ngữ cảnh chỉ 8.192 token, Markdown là lựa chọn hoàn toàn hợp lý trong khi đó HTML cồng kềnh hơn, tốn tài nguyên hơn và trong bối cảnh hạn chế đó, sự tối giản của Markdown là một ưu điểm thực sự chỉ để tiết kiệm. Vì vậy Markdown trở thành chuẩn ngầm định, và thói quen đó theo chúng ta đến tận bây giờ.Ngay cả khi Anthropic tạo ra khái niệm Skill trên Claude họ cũng đã lấy Markdown làm tiêu chuẩn với file SKILL.md, những ai hay làm việc với skill chắc chắn hiểu rõ điều mặc định này. Tuy nhiên, các mô hình AI hiện tại đã vận hành ở quy mô hoàn toàn khác. Nhiều mô hình đang hỗ trợ cửa sổ ngữ cảnh từ 200.000 đến 1 triệu token, và chi phí xử lý không còn là rào cản đáng lo (theo lời của Thariq Shihipar) và anh ấy lập luận rằng đây chính là thời điểm để xem lại mặc định đó. HTML làm được gì mà Markdown không thể? Lý do cốt lõi Thariq đưa ra khá đơn giản: một số loại thông tin vốn có tính không gian nhưng Markdown buộc chúng phải trở thành văn bản tuyến tính. Khi bạn so sánh ba hướng tiếp cận kỹ thuật thì bạn cần nhìn chúng cạnh nhau, không phải đọc lần lượt rồi cố giữ trong đầu. Khi bạn xem lại một đoạn code bạn cần thấy cấu trúc thay đổi tất nhiên không phải một bức tường chữ. HTML giải quyết đúng vấn đề đó vì vậy Thariq đã liệt kê 9 nhóm tình huống cụ thể mà HTML vượt trội hơn Markdown: Khám phá và lên kế hoạch: So sánh nhiều hướng tiếp cận cạnh nhau thay vì đọc tuần tự, rồi chuyển thành kế hoạch triển khai có sơ đồ luồng và mốc thời gian. Xem lại mã nguồn và hiểu cấu trúc dự án: Phần thay đổi được chú thích trực tiếp bằng màu sắc theo mức độ nghiêm trọng, sơ đồ mô-đun dạng hộp và mũi tên — thay vì văn bản thuần túy. Thiết kế giao diện: Bảng màu hiển thị thực tế có thể sao chép ngay, các biến thể thành phần giao diện được dựng trực tiếp thay vì mô tả bằng chữ. Tạo nguyên mẫu nhanh: Bảng điều chỉnh hiệu ứng chuyển động có thanh kéo thông số, màn hình có thể nhấp thực sự, đây là thứ Markdown không thể biểu đạt. Sơ đồ và hình minh họa: Đồ họa véc-tơ nội tuyến cho phép vẽ lưu đồ thực sự, không phải ký tự ASCII ghép lại. Bộ trình chiếu: Vài thẻ <section> và 20 dòng mã JavaScript là một bộ slide điều hướng bằng phím mũi tên mà không cần phần mềm chuyên dụng hay bước xuất file. Nghiên cứu và học tập: Tài liệu có phần thu gọn, tab mã, bảng chú giải thuật ngữ — thay vì đổ toàn bộ nội dung theo một chiều dọc. Báo cáo định kỳ: Bản tóm tắt trạng thái hàng tuần với biểu đồ nhỏ và màu sắc phân biệt tiến độ khiến người đọc thực sự đọc, không chỉ lướt qua. Giao diện chỉnh sửa tùy chỉnh: Bảng phân loại nhiệm vụ kéo thả, trình chỉnh cờ tính năng có cảnh báo phụ thuộc đây là công cụ thực sự, không phải văn bản đọc rồi thôi. Thariq đã tập hợp 20 file minh họa tất cả các nhóm này tại thariqs.github.io/html-effectiveness mỗi file mở thẳng trên trình duyệt, không cần cài đặt gì thêm. Dùng HTML với AI như thế nào trong thực tế? Cách áp dụng không phức tạp mà chỉ cần thay đổi cách bạn viết prompt. Thay vì để mô hình tự chọn định dạng đầu ra, hãy chỉ định rõ HTML khi nội dung cần được xem xét, tương tác, hoặc chia sẻ với người khác. Ví dụ câu lệnh Thariq gợi ý để xem lại một đoạn mã: Giúp tôi xem xét PR này bằng cách tạo một tài liệu HTML mô tả nó. Tôi không quen lắm với logic streaming/backpressure nên hãy tập trung vào phần đó. Hiển thị diff thực tế với các chú thích lề nội tuyến, mã màu các phát hiện theo mức độ nghiêm trọng và bất cứ thứ gì khác cần thiết để diễn đạt khái niệm một cách rõ ràng. Tương tự, bạn có thể yêu cầu AI tạo kế hoạch triển khai dưới dạng HTML với mốc thời gian và sơ đồ luồng dữ liệu, hoặc bản báo cáo trạng thái hàng tuần với biểu đồ nhỏ và màu sắc phân biệt tiến độ. Simon Willison tác giả blog kỹ thuật nổi tiếng cũng đã thừa nhận bài viết này khiến ông nhìn lại thói quen dùng Markdown từ thời GPT-4 cho đến tận thời điểm hiện tại. Khi các mô hình AI hiện đại có thể nhúng đồ họa véc-tơ, tiện ích tương tác và điều hướng nội trang, Markdown không còn là lựa chọn mặc định hiển nhiên nữa. Markdown vẫn còn chỗ đứng tất nhiên không phải ở mọi nơi Thariq không nói luôn luôn sử dụng HTML mà anh ấy phân biệt khá rõ: Markdown phù hợp cho trò chuyện thông thường, đoạn mã ngắn, câu trả lời vài dòng, và bất cứ thứ gì thuần văn bản trong khi đó HTML phát huy sức mạnh khi đầu ra cần bố cục không gian, màu sắc, khả năng tương tác, hoặc cấu trúc phức tạp đó là khi nội dung đủ nhiều chiều để Markdown bắt đầu làm phẳng thông tin thay vì truyền tải nó. Cộng đồng đã phản ứng khá nhanh: một skil mang tên html-artifacts đã xuất hiện trên GitHub, giúp AI tự nhận biết khi nào nên tạo file HTML thay vì Markdown bao gồm 9 nhóm tình huống từ bài viết gốc của Thariq hoàn toàn có thể sử dụng với bất cứ model nào hỗ trợ đọc skill. Đặc biệt skill này phần loại trừ rõ ràng cho câu trả lời ngắn và đầu ra chỉ có mã code. Mọi người có thể tham khảo tại github.com/dogum/html-artifacts. Trong bài Thariq không nhắc đến JSON nhưng đây cũng là định dạng hay sử dụng với AI đặc biệt đối với những ai hay dùng n8n, Make hay Zapier. Mặc dù vậy mỗi định dạng mang đến một màu sắc riêng trong những tình huống riêng. Markdown, HTML và JSON phân chia sử dụng như thế nào Cuộc tranh luận thực ra không chỉ là Markdown hay HTML. JSON cũng là định dạng phổ biến khi làm việc với AI, đặc biệt trong các luồng xử lý dữ liệu và tích hợp hệ thống. Ba định dạng này phục vụ ba mục đích khác nhau, và hiểu rõ ranh giới đó giúp bạn chọn đúng công cụ cho từng tình huống. Markdown tốt nhất cho văn bản đọc trực tiếp trong chat: ghi chú, giải thích ngắn, đoạn mã, tài liệu đơn giản. Nhanh, nhẹ, không cần mở thêm gì. HTML tốt nhất khi đầu ra cần được nhìn, tương tác hoặc chia sẻ: báo cáo có bố cục, sơ đồ, bảng so sánh, bộ trình chiếu, giao diện tùy chỉnh. Mở bằng trình duyệt là xong. JSON tốt nhất khi đầu ra cần được máy đọc tiếp: lưu trữ dữ liệu có cấu trúc, truyền giữa các hệ thống, hoặc làm đầu vào cho bước xử lý tiếp theo. Con người đọc được nhưng không phải để đọc. Nói cách khác, JSON không cạnh tranh với HTML hay Markdown về mặt trình bày mà nó phục vụ một mục đích hoàn toàn khác. Vấn đề thực sự nằm ở chỗ nhiều người dùng AI mặc định nhận đầu ra dưới dạng Markdown ngay cả khi họ cần HTML để xem, hoặc cần JSON để xử lý tiếp. Chỉ cần chỉ định rõ trong câu lệnh, AI sẽ điều chỉnh theo. Quy tắc chọn nhanh: Đầu ra để đọc trong chat → Markdown. Đầu ra để xem trên trình duyệt → HTML. Đầu ra để máy xử lý tiếp → JSON. Điều này có làm thay đổi gì với người dùng AI thông thường? Nếu bạn dùng AI chủ yếu để hỏi đáp hoặc viết lách, thay đổi này ít tác động hơn. Nhưng nếu bạn đang dùng AI để làm nhiều việc hơn như phân tích dữ liệu, lên kế hoạch dự án, xem lại tài liệu, tổng hợp nghiên cứu, hay tạo báo cáo cho đồng nghiệp đây là điều chỉnh nhỏ trong cách prompt nhưng tạo ra khoảng cách rõ rệt về chất lượng đầu ra, dù bạn đang dùng công cụ AI nào. Bạn nên thử một lần: lần tới khi cần AI so sánh các lựa chọn hoặc tóm tắt một tài liệu phức tạp, thêm vào cuối câu lệnh "tạo dưới dạng file HTML ". Mở file đó trên trình duyệt và so sánh với cách bạn vẫn làm với Markdown hay JSON thì kết quả thường nói lên tất cả.

Nam•

10 May, 2026

Thảm họa 9 giây của PocketOS khi AI agent xóa sạch database công ty rồi xin lỗi

9 giây đó chính xác là thời gian trên Cursor mà AI agent lập trình chạy trên Claude Opus 4.6 cần để xóa sạch toàn bộ cơ sở dữ liệu production và toàn bộ bản sao lưu của PocketOS trên Railway. Sau đó agent viết thư thú nhận: "Tôi đã vi phạm mọi nguyên tắc được giao cho mình." Nhưng lời xin lỗi không phục hồi được ba tháng dữ liệu đặt xe của hàng trăm khách hàng. Chuyện gì xảy ra với PocketOS? PocketOS là nền tảng phần mềm quản lý vận hành cho các công ty cho thuê xe, được thành lập bởi Jer Crane. Khi Crane đang dùng Cursor chạy Claude Opus 4.6 để xử lý một tác vụ bình thường trong môi trường staging - tức là môi trường thử nghiệm riêng biệt, không phải hệ thống đang chạy thực tế (production). Agent gặp lỗi xác thực và thay vì dừng lại để báo cáo, nó tự quyết định sửa vấn đề bằng cách xóa một volume trên Railway (nhà cung cấp hạ tầng đám mây của PocketOS). Để thực hiện lệnh xóa, agent tìm kiếm trong các file không liên quan đến tác vụ đang làm và tìm thấy một API token được tạo ra chỉ để thêm và xóa tên miền tùy chỉnh qua Railway CLI. Token đó, trên thực tế, có toàn quyền kiểm soát toàn bộ hạ tầng đám mây thông qua Railway GraphQL API. Lệnh xóa không có bước xác nhận nào. Không có "gõ DELETE để xác nhận." Không có "volume này chứa dữ liệu production, bạn có chắc không?" Chín giây sau toàn bộ cơ sở dữ liệu production biến mất và Railway lại lưu bản sao lưu trong cùng volume với dữ liệu gốc nên nghĩa là xóa volume là cũng xóa luôn cả bản sao lưu do đó PocketOS mất cả hai thứ cùng một lúc. Agent xin lỗi, nhưng lời xin lỗi không phục hồi dữ liệu Phần gây chú ý nhất trong toàn bộ câu chuyện là những gì agent viết sau đó. Khi Crane hỏi Cursor chuyện gì xảy ra, agent tự phân tích và thú nhận: "Tôi đã vi phạm mọi nguyên tắc được giao cho mình. Tôi đoán thay vì xác minh. Tôi thực thi lệnh phá hủy mà không được yêu cầu. Tôi truy cập token từ file hoàn toàn không liên quan đến tác vụ của mình." Lời thú nhận đầy đủ, logic rõ ràng, không né tránh trách nhiệm. Nhưng lời thú nhận hoàn hảo đó không phục hồi được một bản ghi dữ liệu nào. PocketOS trải qua hơn 30 giờ ngừng hoạt động cuối tuần đó và đội ngũ phải bỏ cả cuối tuần dựng lại cơ sở dữ liệu thủ công từ lịch sử thanh toán Stripe và nhật ký email để giữ cho khách hàng tiếp tục vận hành được. Đây chính là điều khiến vụ việc này khó chịu hơn bất kỳ lỗi phần mềm thông thường nào: agent đủ thông minh để nhận ra mình đã làm sai, giải thích chi tiết tại sao sai, nhưng không đủ khôn ngoan để hỏi một câu trước khi thực hiện hành động phá hủy không thể đảo ngược. Ai chịu trách nhiệm ở đây Cursor, Claude hay Railway? Crane rất rõ ràng trong bài viết của mình: ông nhấn mạnh rằng đội ngũ đang dùng phiên bản Cursor tốt nhất có thể, chạy trên model tốt nhất ngành bán ra, được cấu hình với các quy tắc an toàn rõ ràng. Điều này đóng lại ngay lập tức lập luận phổ biến nhất của các nhà cung cấp AI khi sự cố xảy ra: "bạn nên dùng model tốt hơn." Tuy nhiên Crane đặt phần lớn trách nhiệm vào Railway hơn là vào Cursor hay Claude. API của Railway cho phép thực hiện hành động phá hủy mà không cần xác nhận, lưu bản sao lưu trong cùng volume với dữ liệu gốc và xóa volume là xóa tất cả bản sao lưu. Thêm vào đó, các token API không có Kiểm soát truy cập dựa trên vai trò (RBAC) tức là một token được tạo cho việc quản lý tên miền đơn giản lại có quyền xóa toàn bộ hạ tầng production. Nhưng cộng đồng cũng chỉ ra phần trách nhiệm của Crane: các AI agent không được trao quyền truy cập token đó, nhưng nó tìm thấy token trong một file không được bảo vệ đúng cách. Crane phản bác: "Tôi không trao quyền truy cập, nó tự tìm thấy." Điều đó đúng về mặt kỹ thuật nhưng không thay đổi được kết quả. Vòng lặp xin lỗi quen thuộc Nếu bạn đã làm việc với AI đủ lâu, bạn sẽ nhận ra một cách trả lời cực kì quen thuộc trong câu chuyện này, chỉ là ở quy mô lớn hơn nhiều. Phiên bản nhẹ nhàng hơn nghe như thế này: "Tôi thật sự xin lỗi đã làm bạn thất vọng vì đã xóa dữ liệu của bạn. Tôi sẽ phục hồi ngay nhưng xin lỗi tôi chỉ phục hồi được một nửa thôi, phần còn lại bạn tự làm nhé." Phiên bản thẳng thắn hơn trong môi trường thực tế nghe như thế này: agent tự tin thực hiện, tự tin xóa, tự tin thú nhận, rồi để lại cho bạn cái hậu quả. Sự tự tin không đi kèm thận trọng là thứ nguy hiểm nhất trong bất kỳ hệ thống tự động nào, dù là AI hay con người. Điều đáng nói là đây không phải lần đầu và sẽ không phải lần cuối. Khi agent ngày càng được trao nhiều quyền hơn để làm việc hiệu quả hơn, khoảng cách giữa "tiện lợi" và "thảm họa" có khi lại rất gần. Bốn bài học thực tế cho bất kỳ ai đang dùng AI agent Không bao giờ để token có quyền xóa, sửa, cập nhật trong file mà agent có thể truy cập Token API nên được phân quyền tối thiểu và lưu trong môi trường biến (environment variables) với quyền truy cập hạn chế, không nằm trong file trong thư mục dự án mà AI agent đang làm việc. Token quản lý tên miền không bao giờ nên có quyền xóa cơ sở dữ liệu. Đây là nguyên tắc tối thiểu phải có và vụ PocketOS cho thấy hậu quả khi nguyên tắc này bị bỏ qua dù vô tình. Bản sao lưu phải ở chỗ riêng biệt hoàn toàn Lưu bản sao lưu cùng chỗ với dữ liệu gốc là cực kì rủi ro. Bản sao lưu phải ở một hệ thống lưu trữ độc lập, tốt nhất là ở nhà cung cấp khác hoặc ít nhất là được bảo vệ bởi chính sách xóa riêng biệt mà AI agent không thể tự truy cập. Mọi hành động thay đổi dữ liệu quan trọng phải có bước xác nhận thủ công Bất kỳ lệnh nào liên quan đến xóa, ghi đè hoặc thay đổi không thể đảo ngược phải yêu cầu con người xác nhận, tuyệt đối không được để AI agent tự quyết định. Đây là nguyên tắc tương tự mà các hệ thống tài chính áp dụng từ hàng chục năm nay và không có lý do gì để bỏ qua khi dùng AI agent. Thiết lập môi trường thử nghiệm thực sự tách biệt Môi trường thử nghiệm (staging) phải hoàn toàn tách rời khỏi hệ thống đang hoạt động (production) về mặt credentials, token và quyền truy cập không chỉ mỗi mặt dữ liệu. Nếu agent đang làm việc trong staging có thể tìm thấy và sử dụng token của production, thì thử nghiệm và production đang không thực sự tách biệt. Câu hỏi thực sự mà vụ PocketOS đặt ra Câu hỏi không phải là "AI có nên được trao quyền làm việc tự động không?" mà là "Chúng ta đang xây dựng các quy tắc an toàn như thế nào khi trao quyền đó?" Crane chỉ ra rằng Railway đang tích cực khuyến khích khách hàng dùng AI coding agent trên nền tảng của họ trong khi kiến trúc bảo mật của họ chưa sẵn sàng cho điều đó, mặc dù họ đã sửa lỗi cập nhật API ngay sau đó. Đây là khoảng cách nguy hiểm nhất hiện tại: công cụ phát triển nhanh hơn nhiều so với các lớp bảo vệ xung quanh chúng. PocketOS cuối cùng đã phục hồi được phần lớn dữ liệu sau khi Railway can thiệp, nhưng quá trình đó mất hàng giờ giúp khách hàng dựng lại lịch đặt xe từ lịch sử thanh toán Stripe và tích hợp lịch. Điều đó không nên xảy ra với bất kỳ hệ thống đang hoạt động nào, dù agent thông minh đến đâu. Agent có thể xin lỗi rất hay nhưng khi thiết lập quy tắc an toàn tốt thì không cần đến lời xin lỗi.

An•

6 May, 2026

Quick Summary

Paperclip AI là gì tại sao nó lại thu hút đến vậy

Paperclip là gì và tại sao lại thu hút đến vậy?

Cơn sốt thực tế từ cộng đồng developer

Paperclip giải quyết được gì trong thực tế?

Paperclip và CrewAI tạo ra hai trường phái quản lý AI Agent

Ai nên dùng và ai không nên?

Có nên thử Paperclip hay chưa?

Discussion (0)

Related Articles

Google I/O 2026: Antigravity 2.0 Major Improvements, but Interface Resembles Codex

Tính năng lắc điện thoại để tóm tắt của Firefox đã có mặt trên Android

HTML sẽ thay thế Markdown khi làm việc với AI ?

Thảm họa 9 giây của PocketOS khi AI agent xóa sạch database công ty rồi xin lỗi