Quay lại trang tin tức

Google Antigravity công cụ AI thay đổi quy trình làm việc

Xuất bản vào 30 tháng 03, 2026
Google Antigravity công cụ AI thay đổi quy trình làm việc

Tóm tắt nhanh

Google Antigravity IDE là công cụ AI agent thế hệ mới từ Google, hoạt động bất đồng bộ để tự động hóa quy trình lập trình, điều phối nhiều agent chạy song song và tương tác trực tiếp với trình duyệt web giúp tối ưu hóa hiệu suất làm việc vượt trội.

Bạn gõ một câu lệnh, AI tự lên kế hoạch, mở terminal, viết code, mở trình duyệt web kiểm tra rồi báo lại kết quả, Antigravity làm tất cả trong khi bạn đang uống cà phê. Đó không phải viễn cảnh tương lai, đó là cách Google Antigravity hoạt động và nó vừa thay đổi hoàn toàn cách mình tiếp cận việc xây dựng sản phẩm và quy trình tự động.

Google Antigravity là gì?

Antigravity là IDE thế hệ mới do Google ra mắt cuối tháng 11 năm 2025 cùng lúc với Gemini 3, được xây dựng trên nền VS Code nhưng với kiến trúc hoàn toàn khác: thay vì AI ngồi ở sidebar gợi ý từng dòng code, AI trong Antigravity làm việc như một agent thực sự một khi đã được cấp quyền thì chúng ta có thể giao task và Antigravity tự hoàn thành task đó để cho ra kết quả rất giống với Manus Flowith nhưng ở đây Antigravity thiên về màn hình làm việc với code hơn.

Màn hình làm việc của Antigravity
Màn hình làm việc của Antigravity

Điểm khác biệt lớn nhất so với Cursor hay GitHub Copilot là Antigravity không hỏi bạn từng bước mà hoạt động bất đồng bộ đó là khi bạn giao task, agent chạy ngầm trong nền trong khi bạn làm việc khác rồi quay lại xem kết quả. Antigravity hoàn thành một feature Next.js + Supabase điển hình trong 42 giây so với 68 giây của Cursor, và độ chính xác khi refactor đạt 94% so với 78% của Cursor.

Antigravity đã có phần mềm hỗ trợ macOS, Windows và Linux nên mọi người không lo về vấn dề phần mềm mà chỉ nên lo về chi phí gọi API. Ngoài sử dụng Gemini 3 và Gemini 3 pro mặc định, Antigravity còn hỗ trợ Claude Sonnet, Claude Opus và GPT-OSS thật tốt khi không bị khoá vào nền tảng của Google khi mà Claude Sonnet, Claude Opus đang dẫn đầu thị trường.

Các tính năng tiêu biểu của Antigravity IDE

Chỉnh sửa trực tiếp với sự hỗ trợ của AI

Với giao diện quen thuộc như VS Code, nơi các lập trình viên có thể chỉnh sửa code tay hoặc nhờ AI hỗ trợ từng đoạn cụ thể. Phù hợp khi bạn muốn kiểm soát từng bước hoặc xử lý những đoạn code cần sự chú ý cao.

Điều phối agent chạy song song

Đây là điểm khác biệt thực sự của Antigravity thực sự với "mission control" bạn không cần viết code ở đây mà điều phối nhiều agent chạy song song. Ví dụ một agent đang refactor module A, agent khác đang viết test cho module B, agent thứ ba đang debug lỗi UI trên trình duyệt web. Bạn theo dõi tiến độ, để lại comment như trên Google Docs và agent tự điều chỉnh mà không cần dừng lại chờ.

Mô tả điều phối nhiều Agent trong Antigravity
Mô tả điều phối nhiều Agent trong Antigravity

Truy cập và điều khiển trình duyệt web

Đây là tính năng mình thấy ấn tượng nhất khi mới dùng khi mà Antigravity có thể mở trình duyệt web như Chrome, Firefox,... khi được cấp quyền từ đó nó có thể điều hướng trang web, điền form và kiểm tra giao diện hoàn toàn tự động. Tuy nhiên cần lưu ý rằng Antigravity hoạt động giống hệt như Puppeteer nên chỉ tương tác được với các tác vụ trên trình duyệt và khi cần có thể xử lý ảnh và chụp ảnh màn hình và tất nhiên chưa hoạt động được với những trang web đã cài đặt chặn bot truy cập.

Logic của Antigravity rất rõ ràng

Đây là tính năng mình thích nhất khi làm việc với Antigravity đó là thay vì đổ raw code ra màn hình, agent tạo ra các deliverable có thể đọc được như task list, implementation plan, screenshot màn hình app đang chạy để bạn kiểm tra logic của agent cả trước và sau khi hoàn thành task, điều này giúp bạn luôn nắm được agent đang làm gì để đánh giá.

Antigravity đang được dùng để làm những gì trong thực tế?

Nhiều người nghe đến Antigravity và nghĩ ngay đây là công cụ dành riêng cho lập trình viên chuyên nghiệp. Thực tế thì không phải vậy vì phạm vi ứng dụng rộng hơn nhiều so với vẻ ngoài kỹ thuật của nó.

Xây dựng và triển khai website

Đây là use case phổ biến nhất. Bạn mô tả trang web muốn xây — stack kỹ thuật, tính năng, phong cách thiết kế — agent tự viết code, tự kiểm tra trên browser và tự sửa lỗi. Kết hợp với Google Stitch qua MCP, bạn có thể đi từ thiết kế UI đến sản phẩm chạy thực sự mà không cần chuyển qua lại giữa nhiều công cụ.

Ví dụ prompt dùng trong Antigravity: "Xây cho mình một landing page bằng Next.js và Tailwind CSS cho sản phẩm SaaS quản lý công việc nhóm. Có section hero, bảng giá 3 gói và form đăng ký email. Deploy lên localhost và chụp screenshot kết quả."

Tự động hóa quy trình lặp lại

Một trong những điểm mạnh thực tế nhất. Bạn có thể nhờ Antigravity tự động crawl dữ liệu từ nhiều nguồn, tổng hợp và gửi báo cáo theo lịch, hoặc tự động điền form và thực hiện các thao tác lặp đi lặp lại trên trình duyệt — những việc trước đây cần viết script riêng hoặc dùng công cụ automation phức tạp.

Ví dụ prompt: "Mỗi sáng 8 giờ, vào trang thống kê của website mình tại [URL], lấy số liệu pageview và top 5 bài viết và xem thông tin 5 bài viết của trang fanpage Facebook của mình ở trang [URL], tổng hợp thành file markdown và lưu vào thư mục /reports/daily."

Xây dựng hệ thống AI agent

Đây là use case mà Antigravity thực sự vượt trội so với các công cụ khác. Thay vì chỉ viết một đoạn code đơn lẻ, bạn có thể mô tả cả một pipeline — ví dụ "tạo hệ thống phân tích review sản phẩm từ nhiều nguồn, phân loại sentiment và tự động tag vào database" — rồi để Antigravity thiết kế kiến trúc agent, phân chia nhiệm vụ và triển khai từng bước.

Ví dụ prompt: "Tạo một hệ thống gồm 3 agent: agent 1 crawl review sản phẩm từ Shopee và Lazada mỗi ngày, agent 2 phân tích sentiment và phân loại theo chủ đề, agent 3 tổng hợp thành báo cáo tuần và lưu vào Google Sheets."

Refactor và cải thiện codebase có sẵn

Nếu bạn có một dự án cũ cần nâng cấp, Antigravity đặc biệt hữu ích khi cần refactor quy mô lớn có thể thay đổi toàn bộ cấu trúc file, cập nhật dependencies, viết test coverage cho code chưa có test. Agent đọc toàn bộ codebase, hiểu ngữ cảnh và thực hiện thay đổi nhất quán trên nhiều file cùng lúc thay vì sửa từng chỗ một.

Ví dụ prompt: "Đọc toàn bộ codebase trong thư mục /src, đóng vai chuyên gia bảo mật xem có dính lỗi SQL injection, các lỗ hổng owasp không đề xuất chỉnh sửa sao cho vẫn giữ nguyên logic và đảm bảo không có lỗi sau khi refactor."

Nghiên cứu và tổng hợp thông tin từ web

Vì Antigravity có thể điều khiển trình duyệt, bạn có thể dùng nó để tự động truy cập nhiều trang web, trích xuất thông tin theo cấu trúc bạn định sẵn và tổng hợp lại thành báo cáo hoặc database — phù hợp với các tác vụ research cần thu thập dữ liệu từ nhiều nguồn mà làm thủ công sẽ rất tốn thời gian.

Ví dụ prompt: "Vào 10 trang web tin tức AI này [danh sách URL] và các trang fanpage [danh sách URL] tìm các bài đăng trong 7 ngày qua, trích xuất tiêu đề, tóm tắt 2 câu và link gốc, lưu vào file CSV theo thứ tự mới nhất trước."

Các câu hỏi thường gặp khi sử dụng Antigravity

Antigravity có miễn phí không?

Có cả gói miễn phí và trả phí.
  • Gói miễn phí có quota reset theo tuần với rate limit hạn chế, đủ để thử nghiệm và làm project nhỏ.
  • Gói Pro/Ultra có quota reset mỗi 5 giờ và được ưu tiên cao nhất rất phù hợp nếu bạn dùng Antigravity hàng ngày cho công việc thực tế.

Antigravity có làm được việc với file Word, Excel, PDF không?

Antigravity cài Puppeteer nên hoạt động chủ yếu qua trình duyệt web và chưa thể tác động trực tiếp vào các loại file như Word, Excel hay PDF. Nếu cần xử lý những file này, bạn phải thêm vào workflow và mention trong phần cấu hình để agent biết cách tiếp cận đúng.

AI không phản hồi hoặc bị treo phải làm gì?

Đây là lỗi khá phổ biến, đặc biệt vào giờ cao điểm khi nhiều người dùng đồng thời. Trong hầu hết trường hợp, chỉ cần restart lại Antigravity là được hoàn toàn không cần lo mất dữ liệu hay phải thiết lập lại từ đầu. Ngoài ra, nên dùng git và commit thường xuyên trước khi giao task lớn để tránh mất code nếu agent bỏ dở giữa chừng.

Antigravity thực sự là công cụ quá mạnh mẽ vì sao chúng ta không thử ngay. Người dùng có thể tải về tại antigravity.google/download và bắt đầu với một project nhỏ — không phải để thử tính năng mà để hiểu tư duy làm việc mới này trước khi đưa vào dự án thực tế.

Thảo luận (0)

Đăng nhập để tham gia thảo luận.

Chưa có bình luận nào. Hãy là người đầu tiên!

Các bài viết liên quan

Gemini đồng hành cùng Argentina và Messi tại World Cup 2026

Gemini đã thắng lớn theo đúng nghĩa đen ngay khi Messi lập cú hat-trick đầu tiên tại World Cup 2026, giúp Argentina đè bẹp Algeria với tỷ số 3-0 và cân bằng kỷ lục 16 bàn thắng của Miroslav Klose. Khoảnh khắc lịch sử này chính là bệ phóng hoàn hảo cho Gemini. Trước đó vào tháng 3/2026, Google và Liên đoàn bóng đá Argentina (AFA) đã đưa ra một quyết định táo bạo: thay vì chỉ in logo trên áo tập, họ ký hợp đồng để AI này tham gia hỗ trợ chiến thuật và đưa ra các quyết định chuyên môn. Đến nay, thương vụ đặt cược này đã chứng minh đó là một chiến lược hoàn toàn đúng đắn. Từ áo tập đến phòng họp chiến thuật Thỏa thuận giữa AFA và Google được công bố tại Times Square, New York, một địa điểm được chọn có chủ ý để gây chú ý với truyền thông toàn cầu. Logo Gemini xuất hiện trên toàn bộ trang phục tập luyện của đội tuyển nam, nữ lẫn các lứa trẻ Argentina, đứng ngang hàng với Adidas và American Express trong tầng tài trợ cao nhất của AFA. Nhưng phần thú vị không nằm ở chiếc áo. Theo thông tin từ Inside World Football, ban huấn luyện Argentina sẽ dùng Gemini cho ba việc cụ thể: phân tích chiến thuật, phòng ngừa chấn thương và hỗ trợ ra quyết định. Nói cách khác, Gemini có mặt trong những cuộc họp mà trước đây chỉ có Scaloni và các trợ lý của ông được ngồi. Google không tiết lộ cụ thể những công cụ Gemini nào được tích hợp vào quy trình làm việc của AFA. Điều duy nhất rõ ràng là họ đang dùng World Cup để đưa Gemini vào thực tế bóng đá chuyên nghiệp, và kết quả sẽ được chấm điểm công khai. Gemini làm gì trong phòng thay đồ? Argentina đến World Cup 2026 với tư cách nhà đương kim vô địch. Mọi quyết định của Scaloni, từ danh sách triệu tập đến lựa chọn đội hình, đều bị soi kỹ hơn bất kỳ đội nào khác, và đây cũng chính là lý do Argentina trở thành phòng thí nghiệm lý tưởng nhất mà Google từng có cho Gemini trong môi trường bóng đá chuyên nghiệp và đặc biệt là ở giải đấu lớn. Phân tích chiến thuật Gemini được dùng để xử lý dữ liệu trận đấu của cả Argentina lẫn đối thủ, bao gồm thống kê di chuyển, mẫu hình tấn công và điểm yếu phòng thủ. Thay vì ban huấn luyện phải ngồi xem lại hàng giờ video, AI tổng hợp và đưa ra các sơ đồ chiến thuật được tạo tự động điều này sẽ tiết kiệm đáng kể thời gian chuẩn bị trước mỗi trận. Phòng ngừa chấn thương Đây là bài toán mà mọi đội bóng lớn đều muốn giải, đặc biệt khi Messi và nhiều trụ cột đã ở độ tuổi cần quản lý tải lượng tập luyện cẩn thận. Gemini phân tích dữ liệu sinh học và lịch sử chấn thương để đưa ra cảnh báo sớm, giúp ban huấn luyện điều chỉnh cường độ tập trước khi vấn đề thực sự xảy ra. Đó là lý do vì sao vừa ghi hat-trick Scaloni đã quyết định thay Messi ra để đảm bảo thể lực và an toàn cho các trận đấu sau. AI trong phòng ngừa chấn thương tất nhiên không phải diều mới mẻ gì khi mà tại Premier League đã có Microsoft làm đối tác cho mục đích tương tự. Điểm khác biệt lần này là Gemini được tích hợp trực tiếp vào quy trình của một đội tuyển dự giải lớn, không chỉ ở cấp câu lạc bộ. Phía người hâm mộ: tạo ảnh Messi, theo dõi tỉ số không cần mở khóa màn hình Song song với việc hỗ trợ ban huấn luyện, Gemini cũng triển khai một loạt tính năng hướng đến người hâm mộ, và đây mới là phần mà hàng trăm triệu người thực sự chạm vào. Gemini cho phép tạo nội dung về cầu thủ luôn Người dùng có thể tạo ảnh, bài nhạc và nội dung kỹ thuật số gắn với các cầu thủ Argentina như Messi ngay trong ứng dụng Gemini. Tính năng này được thiết kế để đưa trải nghiệm World Cup đến gần hơn với những người không thể đến sân trực tiếp. Tỉ số thời gian thực và bản tin tự động Trên Google Search, tỉ số trận đấu được ghim lên màn hình khóa và cập nhật theo thời gian thực, có animation riêng cho bàn thắng và thẻ đỏ mà không cần mở khóa điện thoại. Với người dùng Gemini trả phí, tính năng Scheduled Actions cho phép thiết lập bản tin bóng đá tự động mỗi ngày, bao gồm tỉ số, tin tức và lịch thi đấu, được giao đúng giờ đã chọn mà không cần nhắc lại mỗi ngày. Hạ tầng phục vụ ngày thi đấu Google cập nhật Street View tại 16 sân vận động chủ nhà và tối ưu hóa lộ trình trên Waze cho ngày thi đấu. Waze còn hiển thị tỉ số trực tiếp khi xe dừng đèn đỏ, để người lái không cần cầm điện thoại trong lúc di chuyển. World Cup 2026 là phép thử thật sự cho AI trong thể thao Google không chỉ tài trợ cho Argentina. Gemini còn có mặt trên áo của Pháp, Morocco, Iraq, Thổ Nhĩ Kỳ và Mỹ, trong khi Pixel là điện thoại chính thức của đội Pháp với Gemini được dùng cho liên lạc nội bộ. Đây rõ ràng là chiến lược tổng thể của Google và không phải một hợp đồng đơn lẻ. Điều khiến World Cup 2026 trở nên đặc biệt là nó sẽ trả lời một câu hỏi mà không phòng lab nào làm được: người dùng thực sự dùng AI để làm gì khi có một giải đấu World Cup 2026 kéo dài 6 tuần với 104 trận? Các tính năng chạy trên sức hút ban đầu sẽ tắt dần sau vòng bảng. Những gì người dùng còn tiếp tục dùng đến tận trận chung kết mới là câu trả lời thật cho câu hỏi AI phù hợp ở đâu trong cuộc sống hàng ngày, và Google biết rõ điều đó. Giám đốc truyền thông Google khu vực Mỹ Latinh, Flor Sabatini, phát biểu rằng World Cup 2026 sẽ đánh dấu một trước và sau trong lịch sử bóng đá nhờ AI. Câu nói nghe có vẻ marketing, nhưng thực tế là lần đầu tiên một mô hình AI lớn được tích hợp vào chuẩn bị của đội đương kim vô địch, ngay giữa một giải đấu được xem nhiều nhất hành tinh. World Cup 2026 là bài kiểm tra thật của Gemini Điểm đáng chú ý nhất của toàn bộ câu chuyện này không phải logo Gemini trên áo Messi. Đó là việc Argentina tất nhiên vẫn là đội được kỳ vọng nhất và bị soi kỹ nhất, với áp lực bảo vệ chức vô địch vẫn đặt một phần quy trình chuẩn bị của mình vào AI. Nếu Argentina thành công, Gemini có một case study không thể mua bằng tiền quảng cáo. Nếu Argentina thất bại mà ban huấn luyện quy trách nhiệm một phần cho AI, câu chuyện sẽ đi theo chiều ngược lại hoàn toàn. Dù kết quả thế nào, đây là lần đầu tiên AI phải chịu trách nhiệm ở một sân khấu thực sự có giá trị, không phải benchmark, không phải demo, mà là World Cup. Với người dùng AI, điều đáng theo dõi không chỉ là Argentina có vô địch hay không, mà là xem liệu Gemini có thực sự thay đổi cách một đội bóng vận hành, hay chỉ là logo trên áo tập đẹp hơn mọi năm.

Nam
17 thg 6, 2026
Tư duy CEO Y Combinator về 6 câu hỏi để bắt đầu dự án

Mình đã nghe rất nhiều về repo gstack của CEO Y Combinator thế là tò mò cài vào thử, thứ khiến mình bất ngờ nhất không phải các workflow xịn mà là tư duy thật sự khác biệt của vị CEO này. Đó là lệnh đầu tiên trong cả hệ thống: /office-hours với sáu câu hỏi bắt đầu nhưng lại không hỏi về code chỉ hỏi những thứ mà hầu hết mọi người chưa trả lời được trước khi bắt tay vào build. gstack là gì và tại sao Garry Tan tạo ra nó gstack là bộ công cụ mã nguồn mở của Garry Tan, CEO Y Combinator, chủ yếu được thiết kế ra dành cho Claude Code. Ý tưởng cốt lõi của repo là thay vì dùng AI như một người viết code đơn thuần, Garry Tan muốn biến Claude thành cả một nhóm AI agent làm việc thu nhỏ, mỗi thành viên phụ trách một vai trò khác nhau từ người định hướng sản phẩm, kiểm tra bảo mật, đến người kiểm thử và phát hành. Toàn bộ quy trình chạy theo vòng lặp có thứ tự: suy nghĩ → lên kế hoạch → xây dựng → kiểm tra → thử nghiệm → phát hành → đánh giá lại . Cụ thể hơn, gstack chia Claude Code thành 23 vai trò chuyên biệt tất nhiên trong workflow kết quả của bước trước tự động được chuyển sang bước tiếp theo mà không cần bạn làm thủ công. Một số lệnh nổi bật như sau: /office-hours 6 câu hỏi buộc bạn suy nghĩ lại tính năng trước khi viết dòng code đầu tiên /plan-ceo-review tìm xem bạn đang làm quá nhiều hay quá ít so với thực tế cần /review bắt lỗi nghiêm trọng mà các công cụ kiểm tra tự động thông thường không thấy /qa mở trình duyệt thật, thao tác thật, tìm lỗi thật /cso chạy kiểm tra bảo mật theo chuẩn quốc tế tự động /ship đồng bộ, kiểm tra, đẩy code và tạo pull request trong một lệnh duy nhất Kết quả gstack hoạt động thế nào? Garry Tan cho biết tốc độ làm việc của ông năm 2026 nhanh hơn khoảng 810 lần so với năm 2013 khi đo bằng dòng code hoàn chỉnh mỗi ngày (11.417 so với 14 dòng). Trong 60 ngày, ông ship 3 dịch vụ production và hơn 40 tính năng, tất cả trong khi vẫn điều hành Y Combinator toàn thời gian. Andrej Karpathy, đồng sáng lập OpenAI, cũng chia sẻ rằng ông không gõ một dòng code nào kể từ tháng 12/2025 nhờ các tác nhân AI. Nhưng trong tất cả các lệnh đó, /office-hours là thứ đáng chú ý nhất vì một lý do ngược lại với phần còn lại, nó không giúp bạn làm việc nhanh hơn mà nó giúp bạn không làm nhầm thứ ngay từ đầu. Tại sao /office-hours lại được xếp đầu tiên Garry Tan đặt /office-hours ở đầu workflow vì một quan sát đơn giản: hầu hết các sản phẩm thất bại không phải vì code kém mà vì làm sai thứ mọi người cần. Họ bỏ hàng tuần viết một tính năng không ai cần, hoặc xây dựng đúng tính năng nhưng lại sai đối tượng, hoặc giải quyết một vấn đề mà người dùng đã có cách giải quyết tốt hơn từ lâu. Lệnh này có hai chế độ: Startup mode dành cho founder và người build sản phẩm thật, và Builder mode dành cho side project, hackathon, open source. Bài này tập trung vào Startup mode, nơi 6 câu hỏi được áp dụng đúng nghĩa nhất. 6 câu hỏi của /office-hours và tại sao mỗi câu đều đáng giá Đây không phải 6 câu hỏi để trả lời qua loa rồi tiếp tục đến các phần sau. Chúng được thiết kế để bạn suy nghĩ thật, vì câu trả lời càng trung thực thì kết quả Claude tạo ra càng bám sát đúng thứ bạn thực sự cần và bạn sẽ tiết kiệm được rất nhiều thời gian về sau. Bạn có thể xem nội dung gốc đầy đủ 6 cau hỏi tại office-hours/SKILL.md.tmpl. Demand reality: Nhu cầu có thật không? Câu hỏi gốc: "Ai cụ thể đang gặp vấn đề này? Họ đang giải quyết tạm bằng cách nào?" Không phải người dùng nói chung hay team marketing mà tác giả muốn hướng đến một người thật, có tên(càng tốt) đang vật lộn với vấn đề cụ thể là gì. Nếu bạn không biết được một người như vậy, bạn sẽ chưa thực sự hiểu họ cần gì. Ví dụ cụ thể: Thay vì "người dùng muốn quản lý task tốt hơn", phải là "Minh, project manager tại công ty 20 người, đang copy-paste giữa Notion và Google Sheet mỗi sáng thứ Hai vì hai tool không sync được." Tất nhiên đây là ví dụ mọi người tự áp dụng vào trường hợp của mình. Status quo: Họ đang dùng gì thay thế? Câu hỏi gốc: "Giải pháp thay thế tạm thời hiện tại của họ là gì? Bạn cần tốt hơn bao nhiêu để họ chịu đổi sang dùng giải pháp của bạn?" Mọi người đều đang giải quyết vấn đề theo một cách nào đó, dù là Excel, sticky note, hay nhóm chat WhatsApp. Nếu giải pháp hiện tại của họ đủ tốt, họ chẳng có lý do gì để chuyển dữ liệu và phải học sử dụng lại một nền tảng hoàn toàn mới, vì vậy giải pháp của bạn phải làm thực sự tốt hơn để họ còn cân nhắc. Desperate specificity: Ai đang cần giải pháp này đủ nhiều? Câu hỏi gốc: "Ai đang cần giải pháp đến mức có thể dùng bản beta xấu xí của bạn ngay hôm nay?" Đây là câu phân biệt "nice-to-have" và "must-have". Nếu bạn không tìm được ai sẵn sàng dùng một bản chưa hoàn chỉnh, chưa có UI đẹp, còn nhiều lỗi, thì vấn đề bạn đang giải quyết chưa đủ cấp bách. Người dùng thật của giai đoạn đầu là người cần đến mức họ chịu đựng được cả sản phẩm chưa đẹp nhưng có sửa đổi và hướng đi phù hợp. Narrowest wedge: Phần nhỏ nhất là gì? Câu hỏi gốc: "Phần nhỏ nhất có thể ra mắt ngày mai là gì? Không phải toàn bộ sản phẩm mà là phần nhỏ nhất." Không phải phiên bản đầu tiên đầy đủ tính năng mà là phần nhỏ hơn nữa. Câu hỏi này thường cắt bỏ 80% những thứ bạn tự thêm vào vì nghĩ "làm luôn cho tiện". Đây là lỗi mà mình rất hay bị khiến cho mọi thứ vượt tầm kiểm soát, phần này giúp mọi người ra mắt phần nhỏ nhất trước, lắng nghe phản hồi từ người dùng thật rồi mới quyết định mở rộng tiếp. Lưu ý: Nhiều người hay nhầm "phần nhỏ nhất" với "phiên bản đầu tiên đầy đủ tính năng". Thực ra phần nhỏ nhất đúng nghĩa có thể chỉ là tính năng nhỏ giải quyết một vấn đề duy nhất, cho một nhóm người dùng duy nhất, không hơn không kém. Observation and surprise: Bạn đã xem người thật dùng chưa? Câu hỏi gốc: "Bạn đã ngồi xem người thật dùng sản phẩm chưa? Họ dùng theo cách bạn không ngờ không?" Câu hỏi này có lẽ nên để cho vòng lặp thứ hai trở đi, khi bạn đã có bản thử nghiệm trong tay. Thay vì hỏi cảm nhận qua tin nhắn hay khảo sát, hãy ngồi xem trực tiếp hoặc xem lại video ghi màn hình khi họ dùng. Những phát hiện đáng giá nhất thường không phải từ lời họ nói mà từ những thao tác họ làm mà bạn không thiết kế, hoặc những bước họ bỏ qua dù bạn nghĩ là quan trọng. Lưu ý: Nếu bạn đang ở vòng đầu tiên và chưa có sản phẩm nào, mình nghĩ có thể bỏ qua câu này và quay lại sau khi đã ra mắt phần nhỏ nhất ở bước 4. Future-fit: Tầm nhìn 2 đến 3 năm Câu hỏi gốc: "2-3 năm nữa, thứ bạn đang build có còn phù hợp không, hay trend đang đi ngược lại?" Không phải để dự đoán tương lai chính xác, mà để tránh build thứ đang chết dần. Nếu xu hướng đang làm cho vấn đề bạn giải quyết trở nên ít cấp bách hơn trong 2 năm tới, đó chắc chắn là tín hiệu cần xem xét lại từ đầu còn nếu bạn muốn đánh nhanh thắng nhanh để tránh big tech ra sản phẩm giống hệt bạn thì hãy bỏ qua câu hỏi này. Ví dụ thực tế: một ý tưởng tưởng đơn giản bị lật ngược hoàn toàn Trong tài liệu của gstack, Garry Tan lấy một ví dụ rất thực tế. Bạn mở /office-hours và nói: "Tôi muốn làm một app tóm tắt lịch làm việc hàng ngày." Claude không đồng ý ngay và bắt đầu làm theo. Thay vào đó, nó phản hồi: thứ bạn vừa mô tả không chỉ là app tóm tắt lịch mà thực chất là một trợ lý cá nhân AI toàn diện. Hai thứ này khác nhau hoàn toàn về quy mô, độ phức tạp kỹ thuật và kỳ vọng của người dùng. Chỉ từ một câu mô tả ban đầu, /office-hours giúp bạn nhìn ra: 5 tính năng bạn đang mô tả mà chưa nhận ra 4 giả định cần kiểm chứng trước khi bắt tay làm 3 hướng triển khai khác nhau với mức độ phức tạp khác nhau 1 gợi ý: ra mắt phần nhỏ nhất trước, phần còn lại để làm dần về sau Toàn bộ quá trình đó xảy ra rồi cho ra kết quả sẽ được lưu lại thành tài liệu để các bước tiếp theo trong quy trình tự động đọc và tiếp tục. Khả năng mở rộng của 6 câu hỏi này ra ngoài repo gstack 6 câu hỏi của /office-hours không phụ thuộc vào Claude Code, không cần cài gstack. Chúng là tư duy, cách YC partners ngồi đánh giá startup, và bạn có thể áp dụng ngay hôm nay bằng bất kỳ công cụ AI nào đang dùng. Sự khác biệt khi dùng qua gstack là khi Claude sẽ không để bạn trả lời qua loa. Nó giúp Claude hiểu yêu cầu cụ thể hơn và nó không tiếp tục cho đến khi câu trả lời đủ thực tế. Đó là lý do vì sao/office-hours là skill đáng sợ nhất trong cả repo, không phải vì nó khó dùng, mà vì nó hỏi đúng thứ bạn đang bỏ qua. Thử ngay hôm nay: Trước khi làm sản phẩm tiếp theo, paste 6 câu hỏi trên vào Claude, Gemini, hay ChatGPT cùng với mô tả ý tưởng của bạn. Yêu cầu nó hỏi từng câu một và không cho phép bạn bỏ qua. Kết quả thường bất ngờ hơn bạn nghĩ, kể cả với những ý tưởng bạn đã nghĩ rất kỹ. gstack hiện có hơn 117k lượt star trên GitHub và vẫn đang tăng. Với mình, phần đáng giá nhất không phải các lệnh kỹ thuật như /review hay /ship, mà chính là /office-hours vì đây là lệnh duy nhất trong cả bộ công cụ buộc bạn dừng lại và suy nghĩ trước khi làm bất cứ điều gì.

Nam
27 thg 6, 2026
Claude Code tự điều phối công việc với Dynamic Workflows

Bài đăng của Thariq Shihipar từ team Claude Code đã gây chú ý lớn trong cộng đồng sử dụng AI. Anh ấy tiết lộ Dynamic Workflows, tính năng cho phép Claude tự thiết kế quy trình làm việc thay vì chỉ chờ lệnh, và đây được coi là bản nâng cấp quan trọng nhất kể từ khi Claude Code có skills và subagents. Tính năng này là khái niệm harness làm bản chất để giải thích các yêu cầu kĩ thuật. Ba lỗi chí mạng nào khiến AI agent thất bại ở nhiệm vụ phức tạp Trước khi nói về giải pháp, Thariq chỉ ra một thực tế khó chịu: hầu hết AI agent hiện nay đều gặp vấn đề nghiêm trọng khi xử lý nhiệm vụ phức tạp, đa bước trong một cửa sổ ngữ cảnh duy nhất. Ông phân loại chúng thành ba dạng thất bại cốt lõi mà gần như mọi hệ thống agent đều mắc phải. Khi AI lười biếng bằng cách tự tuyên bố xong dù mới làm nửa việc Đây là hiện tượng Agentic Laziness, khi agent thực hiện một phần công việc rồi tự báo cáo là đã hoàn thành. Ví dụ cụ thể: bạn yêu cầu agent review 50 file code, nhưng nó chỉ xem qua 20 file rồi kết luận rằng mọi thứ ổn. Nguyên nhân nằm ở giới hạn cửa sổ ngữ cảnh, khi lượng thông tin quá lớn, agent có xu hướng đi tắt để hoàn thành nhanh hơn. Agent sẽ tự thiên vị bản thân nó đúng không Agent tự thiên thị nó gọi là Self-Preferential Bias, điều này xảy ra khi bạn yêu cầu agent kiểm tra lại kết quả của chính nó. Giống như nhờ một học sinh tự chấm bài thi, agent có xu hướng nghiêng về phía kết quả mà nó đã tạo ra, dẫn đến xác nhận thiếu phê phán và bỏ qua các lỗi tiềm ẩn. Điều này đặc biệt nguy hiểm trong các nhiệm vụ đòi hỏi độ chính xác cao. Làm sao để agent không mất dần ý định ban đầu qua mỗi bước Hiện tượng trôi mất mục tiêu (Goal Drift) là hiện tượng agent dần quên mục tiêu ban đầu sau nhiều bước xử lý hoặc sau quá trình nén ngữ cảnh (context compaction). Những ràng buộc cụ thể như "không làm X" hoặc các trường hợp quan trọng có thể bị loại bỏ khi bộ nhớ bị tóm tắt lại vì vậy kết quả cuối cùng lệch khỏi yêu cầu gốc mà agent không hề nhận ra. Dynamic Workflows giúp Claude tự viết bộ khung điều phối công việc Giải pháp của Anthropic không phải là làm model thông minh hơn, mà là thay đổi cách Claude tổ chức công việc. Dynamic Workflows biến Claude từ agent viết code thành agent thiết kế quy trình vận hành cho công việc phức tạp. Khái niệm cốt lõi ở đây là tự tổ chức (self-organization): Claude có thể tự phân tích mục tiêu, chọn chế độ làm việc phù hợp và tạo ra quy trình nội bộ trước khi bắt tay vào thực hiện. Harness tùy chỉnh thay vì quy trình cố định Thay vì hoạt động trong một môi trường cố định, Claude viết một bộ khung harness bằng JavaScript được thiết kế riêng cho từng nhiệm vụ. Harness này đóng vai trò như một quản lý dự án: nó chia nhỏ công việc, khởi tạo các sub-agent chuyên biệt cho từng phần, chỉ định công cụ phù hợp, định tuyến công việc đến các model khác nhau và thực hiện xác minh đối kháng (adversarial verification) để đảm bảo chất lượng. Harness hoạt động như thế nào? Để hiểu rõ hơn, hãy hình dung harness như một kịch bản sân khấu mà Claude tự soạn trước khi diễn. Khi nhận được một nhiệm vụ phức tạp, Claude không lao vào làm ngay mà dừng lại để viết một đoạn JavaScript mô tả toàn bộ quy trình: cần bao nhiêu sub-agent, mỗi agent làm gì, thứ tự thực hiện ra sao và kết quả từ agent này được chuyển cho agent kia như thế nào. Ví dụ cụ thể: nếu bạn yêu cầu Claude audit 1.000 tin nhắn Slack để tìm sự cố lặp lại, harness có thể trông như thế này về mặt logic: Agent 1 (phân loại): đọc toàn bộ tin nhắn và gán nhãn theo chủ đề Agent 2, 3, 4 (xử lý song song): mỗi agent phân tích sâu một nhóm chủ đề riêng Agent 5 (tổng hợp): gom kết quả từ ba agent trên, loại bỏ trùng lặp Agent 6 (kiểm tra chéo): đọc lại kết quả tổng hợp và phản biện độc lập Điểm quan trọng là Claude viết harness này dựa trên đặc điểm cụ thể của từng nhiệm vụ, không phải theo một khuôn mẫu cứng nhắc. Nhiệm vụ khác nhau sẽ cho ra harness khác nhau, và đó chính là lý do tính năng này được gọi là "dynamic". Harness được viết bằng JavaScript và chạy trong môi trường Claude Code. Bạn có thể kích hoạt Dynamic Workflows bằng cách nói “use a workflow” tuy nhiên từ này rất dễ bị nhầm với workflow thông thường vì vậy mọi người nên dùng từ khóa "ultracode" trong câu lệnh thì sẽ phân rõ workflow thông thường và Dynamic Workflow để tiết kiệm token hơn. Cô lập ngữ cảnh để ngăn sự suy thoái của ngữ cảnh Một trong những thiết kế thông minh nhất của Dynamic Workflows là tính năng Isolation. Mỗi sub-agent được cấp cửa sổ ngữ cảnh riêng biệt, hoàn toàn độc lập với các agent khác. Điều này ngăn chặn hiện tượng suy thoái ngữ cảnh (context rot) tức sự suy giảm chất lượng khi ngữ cảnh bị quá tải, đồng thời triệt tiêu cả Agentic Laziness lẫn Goal Drift vì mỗi agent chỉ tập trung vào phần việc nhỏ được giao. Sáu mẫu điều phối có thể tái sử dụng Claude có thể kết hợp sáu mẫu điều phối sẵn có để xử lý đa dạng tình huống: Phân loại và hành động: phân loại đầu vào rồi chọn hành động phù hợp Phân chi và tổng hợp: chia công việc ra nhiều nhánh song song rồi tổng hợp kết quả Kiểm tra chéo: dùng agent khác kiểm tra chéo kết quả Tạo và lọc: tạo nhiều phương án rồi lọc ra phương án tốt nhất Tạo ra giải đấu: cho các phương án "đấu đối khảng trực tiếp với nhau rồi loại dần Vòng lặp: lặp lại cho đến khi đạt tiêu chuẩn chất lượng Có thể tối ưu chi phí khi sử dụng Dynamic Workflows không Chạy nhiều sub-agent song song nghe có vẻ tốn kém, nhưng thực tế Dynamic Workflows được thiết kế để tối ưu chi phí theo một số cách cụ thể. Định tuyến thông minh đến model phù hợp Không phải mọi bước trong quy trình đều cần model mạnh nhất. Harness cho phép Claude định tuyến từng tác vụ đến model phù hợp với độ phức tạp của nó: các bước phân loại đơn giản có thể chạy trên model nhỏ hơn và rẻ hơn, trong khi chỉ những bước đòi hỏi suy luận sâu mới cần đến model lớn. Kết quả là tổng chi phí thường thấp hơn so với việc chạy toàn bộ quy trình trên một model duy nhất. Cô lập ngữ cảnh giúp giảm token tiêu thụ Vì mỗi sub-agent chỉ nhận đúng phần ngữ cảnh cần thiết cho công việc của mình, tổng lượng token tiêu thụ trên toàn bộ quy trình thường thấp hơn đáng kể so với cách tiếp cận truyền thống, khi toàn bộ lịch sử hội thoại được nhồi vào một cửa sổ ngữ cảnh duy nhất ngày càng phình to. Tránh làm lại công việc nhờ kiểm tra lại sớm Harness có thể cài các điểm kiểm tra chất lượng (checkpoint) giữa các bước. Nếu một bước cho ra kết quả không đạt yêu cầu, hệ thống dừng và xử lý lại đúng bước đó thay vì chạy tiếp toàn bộ quy trình rồi mới phát hiện lỗi ở cuối. Cách này tiết kiệm đáng kể chi phí cho các tác vụ dài nhiều bước. Nếu bạn lo ngại về chi phí, hãy bắt đầu với các tác vụ có khối lượng vừa phải để quan sát mức tiêu thụ token thực tế trước khi mở rộng quy mô. Ứng dụng thực tế của Dynamic Workflow như thế nào Điều khiến Thariq hào hứng nhất không phải là khả năng code, mà là việc Dynamic Workflows mở rộng Claude Code sang các nhiệm vụ phi kỹ thuật. Tính năng này có thể kích hoạt bằng ngôn ngữ tự nhiên (ví dụ: "use a workflow") hoặc từ khóa "ultracode." Các ứng dụng thực tế bao gồm: Audit hàng nghìn tin nhắn trên Slack để tìm sự cố lặp lại Xếp hạng và sàng lọc bộ hồ sơ ứng viên lớn một cách có hệ thống Chạy giải đấu loại trực tiếp tự động để chọn tên tốt nhất cho CLI tool Xử lý các nhiệm vụ vận hành đòi hỏi độ chính xác cao mà trước đây chỉ con người mới làm được Triết lý thiết kế là ràng buộc kiến trúc thay vì trí tuệ thô Điểm đáng chú ý nhất trong cách tiếp cận của Anthropic là triết lý thiết kế: thay vì cố gắng tăng trí thông minh thô của model, họ xây dựng các ràng buộc kiến trúc (architectural constraints) vào quy trình làm việc. Nói cách khác, thay vì hy vọng model tự biết cách tránh lỗi, họ thiết kế hệ thống sao cho lỗi khó xảy ra ngay từ đầu, và harness chính là công cụ thực thi triết lý đó. Dynamic Workflows cho thấy bước tiến tiếp theo của AI agent không nằm ở model thông minh hơn mà ở khả năng tự thiết kế quy trình. Giống cách một quản lý giỏi phân chia công việc cho đội ngũ thay vì tự làm tất cả, Claude giờ đây có thể tự tổ chức đội ngũ sub-agent của mình, và đây là tín hiệu rõ ràng rằng tương lai của AI coding không chỉ còn là viết code nhanh hơn mà là tổ chức công việc tốt hơn.

Nam
5 thg 6, 2026
Claude Code, NotebookLM và Obsidian cho nghiên cứu thông minh hơn

Rất nhiều người vẫn nghiên cứu theo cách thủ công: mở hàng chục tab, xem video, đọc bài viết, ghi chú rời rạc rồi mất thêm thời gian tự tổng hợp. Bài viết long-form của monokern trên X gợi ý một cách làm khác: dùng Claude Code để điều phối, NotebookLM để phân tích nguồn và Obsidian để lưu trí nhớ dài hạn. Khi kết hợp đúng, đây không còn là một lần tìm kiếm thông tin mà trở thành một workflow AI có khả năng tích lũy qua từng phiên làm việc. Ý tưởng cốt lõi khá thực dụng: Claude Code không cần tự làm mọi thứ trong một context đắt đỏ. Nó có thể gọi công cụ, chạy skill, tạo file và chuyển phần xử lý nặng sang NotebookLM. Sau đó toàn bộ kết quả được lưu về Obsidian dưới dạng markdown để lần nghiên cứu tiếp theo có ngữ cảnh tốt hơn. Theo tác giả, phần thiết lập ban đầu có thể hoàn thành trong khoảng dưới 30 phút nếu máy đã có các công cụ cần thiết. Vì sao bộ ba này hoạt động tốt với nhau? Điểm mạnh của workflow này nằm ở việc mỗi công cụ chỉ đảm nhiệm một lớp rõ ràng. Claude Code đóng vai trò execution engine: nhận yêu cầu bằng ngôn ngữ tự nhiên, gọi skill, chạy lệnh, quản lý file và điều phối toàn bộ pipeline. Thay vì bắt người dùng thao tác từng bước, Claude Code trở thành người vận hành hệ thống. NotebookLM là lớp phân tích. Công cụ của Google có thể đọc nguồn, tóm tắt, tạo phân tích, flashcard, mindmap, infographic hoặc audio overview. Khi Claude Code đẩy phần đọc nguồn sang NotebookLM, người dùng tận dụng hạ tầng xử lý của Google thay vì đốt toàn bộ token Claude cho việc nghiền dữ liệu dài. Obsidian là lớp trí nhớ. Mọi kết quả sau khi phân tích được lưu thành markdown trong vault cá nhân. Qua thời gian, vault này trở thành kho tri thức có cấu trúc gồm chủ đề, nguồn, nhận định, pattern và kết luận. Claude Code có thể đọc lại các file đó để hiểu người dùng quan tâm điều gì, thích format nào và thường đánh giá vấn đề theo hướng nào. Skill Creator biến workflow thành công cụ tái sử dụng Phần quan trọng đầu tiên trong hướng dẫn là cài Skill Creator trong Claude Code. Đây là lớp cho phép người dùng mô tả một kỹ năng bằng ngôn ngữ tự nhiên, sau đó Claude Code tạo cấu trúc skill, cài đặt và biến nó thành lệnh có thể gọi lại. Nói cách khác, thay vì mỗi lần nghiên cứu lại prompt từ đầu, người dùng đóng gói thao tác thành một skill riêng. Ví dụ đầu tiên trong bài là tạo skill tìm kiếm YouTube. Skill này dùng yt-dlp để tìm video theo truy vấn, lấy metadata như tiêu đề, kênh, lượt xem, thời lượng, ngày đăng, URL và tỷ lệ view trên subscriber. Với nghiên cứu thị trường nội dung, dữ liệu này quan trọng hơn danh sách link thông thường vì nó cho biết nguồn nào đang thật sự thu hút sự chú ý. NotebookLM là nơi xử lý phần phân tích nặng Bài viết đề xuất kết nối Claude Code với NotebookLM thông qua dự án notebooklm-py vì NotebookLM chưa có public API chính thức. Sau khi cài và xác thực tài khoản Google, Claude Code có thể dùng skill riêng để tạo notebook mới, thêm nguồn như URL YouTube, văn bản hoặc file, rồi yêu cầu NotebookLM sinh phân tích hoặc deliverable. Điểm đáng chú ý là NotebookLM không chỉ tóm tắt. Trong một pipeline nghiên cứu thực tế, nó có thể nhận 10 video liên quan đến một chủ đề, phân tích xem framework nào đang tăng trưởng, framework nào bị thổi phồng, đâu là điểm tranh luận trong cộng đồng và khoảng trống nội dung nào chưa được ai khai thác tốt. Phần xử lý này tốn thời gian, nhưng chủ yếu diễn ra ở phía NotebookLM. Pipeline hoàn chỉnh: một lệnh để nghiên cứu cả chủ đề Khi đã có skill YouTube search và skill NotebookLM, bước tiếp theo là tạo một pipeline skill kết hợp cả hai. Người dùng chỉ cần đưa chủ đề, ví dụ nghiên cứu các AI agent framework trong năm 2026, rồi pipeline sẽ tự tìm nguồn liên quan, tạo notebook, thêm nguồn, chạy phân tích và trả kết quả thành markdown. Trong ví dụ của monokern, pipeline tìm 10 nguồn video, đẩy sang NotebookLM, tạo phân tích, sinh infographic và lưu lại kết quả vào Obsidian. Tổng thời gian xử lý được mô tả khoảng 6 phút, trong đó phần lớn là thời gian NotebookLM xử lý nguồn. Giá trị thực tế nằm ở việc người dùng không phải tự mở từng tab, copy từng link hay tự tổng hợp metadata. Kết quả cuối cùng không chỉ là một đoạn trả lời trong chat. Nó gồm phân tích đầy đủ, danh sách nguồn, chỉ số tương tác, nhận định về xu hướng, deliverable trực quan và file markdown được lưu vào vault. Đây là điểm khiến workflow này khác với một chatbot hỏi đáp thông thường. Obsidian khiến hệ thống thông minh hơn theo thời gian Phần thú vị nhất là Obsidian. Nếu chỉ chạy một lần, workflow này đã tiết kiệm thời gian. Nhưng nếu chạy đều đặn, mỗi file markdown mới sẽ làm kho tri thức cá nhân dày hơn. Sau một tháng, Claude Code có thể nhìn thấy các chủ đề bạn quay lại nhiều lần, loại insight bạn đánh giá cao và cách bạn muốn dữ liệu được trình bày. Tác giả cũng nhấn mạnh vai trò của file claude.md trong vault. Đây có thể trở thành nơi mô tả quy ước làm việc, phong cách phân tích và format đầu ra mong muốn. Sau mỗi vài phiên nghiên cứu, người dùng có thể yêu cầu Claude Code đọc lại kết quả gần đây và cập nhật file này để phản ánh cách làm việc mới. Điểm mạnh thật sự là cấu trúc, không phải YouTube YouTube chỉ là nguồn dữ liệu trong ví dụ. Cấu trúc pipeline mới là phần có giá trị. Người dùng có thể thay YouTube bằng PDF học thuật, báo cáo ngành, tài liệu public, trang web, file local, transcript hoặc tài liệu Google Drive. Miễn là Claude Code có cách truy cập và đưa nguồn vào lớp phân tích, template vận hành vẫn giữ nguyên. Điều này mở ra nhiều ứng dụng thực tế: nghiên cứu một hệ sinh thái crypto bằng whitepaper và tài liệu public, phân tích một công nghệ mới qua talk hội nghị, tìm khoảng trống nội dung trong một niche, hoặc theo dõi động lực thị trường từ báo cáo công khai. Với mỗi trường hợp, pipeline vẫn gồm ba lớp: lấy nguồn, phân tích, lưu tri thức. Cần lưu ý gì trước khi áp dụng? Workflow này mạnh nhưng không phải dành cho mọi người. Nó yêu cầu người dùng quen với Claude Code, có Obsidian vault, biết cài công cụ CLI như yt-dlp và chấp nhận dùng một thư viện không chính thức để kết nối NotebookLM. Ngoài ra, vì NotebookLM và YouTube có thể thay đổi giao diện hoặc hạn chế truy cập, các skill nên được xem như công cụ cần bảo trì chứ không phải giải pháp cài một lần mãi mãi. Dù vậy, ý tưởng đằng sau rất đáng chú ý: thay vì dùng AI như một hộp chat rời rạc, hãy biến AI thành một hệ thống nghiên cứu có bộ nhớ, có pipeline và có khả năng học từ lịch sử làm việc của chính bạn. Với những người thường xuyên phân tích thị trường, công nghệ hoặc nội dung, đây là một hướng triển khai thực dụng hơn rất nhiều so với việc mở 10 tab rồi tự tổng hợp mọi thứ bằng tay.

Nam
2 thg 6, 2026