Quay lại trang tin tức

Cách kết nối Antigravity và Stitch thông qua MCP

Xuất bản vào 24 tháng 04, 2026
Cách kết nối Antigravity và Stitch thông qua MCP

Tóm tắt nhanh

Kết nối Google Stitch với Antigravity IDE qua MCP giải quyết bài toán kinh điển nhất của quy trình thiết kế đến lập trình: khoảng cách giữa bản thiết kế và code thực tế. Thay vì copy màu hex và spacing thủ công, agent trong Antigravity đọc trực tiếp "DNA thiết kế" từ Stitch theo thời gian thực qua MCP, sau đó tạo component React với Tailwind hoàn hảo đến từng pixel thông qua vòng lặp Stitch Loop: thiết kế, code, xác minh trực quan rồi tự sửa theo token gốc. Ở đây đưa ra toàn bộ quy trình từ tạo API key, cấu hình MCP, chạy vòng lặp, đến đóng gói DESIGN.md thành skill Antigravity tái sử dụng cho các dự án sau.

Khi bạn đã biết Google StitchAntigravity IDE rồi thì rất muốn kết hợp hai công cụ này với nhau để thay vì thiết kế giao diện xong rồi ngồi dịch thủ công từng màu sắc, font chữ và khoảng cách sang code, Google vừa công bố quy trình kết nối Google Stitch với Antigravity IDE qua MCP để agent tự đọc "DNA thiết kế" và viết code React hoàn hảo đến từng pixel. Bài này hướng dẫn toàn bộ quy trình, từ tạo thiết kế đến đóng gói thành skill tái sử dụng cho các dự án sau.

Tại sao cần kết nối Stitch với Antigravity qua MCP?

Vấn đề kinh điển của quy trình thiết kế đến lập trình là khoảng cách giữa hai bên: designer tạo ra giao diện đẹp trong Figma hay Stitch, lập trình viên nhận file rồi phải tự diễn giải màu sắc, khoảng cách, font và hành vi. Kết quả thường là code trông "gần giống" thay vì "đúng pixel".

MCP (Model Context Protocol) giải quyết khoảng cách này bằng cách cho phép Antigravity đọc trực tiếp siêu dữ liệu thiết kế từ Stitch theo thời gian thực, thay vì bạn phải xuất file hay copy mã màu thủ công. Agent không "đoán" thiết kế mà đọc đúng token gốc, tức là màu chính xác theo mã hex, spacing theo giá trị pixel, font theo tên thực và component theo cấu trúc thực của dự án.

Bước 1: Tạo thiết kế trong Google Stitch

Trước khi kết nối, cần có một dự án thiết kế trong Stitch làm nguồn thông tin gốc hoặc nếu có file Figma đã thiết kế sẵn rồi thì tải lên làm thiết kế cho dự án. Mình đã có bài trước đây nói rõ về Stitch rồi mọi người có thể tham khảo ở đây hoặc nếu đã có web, app đã chạy rồi thì có thể sử dụng tính năng redesign của Stitch.

Sau khi Stitch tạo ra giao diện thì nhớ chia từng phần ví dụ như trang chủ, tin tức, sản phẩm trước khi chuyển sang Antigravity. Đặt tên dự án rõ ràng vì tên này sẽ được dùng để gọi qua MCP. Ví dụ: LaunchPad.

Bước 2: Tạo API key và cấu hình MCP trong Antigravity

Tạo API key từ Stitch

Trong Stitch, nhấp vào ảnh hồ sơ góc trên bên phải, chọn Stitch settings, vào phần API key rồi nhấn Create key. Sao chép key ngay vì nó chỉ hiển thị một lần và lưu vào nơi an toàn.

Cách lấy API Key của Google Stitch
Cách lấy API Key của Google Stitch

Kết nối MCP trong Antigravity

Mở Antigravity IDE, vào Agent Manager (CMD+E trên Mac hoặc CTRL+E trên Windows), tạo workspace mới đặt tên ví dụ LaunchPad-Project và trỏ về thư mục local của dự án. Sau đó chúng ta có hai cách để thực hiện

Cách đầu tiên là prompt thẳng cho AI agent tự thực hiện các bước kết nối Antigravity tới Stitch thông qua MCP ví dụ “"Tôi đã có API key từ Stitch là đây [API key của Stitch] thực hiện các bước kết nối tới Stitch qua MCP và cuối cùng kiểm tra lại các kết nối.". Từ đó AI agent sẽ tự thực hiện các bước còn việc của chúng ta là ngồi chờ và accept các bước nếu AI agent cần cấp quyền.

Cách thứ hai thì chúng ta sẽ thực hiện thủ công các bước nhưng đừng lo lắng vì các bước thực hiện khá đơn giản và nhanh, mình đã thử và làm hoàn toàn nhanh hơn so với agent trong Antigravity vì thực sự cứ chạy một bước lại phải Retry trong Antigravity rất khó chịu. Các bước như sau:

  • Trong Agent Manager, chọn MCP Servers
  • Tìm kiếm "Stitch" và nhấn Install
  • Dán API key vào trường cấu hình khi được hỏi
Copy API key Google Stitch vào Antigravity
Copy API key Google Stitch vào Antigravity
  • Có thể kiểm tra kết nối bằng cách gõ vào cuộc trò chuyện: Kiểm tra các dự án Stitch đã kết nối thành công
  • Nếu agent trả về tên dự án LaunchPad thì kết nối đã thành công.

    Bước 3: Vòng lặp Stitch Loop từ thiết kế đến code

    Đây là phần cốt lõi của quy trình và cũng là điểm khác biệt lớn nhất so với cách làm truyền thống. Google gọi đây là "Stitch Loop" vì nó tạo ra vòng lặp liên tục giữa thiết kế và code thay vì một chiều từ designer sang developer.

    Giai đoạn tìm nạp ngữ cảnh thiết kế

    Trong cuộc trò chuyện Antigravity, gõ lệnh để agent tìm nạp toàn bộ DNA thiết kế:

    Agent sẽ gọi Stitch qua MCP, lấy toàn bộ token thiết kế bao gồm bảng màu hex, thang font, giá trị spacing, tên component và cấu trúc layout rồi lưu vào file DESIGN.md trong thư mục dự án của bạn. File này trở thành nguồn thông tin duy nhất mà mọi component sẽ tham chiếu.

    File DESIGN.md lấy trong Antigravity (nguồn Google)
    File DESIGN.md lấy trong Antigravity (nguồn Google)

    Giai đoạn tạo code

    Sau khi có DESIGN.md, giao cho agent xây dựng từng phần theo đúng token thiết kế:

    Agent tạo cấu trúc dự án React với Tailwind, viết từng component dựa trên token trong DESIGN.md, không dùng giá trị cứng. Điều này đảm bảo code và thiết kế luôn đồng bộ.

    Giai đoạn xác minh "Vibe Check"

    Antigravity có trình duyệt tích hợp cho phép agent mở localhost và so sánh trực quan với bản thiết kế Stitch gốc. Gõ:

    Agent liệt kê chính xác những điểm sai lệch và tự sửa theo token gốc. Đây là vòng lặp Stitch Loop: thiết kế trong Stitch, code trong Antigravity, xác minh qua trình duyệt, sửa theo token, lặp lại cho đến khi pixel-perfect.

    Bước 4: Đóng gói DESIGN.md thành skill tái sử dụng

    Đây là phần mọi người không hay để ý nhưng quan trọng nếu bạn làm nhiều dự án. File DESIGN.md được tạo ra từ quy trình trên chứa toàn bộ hệ thống thiết kế của một dự án cụ thể, nhưng bạn có thể đóng gói nó thành một skill Antigravity để tái sử dụng sang các dự án khác mà không cần lặp lại bước thiết lập từ đầu.

    Cấu trúc file DESIGN.md chuẩn để đóng gói

    Một DESIGN.md tốt nên có các phần sau để agent có thể đọc nhất quán:

    • Color tokens: Tên biến và giá trị hex cho từng màu trong hệ thống, ví dụ --color-primary: #1a1a2e, --color-accent: #7c3aed
    • Typography: Tên font, thang kích thước, line height và font weight cho heading, body và caption
    • Spacing scale: Bảng khoảng cách theo đơn vị px hoặc rem cho padding, margin và gap
    • Component inventory: Danh sách component, trạng thái (hover, active, disabled) và biến thể
    • Layout rules: Grid columns, breakpoints và max-width

    Chuyển DESIGN.md thành skill Antigravity

    Tạo thư mục .antigravity/skills/stitch-design/ trong workspace và đặt DESIGN.md vào đó cùng với file SKILL.md mô tả cách dùng skill này:

    Khi bật skill này trong một workspace mới, agent tự động đọc DESIGN.md trước khi viết bất kỳ component nào, đảm bảo mọi code đều tuân theo hệ thống thiết kế đã định nghĩa dù bạn không cần nhắc lại mỗi lần.

    Tái sử dụng cho dự án khác

    Khi bắt đầu dự án mới với hệ thống thiết kế tương tự, bạn chỉ cần cập nhật giá trị token trong DESIGN.md mà không cần viết lại toàn bộ hướng dẫn. Agent đọc file mới, áp dụng token mới, giữ nguyên quy trình. Đây là cách biến một lần thiết lập thành quy trình chuẩn dùng được mãi.

    Quy trình Stitch và Antigravity qua MCP không chỉ tiết kiệm thời gian ở bước chuyển đổi thiết kế sang code mà còn giải quyết vấn đề thường gặp hơn là duy trì sự nhất quán khi thiết kế thay đổi. Khi bạn cập nhật màu sắc hay khoảng cách trong Stitch, bạn chỉ cần chạy lại lệnh fetch token, cập nhật DESIGN.md và agent tự biết phải sửa gì trong codebase thay vì bạn phải tự tìm và thay thủ công từng giá trị.

    Thảo luận (0)

    Đăng nhập để tham gia thảo luận.

    Chưa có bình luận nào. Hãy là người đầu tiên!

    Các bài viết liên quan

    Anthropic vừa ra mắt model cực kì mạnh mẽ Claude Fable 5

    Anthropic đã thả một quả bom đến thế giới với AI với Claude Fable 5 và nó đã trở thành model được bàn tán nhiều nhất tuần này. Không chỉ vì sức mạnh của nó, mà vì cái cách Anthropic đưa nó ra thế giới: đây là lần đầu tiên một model thuộc dòng Mythos class được phép tiếp cận người dùng thông thường, sau hai tháng bị giữ kín vì lý do an toàn. Fable 5 là gì và tại sao nó khác các model trước? Về bản chất, Fable 5 không phải một model xây từ đầu mà là phiên bản "an toàn hóa" của Mythos 5, tức model mạnh nhất Anthropic từng xây dựng. Hồi tháng 4/2026, Mythos Preview chỉ được cấp quyền truy cập cho một nhóm rất nhỏ các tổ chức như AWS, Apple, Google, Cisco và JPMorgan Chase thông qua Project Glasswing, bởi khả năng phát hiện và khai thác lỗ hổng phần mềm của nó quá mạnh để tung ra đại trà. Anthropic cũng đã ra mắt Claude Opus 4.8 trước đó như một bước đệm trong lộ trình phát triển dòng model thế hệ mới này. Để đưa được Mythos ra ngoài, Anthropic mất thêm hai tháng xây dựng các lớp classifier chạy song song. Đây là những AI chuyên biệt phân tích yêu cầu trước khi model chính xử lý, và khi phát hiện câu hỏi thuộc vùng nhạy cảm, hệ thống tự động chuyển sang Claude Opus 4.8 mà không tính thêm phí. Anthropic cho biết cơ chế này chỉ kích hoạt trong chưa đến 5% số phiên làm việc, nghĩa là phần lớn người dùng thông thường sẽ không nhận thấy sự khác biệt nào so với Mythos 5 thuần. Fable 5 và Mythos 5 có cùng mức giá: $10/triệu token đầu vào và $50/triệu token đầu ra, thấp hơn một nửa so với Mythos Preview trước đây. Người dùng gói Pro, Max, Team và Enterprise được dùng miễn phí đến hết ngày 22/6/2026. Từ ngày 23/6, Anthropic chuyển sang tính phí theo lượng dùng cho đến khi hạ tầng đủ mạnh để đưa model trở lại gói cố định. Fable 5 khác Mythos 5 như thế nào ở phần bảo mật? Dù cùng chia sẻ một model nền, Fable 5 và Mythos 5 là hai sản phẩm khác nhau về mặt thiết kế. Sự khác biệt nằm hoàn toàn ở các lớp classifier an toàn được tích hợp bên trên model gốc. Ba lớp classifier mà Fable 5 có, Mythos 5 không có Fable 5 được trang bị ba lớp phân loại an toàn chạy song song với model chính, gồm: an ninh mạng (Cybersecurity), sinh học và hóa học (Biology and Chemistry) và chưng cất (Distillation). Khi người dùng gửi yêu cầu thuộc các vùng này, Fable 5 tự động chuyển sang xử lý bằng Claude Opus 4.8 thay vì model chính, đồng thời thông báo rõ cho người dùng biết. Mythos 5 không có các lớp lọc này. Nó giữ nguyên toàn bộ khả năng khai thác lỗ hổng phần mềm và nghiên cứu sinh học mà Anthropic đánh giá là quá nguy hiểm để phân phối rộng rãi. Đó là lý do Mythos 5 vẫn chỉ dành cho nhóm hạn chế trong Project Glasswing, bao gồm các chuyên gia phòng thủ mạng, tổ chức hạ tầng trọng yếu và nhà nghiên cứu sinh học được cấp quyền. Hiệu suất thực tế bị ảnh hưởng ra sao? Sự khác biệt về classifier dẫn đến kết quả đo lường khác nhau đáng kể trong các tác vụ chuyên biệt. Trên benchmark ExploitBench dành riêng cho an ninh mạng, Mythos 5 đạt 78%, trong khi Fable 5 chỉ đạt gần mức 40% của Opus 4.8, bởi cơ chế fallback kích hoạt ngay khi phát hiện các yêu cầu liên quan đến tấn công mạng. Với nghiên cứu khoa học, Mythos 5 có thể thiết kế protein và tạo giả thuyết mới với tốc độ gấp 10 lần phương pháp trước, trong khi những khả năng này bị giới hạn trong Fable 5 để đảm bảo an toàn. Nếu bạn là nhà nghiên cứu hoặc làm việc trong lĩnh vực an ninh mạng hợp pháp, cần lưu ý rằng Fable 5 có thể tự động chuyển hướng một số yêu cầu sang Opus 4.8, ngay cả khi ngữ cảnh hoàn toàn hợp lệ. Anthropic thừa nhận điều này và đang tiếp tục cải thiện độ chính xác của classifier. Hiệu năng thực tế: con số nói gì? Trên benchmark SWE-Bench Pro dành cho lập trình, Fable 5 đạt 80,3%, so với 69,2% của Opus 4.8 và 58,6% của GPT-5.5. Con số ấn tượng hơn đến từ môi trường thực tế: Stripe dùng Fable 5 để di trú toàn bộ codebase Ruby 50 triệu dòng trong một ngày, trong khi cả nhóm kỹ sư làm thủ công cần hơn hai tháng cho cùng tác vụ đó. Với phân tích kinh doanh, Fable 5 là model đầu tiên vượt mốc 90% trên bộ kiểm tra analytics phức tạp của Hex, cao hơn Opus 4.8 tới 10 điểm phần trăm. IMC, một công ty giao dịch tài chính, cho biết model đạt điểm gần như tuyệt đối trên bộ đánh giá nội bộ bao gồm tra cứu dữ kiện, suy luận nhân quả và tính toán giá trị kỳ vọng. Điểm khác biệt lớn nhất so với các model trước nằm ở khả năng duy trì tập trung trong tác vụ dài nhiều ngày mà không cần con người giám sát từng bước. Thay vì nhận lệnh và chạy từng câu lệnh rời rạc, Fable 5 có thể tiếp nhận một dự án lớn, tự lập kế hoạch, chạy kiểm thử và xử lý lỗi theo vòng lặp, hoạt động gần với cách một kỹ sư làm việc hơn là một công cụ trả lời câu hỏi. Fable 5 hiện có trên Claude API với model ID claude-fable-5, đồng thời hỗ trợ trên Amazon Bedrock và Google Vertex AI dành cho doanh nghiệp theo gói tiêu thụ. Notion tích hợp Fable 5: từ ghi chú rời rạc đến kế hoạch hoàn chỉnh Notion là một trong những ứng dụng đầu tiên tích hợp Fable 5, và lý do khá dễ hiểu. Loại tác vụ mà Fable 5 xử lý tốt nhất, cụ thể là đọc nhiều nguồn dữ liệu rời rạc, tổng hợp và tạo ra cấu trúc có logic, chính xác là những gì người dùng Notion cần nhất trong công việc hằng ngày. Simon Last, đồng sáng lập Notion, mô tả use case chính là biến ghi chú cuộc họp lộn xộn thành bảng công việc có phân công và thứ tự ưu tiên. Thay vì người dùng phải đọc lại toàn bộ biên bản, tóm tắt và tạo task thủ công, Fable 5 thực hiện toàn bộ chuỗi đó mà không cần được nhắc từng bước. Chưa có thông báo gì với Notion về Fable 5 sau ngày 22/6. Sau mốc đó, chi phí chưa biết sẽ tính toán như thế nào với Notion AI nếu rẻ hơn chính chủ Anthropic thì thật là tuyệt vời. Một số điều cần lưu ý trước khi dùng Fable 5 mạnh, nhưng có hai điểm đáng cân nhắc trước khi đưa vào quy trình làm việc thực tế. Thứ nhất, mức giá $50/ 1 triệu token đầu ra là khá cao so với mặt bằng chung, phù hợp với tác vụ kỹ thuật hoặc phân tích phức tạp, nhưng không nhất thiết phải dùng cho các tác vụ đơn giản mà Sonnet hay Haiku xử lý tốt với chi phí thấp hơn nhiều. Thứ hai, lớp classifier bảo vệ hoạt động tốt trong hầu hết trường hợp nhưng cũng có thể kích hoạt nhầm trong một số ngữ cảnh nghiên cứu hợp lệ, điều mà Anthropic thừa nhận và đang tiếp tục cải thiện. Với người dùng cá nhân đang ở gói Pro hoặc Max, những ngày còn lại trước mốc 22/6 là đủ để đánh giá xem Fable 5 có thực sự với giá đó có tạo ra được lợi nhuận không trước khi quyết định có nên trả thêm tiền hay không.

    Nam
    10 thg 6, 2026
    Claude Code tự điều phối công việc với Dynamic Workflows

    Bài đăng của Thariq Shihipar từ team Claude Code đã gây chú ý lớn trong cộng đồng sử dụng AI. Anh ấy tiết lộ Dynamic Workflows, tính năng cho phép Claude tự thiết kế quy trình làm việc thay vì chỉ chờ lệnh, và đây được coi là bản nâng cấp quan trọng nhất kể từ khi Claude Code có skills và subagents. Tính năng này là khái niệm harness làm bản chất để giải thích các yêu cầu kĩ thuật. Ba lỗi chí mạng nào khiến AI agent thất bại ở nhiệm vụ phức tạp Trước khi nói về giải pháp, Thariq chỉ ra một thực tế khó chịu: hầu hết AI agent hiện nay đều gặp vấn đề nghiêm trọng khi xử lý nhiệm vụ phức tạp, đa bước trong một cửa sổ ngữ cảnh duy nhất. Ông phân loại chúng thành ba dạng thất bại cốt lõi mà gần như mọi hệ thống agent đều mắc phải. Khi AI lười biếng bằng cách tự tuyên bố xong dù mới làm nửa việc Đây là hiện tượng Agentic Laziness, khi agent thực hiện một phần công việc rồi tự báo cáo là đã hoàn thành. Ví dụ cụ thể: bạn yêu cầu agent review 50 file code, nhưng nó chỉ xem qua 20 file rồi kết luận rằng mọi thứ ổn. Nguyên nhân nằm ở giới hạn cửa sổ ngữ cảnh, khi lượng thông tin quá lớn, agent có xu hướng đi tắt để hoàn thành nhanh hơn. Agent sẽ tự thiên vị bản thân nó đúng không Agent tự thiên thị nó gọi là Self-Preferential Bias, điều này xảy ra khi bạn yêu cầu agent kiểm tra lại kết quả của chính nó. Giống như nhờ một học sinh tự chấm bài thi, agent có xu hướng nghiêng về phía kết quả mà nó đã tạo ra, dẫn đến xác nhận thiếu phê phán và bỏ qua các lỗi tiềm ẩn. Điều này đặc biệt nguy hiểm trong các nhiệm vụ đòi hỏi độ chính xác cao. Làm sao để agent không mất dần ý định ban đầu qua mỗi bước Hiện tượng trôi mất mục tiêu (Goal Drift) là hiện tượng agent dần quên mục tiêu ban đầu sau nhiều bước xử lý hoặc sau quá trình nén ngữ cảnh (context compaction). Những ràng buộc cụ thể như "không làm X" hoặc các trường hợp quan trọng có thể bị loại bỏ khi bộ nhớ bị tóm tắt lại vì vậy kết quả cuối cùng lệch khỏi yêu cầu gốc mà agent không hề nhận ra. Dynamic Workflows giúp Claude tự viết bộ khung điều phối công việc Giải pháp của Anthropic không phải là làm model thông minh hơn, mà là thay đổi cách Claude tổ chức công việc. Dynamic Workflows biến Claude từ agent viết code thành agent thiết kế quy trình vận hành cho công việc phức tạp. Khái niệm cốt lõi ở đây là tự tổ chức (self-organization): Claude có thể tự phân tích mục tiêu, chọn chế độ làm việc phù hợp và tạo ra quy trình nội bộ trước khi bắt tay vào thực hiện. Harness tùy chỉnh thay vì quy trình cố định Thay vì hoạt động trong một môi trường cố định, Claude viết một bộ khung harness bằng JavaScript được thiết kế riêng cho từng nhiệm vụ. Harness này đóng vai trò như một quản lý dự án: nó chia nhỏ công việc, khởi tạo các sub-agent chuyên biệt cho từng phần, chỉ định công cụ phù hợp, định tuyến công việc đến các model khác nhau và thực hiện xác minh đối kháng (adversarial verification) để đảm bảo chất lượng. Harness hoạt động như thế nào? Để hiểu rõ hơn, hãy hình dung harness như một kịch bản sân khấu mà Claude tự soạn trước khi diễn. Khi nhận được một nhiệm vụ phức tạp, Claude không lao vào làm ngay mà dừng lại để viết một đoạn JavaScript mô tả toàn bộ quy trình: cần bao nhiêu sub-agent, mỗi agent làm gì, thứ tự thực hiện ra sao và kết quả từ agent này được chuyển cho agent kia như thế nào. Ví dụ cụ thể: nếu bạn yêu cầu Claude audit 1.000 tin nhắn Slack để tìm sự cố lặp lại, harness có thể trông như thế này về mặt logic: Agent 1 (phân loại): đọc toàn bộ tin nhắn và gán nhãn theo chủ đề Agent 2, 3, 4 (xử lý song song): mỗi agent phân tích sâu một nhóm chủ đề riêng Agent 5 (tổng hợp): gom kết quả từ ba agent trên, loại bỏ trùng lặp Agent 6 (kiểm tra chéo): đọc lại kết quả tổng hợp và phản biện độc lập Điểm quan trọng là Claude viết harness này dựa trên đặc điểm cụ thể của từng nhiệm vụ, không phải theo một khuôn mẫu cứng nhắc. Nhiệm vụ khác nhau sẽ cho ra harness khác nhau, và đó chính là lý do tính năng này được gọi là "dynamic". Harness được viết bằng JavaScript và chạy trong môi trường Claude Code. Bạn có thể kích hoạt Dynamic Workflows bằng cách nói “use a workflow” tuy nhiên từ này rất dễ bị nhầm với workflow thông thường vì vậy mọi người nên dùng từ khóa "ultracode" trong câu lệnh thì sẽ phân rõ workflow thông thường và Dynamic Workflow để tiết kiệm token hơn. Cô lập ngữ cảnh để ngăn sự suy thoái của ngữ cảnh Một trong những thiết kế thông minh nhất của Dynamic Workflows là tính năng Isolation. Mỗi sub-agent được cấp cửa sổ ngữ cảnh riêng biệt, hoàn toàn độc lập với các agent khác. Điều này ngăn chặn hiện tượng suy thoái ngữ cảnh (context rot) tức sự suy giảm chất lượng khi ngữ cảnh bị quá tải, đồng thời triệt tiêu cả Agentic Laziness lẫn Goal Drift vì mỗi agent chỉ tập trung vào phần việc nhỏ được giao. Sáu mẫu điều phối có thể tái sử dụng Claude có thể kết hợp sáu mẫu điều phối sẵn có để xử lý đa dạng tình huống: Phân loại và hành động: phân loại đầu vào rồi chọn hành động phù hợp Phân chi và tổng hợp: chia công việc ra nhiều nhánh song song rồi tổng hợp kết quả Kiểm tra chéo: dùng agent khác kiểm tra chéo kết quả Tạo và lọc: tạo nhiều phương án rồi lọc ra phương án tốt nhất Tạo ra giải đấu: cho các phương án "đấu đối khảng trực tiếp với nhau rồi loại dần Vòng lặp: lặp lại cho đến khi đạt tiêu chuẩn chất lượng Có thể tối ưu chi phí khi sử dụng Dynamic Workflows không Chạy nhiều sub-agent song song nghe có vẻ tốn kém, nhưng thực tế Dynamic Workflows được thiết kế để tối ưu chi phí theo một số cách cụ thể. Định tuyến thông minh đến model phù hợp Không phải mọi bước trong quy trình đều cần model mạnh nhất. Harness cho phép Claude định tuyến từng tác vụ đến model phù hợp với độ phức tạp của nó: các bước phân loại đơn giản có thể chạy trên model nhỏ hơn và rẻ hơn, trong khi chỉ những bước đòi hỏi suy luận sâu mới cần đến model lớn. Kết quả là tổng chi phí thường thấp hơn so với việc chạy toàn bộ quy trình trên một model duy nhất. Cô lập ngữ cảnh giúp giảm token tiêu thụ Vì mỗi sub-agent chỉ nhận đúng phần ngữ cảnh cần thiết cho công việc của mình, tổng lượng token tiêu thụ trên toàn bộ quy trình thường thấp hơn đáng kể so với cách tiếp cận truyền thống, khi toàn bộ lịch sử hội thoại được nhồi vào một cửa sổ ngữ cảnh duy nhất ngày càng phình to. Tránh làm lại công việc nhờ kiểm tra lại sớm Harness có thể cài các điểm kiểm tra chất lượng (checkpoint) giữa các bước. Nếu một bước cho ra kết quả không đạt yêu cầu, hệ thống dừng và xử lý lại đúng bước đó thay vì chạy tiếp toàn bộ quy trình rồi mới phát hiện lỗi ở cuối. Cách này tiết kiệm đáng kể chi phí cho các tác vụ dài nhiều bước. Nếu bạn lo ngại về chi phí, hãy bắt đầu với các tác vụ có khối lượng vừa phải để quan sát mức tiêu thụ token thực tế trước khi mở rộng quy mô. Ứng dụng thực tế của Dynamic Workflow như thế nào Điều khiến Thariq hào hứng nhất không phải là khả năng code, mà là việc Dynamic Workflows mở rộng Claude Code sang các nhiệm vụ phi kỹ thuật. Tính năng này có thể kích hoạt bằng ngôn ngữ tự nhiên (ví dụ: "use a workflow") hoặc từ khóa "ultracode." Các ứng dụng thực tế bao gồm: Audit hàng nghìn tin nhắn trên Slack để tìm sự cố lặp lại Xếp hạng và sàng lọc bộ hồ sơ ứng viên lớn một cách có hệ thống Chạy giải đấu loại trực tiếp tự động để chọn tên tốt nhất cho CLI tool Xử lý các nhiệm vụ vận hành đòi hỏi độ chính xác cao mà trước đây chỉ con người mới làm được Triết lý thiết kế là ràng buộc kiến trúc thay vì trí tuệ thô Điểm đáng chú ý nhất trong cách tiếp cận của Anthropic là triết lý thiết kế: thay vì cố gắng tăng trí thông minh thô của model, họ xây dựng các ràng buộc kiến trúc (architectural constraints) vào quy trình làm việc. Nói cách khác, thay vì hy vọng model tự biết cách tránh lỗi, họ thiết kế hệ thống sao cho lỗi khó xảy ra ngay từ đầu, và harness chính là công cụ thực thi triết lý đó. Dynamic Workflows cho thấy bước tiến tiếp theo của AI agent không nằm ở model thông minh hơn mà ở khả năng tự thiết kế quy trình. Giống cách một quản lý giỏi phân chia công việc cho đội ngũ thay vì tự làm tất cả, Claude giờ đây có thể tự tổ chức đội ngũ sub-agent của mình, và đây là tín hiệu rõ ràng rằng tương lai của AI coding không chỉ còn là viết code nhanh hơn mà là tổ chức công việc tốt hơn.

    Nam
    5 thg 6, 2026
    Microsoft tung 7 mô hình AI mới thách thức OpenAI

    Microsoft vừa tung cùng lúc 7 mô hình AI mới tại Build 2026, trong đó MAI-Thinking-1 sở hữu 35 tỉ tham số và được huấn luyện hoàn toàn từ dữ liệu sạch. Đây là lần đầu tiên gã khổng lồ phần mềm công khai thách thức vị thế của chính đối tác chiến lược OpenAI trên sân chơi mô hình AI. MAI-Thinking-1 và tham vọng suy luận AI của riêng Microsoft Tâm điểm của sự kiện Build 2026 chính là MAI-Thinking-1, mô hình AI suy luận đầu tiên do Microsoft tự phát triển từ đầu. Với khoảng 35 tỉ tham số hoạt động, mô hình này được thiết kế để xử lý các tác vụ đòi hỏi suy luận nhiều bước, làm việc với ngữ cảnh dài và hỗ trợ lập trình phức tạp, tất cả với chi phí thấp hơn so với nhiều mô hình AI quy mô lớn hiện nay. Điểm đáng chú ý nhất là Microsoft khẳng định MAI-Thinking-1 được huấn luyện từ dữ liệu sạch, không sử dụng phương pháp chắt lọc (distillation) từ các mô hình AI của bên thứ ba. Nói cách khác, đây là lời tuyên bố rõ ràng rằng Microsoft đủ năng lực nghiên cứu AI độc lập mà không cần "mượn" tri thức từ GPT hay bất kỳ mô hình nào khác. Theo kết quả đánh giá mà Microsoft công bố, MAI-Thinking-1 đạt hiệu suất cạnh tranh trong các bài kiểm tra lập trình và được đánh giá tương đương nhiều mô hình AI hàng đầu hiện nay trong các thử nghiệm đánh giá mù. Con số 35 tỉ tham số cũng cho thấy Microsoft đang hướng tới hiệu quả thay vì chạy đua kích thước, vì nhiều mô hình đối thủ có số tham số lớn hơn gấp nhiều lần nhưng chưa chắc đã vượt trội về chất lượng đầu ra. Từ lập trình đến giọng nói: hệ sinh thái AI khép kín Không chỉ dừng ở mô hình suy luận, Microsoft còn giới thiệu thêm 6 mô hình AI mới nhằm xây dựng một hệ sinh thái AI hoàn chỉnh phục vụ cả người dùng cá nhân lẫn doanh nghiệp. Từ lập trình, tạo ảnh cho đến giọng nói, mỗi mảnh ghép đều có mô hình chuyên biệt. Lập trình thông minh hơn với MAI-Code-1-Flash Đối với các lập trình viên, MAI-Code-1-Flash là tin vui lớn. Mô hình này chuyên về sinh mã nguồn và hỗ trợ phát triển phần mềm, được tối ưu hóa cho các tác vụ lập trình thực tế. Điều quan trọng hơn là nó sẽ được tích hợp trực tiếp vào GitHub Copilot và Visual Studio Code, hai công cụ mà hàng triệu lập trình viên sử dụng hằng ngày. Điều này có nghĩa là trải nghiệm gợi ý mã nguồn và viết code tự động sẽ được nâng cấp đáng kể ngay trên môi trường làm việc quen thuộc. Hình ảnh và giọng nói: hai mảnh ghép còn thiếu Ở mảng sáng tạo nội dung, Microsoft công bố MAI-Image-2.5 cùng phiên bản MAI-Image-2.5-Flash. Đây là các mô hình tạo sinh và chỉnh sửa hình ảnh thế hệ mới, trong đó phiên bản Flash được tối ưu cho khả năng phản hồi nhanh, phù hợp với các ứng dụng cần xử lý thời gian thực như chỉnh sửa ảnh trực tiếp hay tạo hình minh họa theo yêu cầu. Về lĩnh vực âm thanh, Microsoft giới thiệu hai mô hình quan trọng: MAI-Voice-2 với khả năng tổng hợp giọng nói tự nhiên hơn và hỗ trợ thêm nhiều ngôn ngữ mới MAI-Transcribe-1.5 chuyển đổi giọng nói thành văn bản với tốc độ xử lý nhanh hơn đáng kể so với thế hệ trước Ngoài ra, Microsoft cũng phát triển thêm những biến thể được tối ưu riêng cho nền tảng Microsoft Foundry, giúp doanh nghiệp dễ dàng xây dựng và triển khai ứng dụng AI của riêng mình. Chiến lược giảm phụ thuộc OpenAI Nếu như trước đây Microsoft chủ yếu được nhìn nhận là đối tác cung cấp hạ tầng và nền tảng triển khai cho OpenAI, thì Build 2026 cho thấy hãng đang từng bước sở hữu đầy đủ các mảnh ghép quan trọng trong hệ sinh thái AI. Microsoft hiện đã có mô hình suy luận, mô hình lập trình, mô hình tạo ảnh, mô hình tổng hợp giọng nói và mô hình nhận dạng giọng nói, tất cả được kết nối trực tiếp với hệ sinh thái Azure, Copilot và Microsoft Foundry. Chiến lược này giúp Microsoft chủ động hơn trong việc phát triển công nghệ cốt lõi, đồng thời giảm rủi ro khi phụ thuộc vào các đối tác bên ngoài. Cụ thể hơn, việc sở hữu mô hình AI riêng cho phép Microsoft kiểm soát lộ trình sản phẩm, tối ưu chi phí vận hành và tùy chỉnh mô hình theo nhu cầu cụ thể của từng dịch vụ mà không phải chờ đợi hay đàm phán với bên thứ ba. Cuộc đua mô hình AI sẽ đi về đâu? Việc ra mắt đồng thời 7 mô hình AI mới cho thấy Microsoft đang đầu tư mạnh vào các công nghệ nền tảng nhằm cạnh tranh trực tiếp với những tên tuổi lớn như OpenAI, Google hay Anthropic. Khi đối tác lớn nhất của OpenAI quyết định tự xây mô hình AI riêng, đó là tín hiệu rõ ràng nhất rằng cuộc đua AI đã bước sang giai đoạn mới, nơi không ai muốn đặt tương lai công nghệ của mình vào tay kẻ khác. Với các nhà phát triển và doanh nghiệp, đây là lúc để theo dõi sát nền tảng Microsoft Foundry và hệ sinh thái Azure AI, vì những công cụ mà trước đây chỉ có OpenAI mới cung cấp sắp xuất hiện ngay trong hệ sinh thái Microsoft quen thuộc. Build 2026 có thể sẽ được nhớ đến như thời điểm Microsoft chính thức phát đi tuyên ngôn về một hệ sinh thái AI độc lập, toàn diện và mang đậm dấu ấn riêng.

    Nam
    4 thg 6, 2026
    Claude Code, NotebookLM và Obsidian cho nghiên cứu thông minh hơn

    Rất nhiều người vẫn nghiên cứu theo cách thủ công: mở hàng chục tab, xem video, đọc bài viết, ghi chú rời rạc rồi mất thêm thời gian tự tổng hợp. Bài viết long-form của monokern trên X gợi ý một cách làm khác: dùng Claude Code để điều phối, NotebookLM để phân tích nguồn và Obsidian để lưu trí nhớ dài hạn. Khi kết hợp đúng, đây không còn là một lần tìm kiếm thông tin mà trở thành một workflow AI có khả năng tích lũy qua từng phiên làm việc. Ý tưởng cốt lõi khá thực dụng: Claude Code không cần tự làm mọi thứ trong một context đắt đỏ. Nó có thể gọi công cụ, chạy skill, tạo file và chuyển phần xử lý nặng sang NotebookLM. Sau đó toàn bộ kết quả được lưu về Obsidian dưới dạng markdown để lần nghiên cứu tiếp theo có ngữ cảnh tốt hơn. Theo tác giả, phần thiết lập ban đầu có thể hoàn thành trong khoảng dưới 30 phút nếu máy đã có các công cụ cần thiết. Vì sao bộ ba này hoạt động tốt với nhau? Điểm mạnh của workflow này nằm ở việc mỗi công cụ chỉ đảm nhiệm một lớp rõ ràng. Claude Code đóng vai trò execution engine: nhận yêu cầu bằng ngôn ngữ tự nhiên, gọi skill, chạy lệnh, quản lý file và điều phối toàn bộ pipeline. Thay vì bắt người dùng thao tác từng bước, Claude Code trở thành người vận hành hệ thống. NotebookLM là lớp phân tích. Công cụ của Google có thể đọc nguồn, tóm tắt, tạo phân tích, flashcard, mindmap, infographic hoặc audio overview. Khi Claude Code đẩy phần đọc nguồn sang NotebookLM, người dùng tận dụng hạ tầng xử lý của Google thay vì đốt toàn bộ token Claude cho việc nghiền dữ liệu dài. Obsidian là lớp trí nhớ. Mọi kết quả sau khi phân tích được lưu thành markdown trong vault cá nhân. Qua thời gian, vault này trở thành kho tri thức có cấu trúc gồm chủ đề, nguồn, nhận định, pattern và kết luận. Claude Code có thể đọc lại các file đó để hiểu người dùng quan tâm điều gì, thích format nào và thường đánh giá vấn đề theo hướng nào. Skill Creator biến workflow thành công cụ tái sử dụng Phần quan trọng đầu tiên trong hướng dẫn là cài Skill Creator trong Claude Code. Đây là lớp cho phép người dùng mô tả một kỹ năng bằng ngôn ngữ tự nhiên, sau đó Claude Code tạo cấu trúc skill, cài đặt và biến nó thành lệnh có thể gọi lại. Nói cách khác, thay vì mỗi lần nghiên cứu lại prompt từ đầu, người dùng đóng gói thao tác thành một skill riêng. Ví dụ đầu tiên trong bài là tạo skill tìm kiếm YouTube. Skill này dùng yt-dlp để tìm video theo truy vấn, lấy metadata như tiêu đề, kênh, lượt xem, thời lượng, ngày đăng, URL và tỷ lệ view trên subscriber. Với nghiên cứu thị trường nội dung, dữ liệu này quan trọng hơn danh sách link thông thường vì nó cho biết nguồn nào đang thật sự thu hút sự chú ý. NotebookLM là nơi xử lý phần phân tích nặng Bài viết đề xuất kết nối Claude Code với NotebookLM thông qua dự án notebooklm-py vì NotebookLM chưa có public API chính thức. Sau khi cài và xác thực tài khoản Google, Claude Code có thể dùng skill riêng để tạo notebook mới, thêm nguồn như URL YouTube, văn bản hoặc file, rồi yêu cầu NotebookLM sinh phân tích hoặc deliverable. Điểm đáng chú ý là NotebookLM không chỉ tóm tắt. Trong một pipeline nghiên cứu thực tế, nó có thể nhận 10 video liên quan đến một chủ đề, phân tích xem framework nào đang tăng trưởng, framework nào bị thổi phồng, đâu là điểm tranh luận trong cộng đồng và khoảng trống nội dung nào chưa được ai khai thác tốt. Phần xử lý này tốn thời gian, nhưng chủ yếu diễn ra ở phía NotebookLM. Pipeline hoàn chỉnh: một lệnh để nghiên cứu cả chủ đề Khi đã có skill YouTube search và skill NotebookLM, bước tiếp theo là tạo một pipeline skill kết hợp cả hai. Người dùng chỉ cần đưa chủ đề, ví dụ nghiên cứu các AI agent framework trong năm 2026, rồi pipeline sẽ tự tìm nguồn liên quan, tạo notebook, thêm nguồn, chạy phân tích và trả kết quả thành markdown. Trong ví dụ của monokern, pipeline tìm 10 nguồn video, đẩy sang NotebookLM, tạo phân tích, sinh infographic và lưu lại kết quả vào Obsidian. Tổng thời gian xử lý được mô tả khoảng 6 phút, trong đó phần lớn là thời gian NotebookLM xử lý nguồn. Giá trị thực tế nằm ở việc người dùng không phải tự mở từng tab, copy từng link hay tự tổng hợp metadata. Kết quả cuối cùng không chỉ là một đoạn trả lời trong chat. Nó gồm phân tích đầy đủ, danh sách nguồn, chỉ số tương tác, nhận định về xu hướng, deliverable trực quan và file markdown được lưu vào vault. Đây là điểm khiến workflow này khác với một chatbot hỏi đáp thông thường. Obsidian khiến hệ thống thông minh hơn theo thời gian Phần thú vị nhất là Obsidian. Nếu chỉ chạy một lần, workflow này đã tiết kiệm thời gian. Nhưng nếu chạy đều đặn, mỗi file markdown mới sẽ làm kho tri thức cá nhân dày hơn. Sau một tháng, Claude Code có thể nhìn thấy các chủ đề bạn quay lại nhiều lần, loại insight bạn đánh giá cao và cách bạn muốn dữ liệu được trình bày. Tác giả cũng nhấn mạnh vai trò của file claude.md trong vault. Đây có thể trở thành nơi mô tả quy ước làm việc, phong cách phân tích và format đầu ra mong muốn. Sau mỗi vài phiên nghiên cứu, người dùng có thể yêu cầu Claude Code đọc lại kết quả gần đây và cập nhật file này để phản ánh cách làm việc mới. Điểm mạnh thật sự là cấu trúc, không phải YouTube YouTube chỉ là nguồn dữ liệu trong ví dụ. Cấu trúc pipeline mới là phần có giá trị. Người dùng có thể thay YouTube bằng PDF học thuật, báo cáo ngành, tài liệu public, trang web, file local, transcript hoặc tài liệu Google Drive. Miễn là Claude Code có cách truy cập và đưa nguồn vào lớp phân tích, template vận hành vẫn giữ nguyên. Điều này mở ra nhiều ứng dụng thực tế: nghiên cứu một hệ sinh thái crypto bằng whitepaper và tài liệu public, phân tích một công nghệ mới qua talk hội nghị, tìm khoảng trống nội dung trong một niche, hoặc theo dõi động lực thị trường từ báo cáo công khai. Với mỗi trường hợp, pipeline vẫn gồm ba lớp: lấy nguồn, phân tích, lưu tri thức. Cần lưu ý gì trước khi áp dụng? Workflow này mạnh nhưng không phải dành cho mọi người. Nó yêu cầu người dùng quen với Claude Code, có Obsidian vault, biết cài công cụ CLI như yt-dlp và chấp nhận dùng một thư viện không chính thức để kết nối NotebookLM. Ngoài ra, vì NotebookLM và YouTube có thể thay đổi giao diện hoặc hạn chế truy cập, các skill nên được xem như công cụ cần bảo trì chứ không phải giải pháp cài một lần mãi mãi. Dù vậy, ý tưởng đằng sau rất đáng chú ý: thay vì dùng AI như một hộp chat rời rạc, hãy biến AI thành một hệ thống nghiên cứu có bộ nhớ, có pipeline và có khả năng học từ lịch sử làm việc của chính bạn. Với những người thường xuyên phân tích thị trường, công nghệ hoặc nội dung, đây là một hướng triển khai thực dụng hơn rất nhiều so với việc mở 10 tab rồi tự tổng hợp mọi thứ bằng tay.

    Nam
    2 thg 6, 2026