Quay lại trang tin tức

Claude nâng cấp 1 triệu token context window miễn phí

Xuất bản vào 16 tháng 03, 2026
Claude nâng cấp 1 triệu token context window miễn phí

Tóm tắt nhanh

Anthropic vừa gây chấn động ngành công nghiệp AI khi công bố 1 triệu token context window cho Claude Opus 4.6 và Sonnet 4.6 với mức giá tiêu chuẩn, loại bỏ hoàn toàn phụ phí cho ngữ cảnh dài. Động thái này đối lập hoàn toàn với các đối thủ như Google và OpenAI, buộc cả ngành phải xem xét lại cách định giá của mình, đồng thời mang lại lợi ích đáng kể về hiệu suất và chi phí cho người dùng. Bài viết cũng nhấn mạnh chất lượng vượt trội của Claude trong việc duy trì ngữ cảnh dài và nâng cấp giới hạn media quan trọng.

Trong một động thái được đánh giá là 'lật ngược bàn cờ' trong ngành công nghiệp AI, Anthropic vừa công bố một nâng cấp mang tính cách mạng: cung cấp 1 triệu token context window cho các phiên bản Claude Opus 4.6 và Sonnet 4.6 với mức giá tiêu chuẩn. Điều đáng nói là không hề có bất kỳ phụ phí nào cho ngữ cảnh dài, một chính sách hoàn toàn đối lập với hầu hết các nhà cung cấp AI khác, bao gồm cả Google và OpenAI, những người thường tăng giá theo giới hạn ngữ cảnh.

Claude với một triệu token context window có giá bao nhiêu?

Đây là điểm thay đổi cực lớn mà Anthropic mang lại. Một triệu token tương đương với khoảng 750.000 từ, đủ để xử lý 10 đến 15 cuốn tiểu thuyết đầy đủ chỉ trong một lần. Con số này có ý nghĩa to lớn trong các tình huống làm việc thực tế:

  • Thay vì phải chia nhỏ codebase hay tài liệu thành từng phần, người dùng có thể đưa toàn bộ dự án vào một phiên làm việc duy nhất, giúp AI làm việc với nó như một khối thống nhất.
  • Claude có thể giữ nguyên toàn bộ thông tin từ đầu đến cuối khi phân tích hàng nghìn trang hợp đồng pháp lý, loại bỏ nguy cơ mất ngữ cảnh giữa chừng.
  • Các kỹ thuật xử lý ngữ cảnh dài phức tạp trước đây như chia nhỏ tài liệu, tóm tắt có mất mát hoặc xóa context giữa chừng để giải phóng bộ nhớ, giờ đây đều không còn cần thiết.

Cấu trúc giá mới không phụ phí ở một triệu token

Điều làm ngạc nhiên nhất là cấu trúc giá mới hoàn toàn không có phụ phí cho ngữ cảnh dài. Mức giá tiêu chuẩn được áp dụng cho toàn bộ từ 1 đến 1 triệu token:

  • Opus 4.6: 5$ đầu vào và 25$ đầu ra mỗi 1 triệu token.
  • Sonnet 4.6: 3 $ la đầu vào và 15 $ đầu ra mỗi 1 triệu token.

Để dễ hình dung, trước đây, khi sử dụng context window vượt quá 200.000 token, nhiều nhà cung cấp thường tính thêm phụ phí từ 2 đến 4 lần. Đặc biệt, người dùng Claude Code với các gói Pro (20 $), Max (100 $), Team và Enterprise đều tự động nhận được 1 triệu token context window khi sử dụng Opus 4.6 mà không cần thêm tín dụng sử dụng.

Claude Opus 4.6 có thực sự nhớ hết 1 triệu token không?

Một câu hỏi thường gặp khi tăng kích thước context window là liệu chất lượng suy luận có bị ảnh hưởng. Anthropic đã giải đáp mối lo ngại này bằng các kết quả benchmark ấn tượng.

Claude Opus 4.6 đạt 78,3% trên MRCR v2 – một bài đo khả năng tìm lại thông tin ẩn trong lượng văn bản khổng lồ. Đây là mức cao nhất so với tất cả các model tiên tiến hiện tại ở cùng độ dài ngữ cảnh.

Để so sánh:

  • Độ chính xác của GPT giảm đáng kể, chỉ đạt 36% ở 1 triệu context.
  • Gemini thậm chí còn thể hiện kém hơn, chỉ ở mức 26%, cho thấy các mô hình này đã "quên" đến ⅓ những gì đã được cung cấp trước đó khi đạt đến ngữ cảnh dài.

Với Sonnet 4.6, khả năng ghi nhớ hơn ⅔ ngữ cảnh dài càng chứng tỏ vị thế dẫn đầu của Anthropic trong việc xử lý thông tin phức tạp.

Biểu đồ so sánh Claude với Gemini, GPT trong 1M token
Biểu đồ so sánh Claude với Gemini,GPT trong 1M token

Giới hạn media của Claude tăng gấp 6 lần lên 600 ảnh mỗi request

Bên cạnh context window, một nâng cấp khác tuy ít được chú ý nhưng lại vô cùng quan trọng là giới hạn media. Giới hạn này đã tăng lên 600 ảnh hoặc trang PDF mỗi request, gấp 6 lần so với mức 100 trước đó. Điều này đặc biệt có ý nghĩa với những người làm việc chuyên sâu với các tác vụ yêu cầu xử lý nhiều tài liệu trực quan hoặc PDF, điều này thực sự có ý nghĩa đối với những người dùng gói Pro, Max của Claude cứ chạm token limit liên tục và lại tiếp tục phải chờ.

Giảm đáng kể chi phí sử dụng cho doanh nghiệp

Tính năng đột phá này có sẵn ngay trên Claude Platform, Microsoft Azure Foundry và Google Cloud Vertex AI. Đối với người dùng Claude Code trên các gói Max, Team và Enterprise sử dụng Opus 4.6 thì 1 triệu token context window đã được bật mặc định mà không cần cài đặt thêm. Điều này không chỉ nâng cao hiệu suất mà còn làm giảm đáng kể chi phí cho các hệ thống AI thường xuyên gọi API của Claude, mang lại lợi ích kinh tế lớn cho các doanh nghiệp và nhà phát triển.

Thảo luận (0)

Đăng nhập để tham gia thảo luận.

Chưa có bình luận nào. Hãy là người đầu tiên!

Các bài viết liên quan

Anthropic tăng giới hạn sử dụng Claude sau hợp tác với SpaceX

Anthropic vừa công bố hợp tác với SpaceX để tiếp cận hơn 220.000 GPU NVIDIA và ngay lập tức dùng năng lực điện toán mới này để tăng giới hạn sử dụng cho Claude Code lẫn API. Đây là những gì thay đổi và tại sao điều đó quan trọng với người dùng. Tại sao Anthropic lại hợp tác với SpaceX? Trong vài tháng gần đây, Anthropic liên tục ký kết các thỏa thuận điện toán quy mô lớn với Amazon, Google, Microsoft và NVIDIA. Lần này, hãng tiếp tục bổ sung thêm một tên tuổi không ai ngờ tới là SpaceX. Theo thông báo ngày 6/5, Anthropic đã ký thỏa thuận sử dụng toàn bộ năng lực tính toán tại trung tâm dữ liệu Colossus 1 của SpaceX tương đương với hơn 300 megawatt công suất và hơn 220.000 GPU NVIDIA. Toàn bộ năng lực này sẽ được đưa vào sử dụng trong vòng một tháng và sẽ cải thiện trực tiếp trải nghiệm cho người dùng Claude Pro và Claude Max. Colossus 1 là trung tâm dữ liệu AI của SpaceX, hiện là một trong những cụm GPU lớn nhất thế giới. Anthropic là đơn vị thuê toàn bộ năng lực tại đây. Những thay đổi cụ thể về giới hạn sử dụng Nhờ nguồn điện toán mới, Anthropic đã thực hiện ba thay đổi có hiệu lực ngay từ ngày công bố Tăng gấp đôi giới hạn Claude Code theo giờ Giới hạn tốc độ 5 giờ của Claude Code được nhân đôi cho các gói Pro, Max, Team và Enterprise. Nếu trước đây bạn chỉ sử dụng được 10 lệnh chạy Claude Code phức tạp nay được nhân đôi lên thành 20 lần, thay đổi này sẽ giúp ích đáng kể. Tuy nhiên lưu ý là quan trọng là giới hạn tuần (week limit) vẫn giữ nguyên không thay đổi gì cho nên việc tăng giới hạn 5 giờ giúp bạn làm việc cường độ cao hơn trong thời gian ngắn, nhưng có thể khiến bạn chạm mức trần của tuần nhanh hơn. Bỏ giới hạn giờ cao điểm Trước đây, Claude Code tự động giảm giới hạn sử dụng trong khung giờ cao điểm (thường từ 9h sáng đến 3h chiều) đối với tài khoản Pro và Max. Giới hạn này đã được xóa bỏ hoàn toàn vì vậy người dùng giờ đây có thể sử dụng Claude Code với tốc độ đầy đủ bất kể thời điểm trong ngày. Với người dùng thường làm việc vào buổi tối (trùng với giờ bên Mỹ) đây là thay đổi có khả năng có tác động rõ rệt nhất. Tăng mạnh giới hạn API cho các mô hình Claude Opus Giới hạn tốc độ API (rate limit) cho các mô hình Claude Opus được nâng lên đáng kể . Chi tiết mức tăng bằng lần được Anthropic công bố trong bảng sau đây: Thay đổi này đặc biệt quan trọng với các nhà phát triển đang xây dựng ứng dụng trên nền tảng Claude Code Toàn cảnh chiến lược điện toán của Anthropic Thỏa thuận với SpaceX không phải động thái đơn lẻ. Trong vài tháng gần đây, Anthropic đã xây dựng một danh mục đầu tư hạ tầng rất đáng chú ý: Thỏa thuận lên tới 5 gigawatt với Amazon, trong đó gần 1 GW sẽ hoạt động trước cuối 2026 Thỏa thuận 5 GW với Google và Broadcom, dự kiến đưa vào vận hành từ 2027 Quan hệ đối tác chiến lược với Microsoft và NVIDIA, bao gồm 30 tỷ USD năng lực Azure Đầu tư 50 tỷ USD vào hạ tầng AI tại Mỹ cùng Fluidstack Và nay, hơn 300 megawatt từ trung tâm Colossus 1 của SpaceX Anthropic chạy Claude trên nhiều nền tảng phần cứng khác nhau — AWS Trainium, Google TPU và GPU NVIDIA — và cho biết vẫn đang tiếp tục tìm kiếm thêm các nguồn năng lực tính toán mới. Đáng chú ý, trong khuôn khổ thỏa thuận với SpaceX, hai bên cũng bày tỏ quan tâm đến việc phát triển năng lực điện toán AI trên quỹ đạo tức là đặt GPU trên vệ tinh. Đây vẫn là ý tưởng ở giai đoạn rất sớm, nhưng nếu thành hiện thực sẽ là bước ngoặt lớn cho hạ tầng AI toàn cầu. Mở rộng ra thị trường quốc tế Một phần năng lực điện toán mở rộng sẽ được dùng để phục vụ khách hàng doanh nghiệp quốc tế đặc biệt trong các lĩnh vực yêu cầu lưu trữ dữ liệu nội địa như tài chính, y tế và chính phủ. Thỏa thuận với Amazon bao gồm cả năng lực suy luận bổ sung tại châu Á và châu Âu. Anthropic cũng nhấn mạnh rằng họ chỉ mở rộng sang các quốc gia có khung pháp lý dân chủ và chuỗi cung ứng phần cứng an toàn cho thấy một lập trường thể hiện sự thận trọng trong bối cảnh cạnh tranh địa chính trị về AI đang ngày càng gay gắt. Điều này có ý nghĩa gì với người dùng Claude tại Việt Nam? Ở góc độ thực tế, ba thay đổi về giới hạn sử dụng mang lại lợi ích trực tiếp nhất cho những ai đang dùng Claude Code hàng ngày — đặc biệt là lập trình viên và người làm việc liên tục với Claude Code.Việc xóa giới hạn giờ cao điểm cũng có nghĩa là trải nghiệm của người dùng tại Việt Nam (vốn trùng múi giờ với giai đoạn tải nặng tại Mỹ) sẽ ổn định hơn. Về dài hạn, năng lực điện toán lớn hơn thường đồng nghĩa với khả năng triển khai các mô hình mạnh hơn, với chi phí thấp hơn. Đây là nền tảng để Anthropic tiếp tục cạnh tranh với OpenAI và Google trong cuộc đua AI 2026. Anthropic luôn luôn phát triển Anthropic đang đầu tư nghiêm túc vào hạ tầng và hợp tác với SpaceX là bước đi mới nhất trong chiến lược đó. Kết quả gần nhất mà người dùng có thể cảm nhận ngay là Claude Code ít bị giới hạn hơn và tốc độ API chắc chắn sẽ cải thiện. Còn về lâu dài, cuộc chạy đua điện toán giữa các công ty AI lớn hứa hẹn sẽ còn nhiều diễn biến thú vị trong năm 2026.

Nam
8 thg 5, 2026
Claude tích hợp toàn bộ Microsoft 365: Excel, PowerPoint, Word và Outlook đều có trợ lý AI

Anthropic đã ra mắt Claude vào Excel, PowerPoint, Word trước đó và rồi còn mở public beta cho Outlook. Nếu bạn đang theo dõi lịch sử phát hành của Anthropic trong vài tháng gần đây, câu hỏi không còn là họ sẽ ra tính năng gì tiếp theo mà là có phần mềm nào họ chưa nhảy vào không? Claude giờ đã phổ biến trong toàn bộ ứng dụng văn phòng của Microsoft rồi Kể từ nay, tất cả người dùng có gói trả phí đều có thể cài Claude vào bộ ứng dụng văn phòng của Microsoft. Claude for Excel, PowerPoint và Word đã ra mắt từ lâu trong khi Claude for Outlook bước vào giai đoạn thử nghiệm công khai cho toàn bộ các gói trả phí. Điểm khác biệt lớn nhất so với các trợ lý AI văn phòng khác nằm ở chỗ Claude không hoạt động như một chatbot bị nhốt trong từng ứng dụng riêng lẻ. Thay vào đó, ngữ cảnh cuộc hội thoại được duy trì xuyên suốt khi bạn di chuyển giữa các ứng dụng từ Outlook sang Word, rồi Excel, rồi PowerPoint mà không cần giải thích lại từ đầu. Claude for Microsoft 365 có thể cài đặt qua Microsoft AppSource. Một gói duy nhất bao gồm Excel, PowerPoint và Word tuy nhiên có một gói riêng dành cho Outlook. Người dùng có thể triển khai tập trung từ trung tâm quản lý của Microsoft. [VIDEO: F6dzjaBCBtU |Claude for Microsoft 365 (Anthropic)|Claude for Microsoft 365(Anthropic)] Từng ứng dụng làm được gì với Claude? Excel thì đã qua thời chỉ giải thích công thức Claude for Excel đọc được bảng tính nhiều trang, giải thích công thức kèm tham chiếu theo từng ô, xây dựng mô hình tài chính với công thức thực tế và cập nhật các giả định mà không làm vỡ cấu trúc phụ thuộc. Mọi thay đổi đều được theo dõi và hiển thị rõ ràng người dùng luôn biết Claude đã sử dụng ô nào. PowerPoint làm việc trực tiếp trong slide của bạn Đây là điểm đáng chú ý nhất: Claude for PowerPoint đọc cấu trúc slide gốc, nhận diện phông chữ, màu sắc và bố cục hiện có, rồi tạo nội dung mới theo đúng phong cách đó. Biểu đồ tạo ra là biểu đồ PowerPoint gốc có thể chỉnh sửa hoàn toàn, không phải ảnh chụp từ nơi khác dán vào. Word chỉnh sửa có theo dõi và phản hồi bình luận Claude for Word hoạt động theo cách các biên tập viên sẽ thích: mọi chỉnh sửa đều xuất hiện dưới dạng thay đổi có theo dõi, và Claude có thể phản hồi trực tiếp vào các luồng bình luận kể cả giải thích lý do nó sửa gì và tại sao. Không có gì được lưu hoặc gửi đi cho đến khi bạn xác nhận. Outlook (thử nghiệm) sắp xếp hộp thư đến bằng một câu lệnh Claude for Outlook phân loại thư theo ba nhóm: cần bạn trả lời, có thể soạn sẵn thay bạn, và có thể bỏ qua. Các email được soạn thảo xuất hiện ngay trong khung soạn thư của Outlook với đầy đủ người nhận, tiêu đề và nội dung, bạn chỉ cần đọc lại và nhấn gửi đây hoàn toàn những điều mà Claude có thể thực hiện với Gmail. Ngữ cảnh xuyên suốt tính năng nghe quen nhưng hiếm khi thực sự hoạt động Anthropic mô tả kịch bản điển hình như sau: nhận thư trong Outlook, mở tài liệu đính kèm trong Word để soạn bản ghi nhớ, chuyển sang Excel để xây dựng phân tích, rồi biến tất cả thành bộ slides trong PowerPoint và tất nhiên là Claude nhớ hết ngữ cảnh qua từng bước đó. Quan trọng hơn, các tệp có thể mở song song và thay đổi sẽ được đồng bộ: điều chỉnh một giả định trong Excel và con số trong bản ghi nhớ Word cùng biểu đồ trong PowerPoint sẽ tự cập nhật theo. Lịch sử hội thoại được lưu theo từng file tức là bạn có thể đóng thanh công cụ, tắt máy, mở lại ngày hôm sau và tiếp tục đúng chỗ đã dừng. Claude for Microsoft 365 còn hỗ trợ nhập liệu bằng giọng nói thay vì gõ phím. Dành cho doanh nghiệp chắc chắn sẽ phải đầy đủ sự kiểm soát và tuân thủ Với quản trị viên cấp doanh nghiệp, Anthropic bổ sung khả năng cấu hình để truyền toàn bộ các câu lệnh, lệnh gọi công cụ và tham chiếu tài liệu về hệ thống thu thập riêng của tổ chức — giúp đội bảo mật biết chính xác Claude đã làm gì trong từng phiên làm việc. Giao diện phân tích còn phân tách hoạt động theo từng người dùng, từng ứng dụng và từng ngày. Về định tuyến, tổ chức có thể kết nối Claude thông qua tài khoản trực tiếp hoặc qua các nền tảng đám mây hiện có như Amazon, Google Cloud hay Microsoft. Khách hàng Microsoft 365 Copilot cũng có thể truy cập các mô hình Claude trực tiếp trong Excel và PowerPoint. Các quy trình được lưu lại dưới dạng kỹ năng và hoạt động nhất quán trên cả bốn ứng dụng. Khi một quy trình được chuẩn hóa, toàn bộ nhóm có thể dùng theo cùng một cách. Cả thế giới phần mềm đang chạy theo Anthropic Không phải ngoa khi nói rằng Anthropic đang ở giai đoạn phát hành với tốc độ khiến nhiều đối thủ phải giật mình. Chỉ trong vài tháng gần đây: công cụ lập trình Claude Code liên tục cập nhật, hệ sinh thái kết nối mở rộng nhanh chóng, bộ công cụ dành cho trình duyệt và máy tính để bàn được bổ sung, và giờ là cả bốn ứng dụng văn phòng của Microsoft cùng lúc. Microsoft lâu nay vốn đang đặt cược lớn vào Copilot với mô hình độc quyền ChatGPT từ trước đến nay thì nay mở cửa cho Claude vào chính hệ sinh thái của mình. Điều đó nói lên rất nhiều về vị thế hiện tại của Anthropic, tuy nhiên câu chuyện thực sự sẽ do người dùng quyết định: liệu Claude trong Excel, Word, Outlook, Power point có thực sự thay thế được thói quen dùng Microsoft 365 của anh em văn phòng không.

Nam
8 thg 5, 2026
HTML sẽ thay thế Markdown khi làm việc với AI ?

Markdown đã là chuẩn mặc định khi làm việc với AI suốt nhiều năm nhưng một kỹ sư đến từ Claude Code tại Anthropic vừa đặt ra câu hỏi đáng suy nghĩ: liệu thói quen đó có thực sự là lựa chọn tốt nhất? Bài viết ngắn của Thariq Shihipar thu hơn 15.000 lượt thích trên X chỉ trong vài ngày, và lý do thuyết phục hơn bạn nghĩ. Markdown ra đời từ thời AI còn nghèo token Nhìn lại thời GPT-4 với cửa sổ ngữ cảnh chỉ 8.192 token, Markdown là lựa chọn hoàn toàn hợp lý trong khi đó HTML cồng kềnh hơn, tốn tài nguyên hơn và trong bối cảnh hạn chế đó, sự tối giản của Markdown là một ưu điểm thực sự chỉ để tiết kiệm. Vì vậy Markdown trở thành chuẩn ngầm định, và thói quen đó theo chúng ta đến tận bây giờ.Ngay cả khi Anthropic tạo ra khái niệm Skill trên Claude họ cũng đã lấy Markdown làm tiêu chuẩn với file SKILL.md, những ai hay làm việc với skill chắc chắn hiểu rõ điều mặc định này. Tuy nhiên, các mô hình AI hiện tại đã vận hành ở quy mô hoàn toàn khác. Nhiều mô hình đang hỗ trợ cửa sổ ngữ cảnh từ 200.000 đến 1 triệu token, và chi phí xử lý không còn là rào cản đáng lo (theo lời của Thariq Shihipar) và anh ấy lập luận rằng đây chính là thời điểm để xem lại mặc định đó. HTML làm được gì mà Markdown không thể? Lý do cốt lõi Thariq đưa ra khá đơn giản: một số loại thông tin vốn có tính không gian nhưng Markdown buộc chúng phải trở thành văn bản tuyến tính. Khi bạn so sánh ba hướng tiếp cận kỹ thuật thì bạn cần nhìn chúng cạnh nhau, không phải đọc lần lượt rồi cố giữ trong đầu. Khi bạn xem lại một đoạn code bạn cần thấy cấu trúc thay đổi tất nhiên không phải một bức tường chữ. HTML giải quyết đúng vấn đề đó vì vậy Thariq đã liệt kê 9 nhóm tình huống cụ thể mà HTML vượt trội hơn Markdown: Khám phá và lên kế hoạch: So sánh nhiều hướng tiếp cận cạnh nhau thay vì đọc tuần tự, rồi chuyển thành kế hoạch triển khai có sơ đồ luồng và mốc thời gian. Xem lại mã nguồn và hiểu cấu trúc dự án: Phần thay đổi được chú thích trực tiếp bằng màu sắc theo mức độ nghiêm trọng, sơ đồ mô-đun dạng hộp và mũi tên — thay vì văn bản thuần túy. Thiết kế giao diện: Bảng màu hiển thị thực tế có thể sao chép ngay, các biến thể thành phần giao diện được dựng trực tiếp thay vì mô tả bằng chữ. Tạo nguyên mẫu nhanh: Bảng điều chỉnh hiệu ứng chuyển động có thanh kéo thông số, màn hình có thể nhấp thực sự, đây là thứ Markdown không thể biểu đạt. Sơ đồ và hình minh họa: Đồ họa véc-tơ nội tuyến cho phép vẽ lưu đồ thực sự, không phải ký tự ASCII ghép lại. Bộ trình chiếu: Vài thẻ <section> và 20 dòng mã JavaScript là một bộ slide điều hướng bằng phím mũi tên mà không cần phần mềm chuyên dụng hay bước xuất file. Nghiên cứu và học tập: Tài liệu có phần thu gọn, tab mã, bảng chú giải thuật ngữ — thay vì đổ toàn bộ nội dung theo một chiều dọc. Báo cáo định kỳ: Bản tóm tắt trạng thái hàng tuần với biểu đồ nhỏ và màu sắc phân biệt tiến độ khiến người đọc thực sự đọc, không chỉ lướt qua. Giao diện chỉnh sửa tùy chỉnh: Bảng phân loại nhiệm vụ kéo thả, trình chỉnh cờ tính năng có cảnh báo phụ thuộc đây là công cụ thực sự, không phải văn bản đọc rồi thôi. Thariq đã tập hợp 20 file minh họa tất cả các nhóm này tại thariqs.github.io/html-effectiveness mỗi file mở thẳng trên trình duyệt, không cần cài đặt gì thêm. Dùng HTML với AI như thế nào trong thực tế? Cách áp dụng không phức tạp mà chỉ cần thay đổi cách bạn viết prompt. Thay vì để mô hình tự chọn định dạng đầu ra, hãy chỉ định rõ HTML khi nội dung cần được xem xét, tương tác, hoặc chia sẻ với người khác. Ví dụ câu lệnh Thariq gợi ý để xem lại một đoạn mã: Giúp tôi xem xét PR này bằng cách tạo một tài liệu HTML mô tả nó. Tôi không quen lắm với logic streaming/backpressure nên hãy tập trung vào phần đó. Hiển thị diff thực tế với các chú thích lề nội tuyến, mã màu các phát hiện theo mức độ nghiêm trọng và bất cứ thứ gì khác cần thiết để diễn đạt khái niệm một cách rõ ràng. Tương tự, bạn có thể yêu cầu AI tạo kế hoạch triển khai dưới dạng HTML với mốc thời gian và sơ đồ luồng dữ liệu, hoặc bản báo cáo trạng thái hàng tuần với biểu đồ nhỏ và màu sắc phân biệt tiến độ. Simon Willison tác giả blog kỹ thuật nổi tiếng cũng đã thừa nhận bài viết này khiến ông nhìn lại thói quen dùng Markdown từ thời GPT-4 cho đến tận thời điểm hiện tại. Khi các mô hình AI hiện đại có thể nhúng đồ họa véc-tơ, tiện ích tương tác và điều hướng nội trang, Markdown không còn là lựa chọn mặc định hiển nhiên nữa. Markdown vẫn còn chỗ đứng tất nhiên không phải ở mọi nơi Thariq không nói luôn luôn sử dụng HTML mà anh ấy phân biệt khá rõ: Markdown phù hợp cho trò chuyện thông thường, đoạn mã ngắn, câu trả lời vài dòng, và bất cứ thứ gì thuần văn bản trong khi đó HTML phát huy sức mạnh khi đầu ra cần bố cục không gian, màu sắc, khả năng tương tác, hoặc cấu trúc phức tạp đó là khi nội dung đủ nhiều chiều để Markdown bắt đầu làm phẳng thông tin thay vì truyền tải nó. Cộng đồng đã phản ứng khá nhanh: một skil mang tên html-artifacts đã xuất hiện trên GitHub, giúp AI tự nhận biết khi nào nên tạo file HTML thay vì Markdown bao gồm 9 nhóm tình huống từ bài viết gốc của Thariq hoàn toàn có thể sử dụng với bất cứ model nào hỗ trợ đọc skill. Đặc biệt skill này phần loại trừ rõ ràng cho câu trả lời ngắn và đầu ra chỉ có mã code. Mọi người có thể tham khảo tại github.com/dogum/html-artifacts. Trong bài Thariq không nhắc đến JSON nhưng đây cũng là định dạng hay sử dụng với AI đặc biệt đối với những ai hay dùng n8n, Make hay Zapier. Mặc dù vậy mỗi định dạng mang đến một màu sắc riêng trong những tình huống riêng. Markdown, HTML và JSON phân chia sử dụng như thế nào Cuộc tranh luận thực ra không chỉ là Markdown hay HTML. JSON cũng là định dạng phổ biến khi làm việc với AI, đặc biệt trong các luồng xử lý dữ liệu và tích hợp hệ thống. Ba định dạng này phục vụ ba mục đích khác nhau, và hiểu rõ ranh giới đó giúp bạn chọn đúng công cụ cho từng tình huống. Markdown tốt nhất cho văn bản đọc trực tiếp trong chat: ghi chú, giải thích ngắn, đoạn mã, tài liệu đơn giản. Nhanh, nhẹ, không cần mở thêm gì. HTML tốt nhất khi đầu ra cần được nhìn, tương tác hoặc chia sẻ: báo cáo có bố cục, sơ đồ, bảng so sánh, bộ trình chiếu, giao diện tùy chỉnh. Mở bằng trình duyệt là xong. JSON tốt nhất khi đầu ra cần được máy đọc tiếp: lưu trữ dữ liệu có cấu trúc, truyền giữa các hệ thống, hoặc làm đầu vào cho bước xử lý tiếp theo. Con người đọc được nhưng không phải để đọc. Nói cách khác, JSON không cạnh tranh với HTML hay Markdown về mặt trình bày mà nó phục vụ một mục đích hoàn toàn khác. Vấn đề thực sự nằm ở chỗ nhiều người dùng AI mặc định nhận đầu ra dưới dạng Markdown ngay cả khi họ cần HTML để xem, hoặc cần JSON để xử lý tiếp. Chỉ cần chỉ định rõ trong câu lệnh, AI sẽ điều chỉnh theo. Quy tắc chọn nhanh: Đầu ra để đọc trong chat → Markdown. Đầu ra để xem trên trình duyệt → HTML. Đầu ra để máy xử lý tiếp → JSON. Điều này có làm thay đổi gì với người dùng AI thông thường? Nếu bạn dùng AI chủ yếu để hỏi đáp hoặc viết lách, thay đổi này ít tác động hơn. Nhưng nếu bạn đang dùng AI để làm nhiều việc hơn như phân tích dữ liệu, lên kế hoạch dự án, xem lại tài liệu, tổng hợp nghiên cứu, hay tạo báo cáo cho đồng nghiệp đây là điều chỉnh nhỏ trong cách prompt nhưng tạo ra khoảng cách rõ rệt về chất lượng đầu ra, dù bạn đang dùng công cụ AI nào. Bạn nên thử một lần: lần tới khi cần AI so sánh các lựa chọn hoặc tóm tắt một tài liệu phức tạp, thêm vào cuối câu lệnh "tạo dưới dạng file HTML ". Mở file đó trên trình duyệt và so sánh với cách bạn vẫn làm với Markdown hay JSON thì kết quả thường nói lên tất cả.

Nam
10 thg 5, 2026
Google I/O 2026: Antigravity 2.0 cải tiến lớn nhưng giao diện lại giống Codex

Tại sự kiện Google I/O 2026, gã khổng lồ tìm kiếm đã khiến toàn bộ cộng đồng lập trình viên ngỡ ngàng khi chính thức công bố Antigravity 2.0. Không còn là một IDE tích hợp AI thông thường Antigravity giờ đây lột xác thành một ứng dụng desktop độc lập vận hành bởi Gemini 3.5 Flash, đi kèm gói đăng ký AI Ultra trị giá $100/tháng. Tuy nhiên, việc loại bỏ hoàn toàn trình soạn thảo mã nguồn tích hợp để chuyển sang một giao diện tối giản kiểu Codex đang tạo nên làn sóng tranh cãi dữ dội. Antigravity 2.0 có bước chuyển mình như thế nào Quyết định tách biệt hoàn toàn trình soạn thảo mã nguồn ra khỏi Antigravity 2.0 đánh dấu một bước đi táo bạo của Google trong việc định hình lại tương lai của phát triển phần mềm. Thay vì cố gắng tích hợp các tính năng AI vào một IDE truyền thống, phiên bản mới này hoạt động như một trung tâm điều phối AI agent chuyên dụng. Điều này có nghĩa là người dùng sẽ tập trung hoàn toàn vào việc thiết lập nhiệm vụ và giám sát các luồng công việc thay vì trực tiếp chỉnh sửa từng dòng code. Sự thay đổi này được thể hiện rõ ràng nhất qua việc ra mắt gói dịch vụ AI Ultra trị giá $100 mỗi tháng. Đây là gói đăng ký cao cấp cung cấp giới hạn sử dụng gấp 5 lần so với gói AI Pro hiện tại, hướng tới các doanh nghiệp và nhà phát triển chuyên nghiệp cần vận hành số lượng lớn tác nhân tự chủ cùng lúc để giải quyết các bài toán phức tạp. Sức mạnh từ Gemini 3.5 Flash và quy trình chạy bất đồng bộ Trái tim của Antigravity 2.0 chính là mô hình ngôn ngữ lớn Gemini 3.5 Flash được tối ưu hóa đặc biệt cho các tác vụ agentic tốc độ cao. Nhờ khả năng xử lý vượt trội, hệ thống mới hỗ trợ quy trình làm việc đa tác nhân vô cùng phức tạp, cho phép nhiều subagent cùng tham gia giải quyết một dự án lớn. Cụ thể hơn, các tác nhân phụ này sẽ chạy hoàn toàn bất đồng bộ ở chế độ nền. Cơ chế này đảm bảo rằng giao diện chính của ứng dụng không bao giờ bị đóng băng hay gián đoạn trong suốt quá trình xử lý, giúp lập trình viên duy trì luồng công việc mượt mà. Đây là một cải tiến vượt bậc so với phiên bản tiền nhiệm vốn thường xuyên gặp hiện tượng trễ khi phải xử lý các đoạn mã nguồn lớn. Bộ đôi công cụ mới: Antigravity CLI và SDK Để tăng cường tính linh hoạt cho các lập trình viên, Google đã giới thiệu hai công cụ lập trình mới: Antigravity CLI viết bằng Go thay thế hoàn toàn cho Gemini CLI cũ, mang lại hiệu năng cao và tốc độ phản hồi cực nhanh trong terminal. Gemini CLI và Gemini Code Assist IDE extensions sẽ ngừng phục vụ từ ngày 18/6/2026. Người dùng Google AI Pro và Ultra cần chuyển sang Antigravity CLI trước thời hạn này. Antigravity SDK viết bằng Python cho phép các lập trình viên có thể tự xây dựng, tùy chỉnh cấu hình và tích hợp sâu các tác nhân tự chủ vào dự án. Giao diện tối giản kiểu Codex và làn sóng tranh cãi từ cộng đồng Mặc dù sở hữu nhiều nâng cấp mạnh mẽ về công nghệ, Antigravity 2.0 lại đang phải hứng chịu làn sóng chỉ trích từ cộng đồng người dùng do những thay đổi triệt để về giao diện. Giao diện mới giờ đây chỉ là một console tối giản tập trung vào khung chat để ra lệnh cho tác nhân, loại bỏ hoàn toàn không gian làm việc IDE quen thuộc. Nhiều ý kiến cho rằng thiết kế này trông giống hệt như một bản sao của ứng dụng Codex hay Claude Desktop. Sự tối giản quá mức này khiến không ít lập trình viên cảm thấy hụt hẫng và trống trải vì họ không còn khả năng xem và sửa đổi file trực tiếp một cách nhanh chóng như trước. Việc phải chuyển đổi qua lại giữa Antigravity và một editor bên ngoài làm giảm đáng kể hiệu suất làm việc thực tế của họ. Cách khôi phục trải nghiệm IDE truyền thống cho người dùng Nhằm xoa dịu những phản ứng tiêu cực từ phía cộng đồng, Google đã đưa ra một số giải pháp tình thế cho những ai chưa sẵn sàng thích nghi với giao diện mới. Người dùng có thể truy cập vào trang chủ chính thức của Antigravity để tải xuống một phiên bản IDE riêng biệt. Phiên bản này sẽ giúp khôi phục lại không gian làm việc tích hợp quen thuộc với các tính năng chỉnh sửa mã nguồn truyền thống. Tuy nhiên, Google cũng đưa ra cảnh báo rằng đây chỉ là giải pháp tạm thời. Trong các bản cập nhật tương lai, giao diện quản lý tác nhân sẽ bị loại bỏ hoàn toàn khỏi IDE để hãng dồn toàn bộ nguồn lực phát triển cho ứng dụng độc lập 2.0. Vì vậy, việc làm quen với mô hình làm việc mới là điều không thể tránh khỏi đối với các nhà phát triển trong dài hạn. Sự phát triển ngày càng nhanh của các công cụ như Antigravity và Codex Sự phân tách giữa trình soạn thảo code truyền thống và giao diện điều khiển agent là minh chứng rõ nét cho thấy AI đang dịch chuyển từ công cụ hỗ trợ sang đối tác tự chủ. Các lập trình viên cần chủ động làm quen với các công cụ điều khiển mới như CLI và SDK để chuyển dịch dần vai trò của mình từ người gõ code trực tiếp sang nhà quản lý và điều phối các hệ sinh thái tác nhân thông minh.

Nam
20 thg 5, 2026