Quay lại trang tin tức

Gemini chính thức tích hợp sẵn trong Chrome.

Xuất bản vào 22 tháng 04, 2026
Gemini chính thức tích hợp sẵn trong Chrome.

Tóm tắt nhanh

Google vừa chính thức tích hợp sâu Gemini vào trình duyệt Chrome, cho phép người dùng tóm tắt nội dung, so sánh sản phẩm và hỗ trợ công việc ngay lập tức mà không cần chuyển đổi.

Cuối cùng thì sau bao nhiêu ngày chờ đợi thì Google đã tích hợp Gemini trực tiếp vào trình duyệt Chrome không cần cài thêm extension nào. Chỉ cần click vào biểu tượng Gemini trên thanh công cụ là có ngay trợ lý AI hiểu ngữ cảnh trang web bạn đang đọc và đây là sẽ tin cực vui cho những ai hay duyệt web với Google Chrome.

Gemini trong Chrome là gì và khác extension thông thường như thế nào?

Trước đây để dùng AI hỗ trợ duyệt web, bạn phải cài extension của bên thứ ba như Monica, Sider hay MaxAI. Những extension này hoạt động bằng cách chụp lại nội dung trang rồi gửi lên server của họ, kéo theo hai vấn đề: độ trễ và rủi ro bảo mật vì dữ liệu đi qua một bên trung gian không phải Google hay trình duyệt.

Gemini trong Chrome hoạt động khác hẳn vì nó được tích hợp ở cấp độ trình duyệt, không phải lớp extension. Điều này có nghĩa là Gemini đọc nội dung trang trực tiếp mà không cần sao chép qua bên thứ ba, và nó hiểu ngữ cảnh của tối đa 10 tab bạn đang mở cùng lúc.

Gemini trong Chrome làm được gì cụ thể?

Tóm tắt và hỏi đáp về trang đang đọc

Đây là tính năng cơ bản nhất mình thường xuyên dùng nhất. Ví dụ như bạn đang đọc một bài báo dài hoặc tài liệu kỹ thuật, chỉ cần hỏi "Tóm tắt bài này cho mình" hoặc "Điểm mấu chốt là gì?" và Gemini trả lời ngay dựa trên nội dung trang, không cần copy paste gì cả.

Tính năng tóm tắt của Gemini trong Chrome (nguồn Google)
Tính năng tóm tắt của Gemini trong Chrome (nguồn Google)

Điểm mạnh hơn so với cách dùng ChatGPT hay Gemini web thông thường là bạn không cần sao chép văn bản rồi mở tab khác. Mọi thứ diễn ra ngay trong side panel bên phải trong khi bạn vẫn đọc trang.

So sánh thông tin qua nhiều tab

Đây là tính năng ít ai nói đến nhưng thực tế rất hữu ích. Bạn đang so sánh 5 sản phẩm, mỗi cái mở một tab, Gemini có thể đọc cả 5 tab đó và tổng hợp bảng so sánh cho bạn mà không cần bạn ghi chép thủ công hay mở bảng mới hoặc có thể xuất ngay sang google sheets nếu cần.

Tích hợp với Gmail, Google Calendar và YouTube

Đây là tính năng có thể kéo mình quay lại dùng Google Chrome khi mà Gemini trong Chrome không chỉ đọc trang web bình thường mà còn tích hợp sâu với các dịch vụ Google. Khi bạn đang trong Gmail, bạn có thể hỏi "Tìm email về cuộc họp sắp tới" và Gemini tìm trong hộp thư của bạn, kiểm tra lịch họp rồi soạn email thông báo cho bạn rồi sau đó tích hợp luôn vào Google Calendar, tất cả trong một luồng mà không cần chuyển tab.

Với YouTube, Gemini có thể tóm tắt nội dung video bạn đang xem mà không cần bật caption hay xem hết video.

Auto browse tự động làm việc thay bạn

Đây là tính năng mạnh nhất nhưng hiện chỉ có cho người dùng Google AI Pro và Ultra ở Mỹ. Auto browse cho phép Gemini thực hiện các tác vụ nhiều bước thay bạn như tìm đặt lịch hẹn hay lên kế hoạch đăng bài. Gemini tất nhiên vẫn sẽ dừng lại và hỏi xác nhận trước các hành động nhạy cảm như thanh toán hay đăng bài nên hoàn toàn bạn vẫn kiểm soát được.

So sánh với Copilot trong Edge

Đây là câu hỏi mà nhiều người đã chuyển sang dùng Microsoft Edge giống như mình sẽ hỏi. Copilot cũng được tích hợp sẵn trong Edge theo cơ chế tương tự, nhưng đối với mình thực sự có khá nhiều trải nghiệm không tốt với Copilot trong Microsoft Edge.

  • Tích hợp hệ sinh thái: Nếu bạn đang dùng toàn bộ hệ sinh thái của Google Gmail, Google Calendar, Google Drive thì chắc chắn Gemini rõ ràng có lợi thế hơn vì hiểu sâu hơn các dịch vụ đó trong khi đó Copilot mạnh hơn nếu bạn dùng Microsoft 365 đây đều là những dịch vụ mình không thường xuyên sử dụng.
  • Trải nghiệm thực tế: Copilot trong Edge đã có từ 2023 và theo nhiều người dùng, nó hay đề xuất tìm kiếm Bing nhưng tìm kiếm trên Bing thật sự đẳng cấp vẫn không thể nào so sánh được với Google Search.
  • Vẫn xuất hiện sai sót: Khả năng tóm tắt của Copilot trên Edge vẫn còn khá hời hợt, nhiều khi vẫn xuất hiện sai sót, nó giống như một bản nháp của học sinh: chỉ giúp hiểu nhanh nội dung chính chứ không đủ chất lượng để đưa vào sử dụng thực tế. Còn đối với Gemini không biết có khá hơn được bao nhiêu không, vẫn sẽ là câu hỏi cần nhiều nguồn để trả lời.

Những điều cần biết trước khi dùng

Gemini trong Chrome cần bạn chia sẻ nội dung tab để hoạt động, điều này có nghĩa là Google có thể xử lý nội dung các trang bạn đang xem. Đây là điểm đánh đổi cần cân nhắc nếu bạn thường xuyên làm việc với tài liệu nội bộ, thông tin nhạy cảm hay dữ liệu khách hàng thì tất nhiên bạn vẫn phải kiểm soát, đánh giá chặt chẽ hơn nữa với các thông tin từ Gemini.

Hiện tại Gemini trong Chrome đang triển khai dần theo khu vực và cần Chrome phiên bản mới nhất trên Windows, macOS hoặc Chromebook Plus. Trên di động, Android hỗ trợ qua nút nguồn, còn iOS được tích hợp trực tiếp vào ứng dụng Chrome.

Với người dùng cá nhân dùng hệ sinh thái Google, đây là cập nhật đáng để thử ngay hôm nay. Thay vì mở tab Gemini riêng hay dùng extension của bên thứ ba, bạn có một trợ lý AI trong Google Chrome điều làm mình cân nhắc rất nhiều về việc quay lại sử dụng trình duyệt Google Chrome.

Thảo luận (0)

Đăng nhập để tham gia thảo luận.

Chưa có bình luận nào. Hãy là người đầu tiên!

Các bài viết liên quan

Anthropic vừa ra mắt model cực kì mạnh mẽ Claude Fable 5

Anthropic đã thả một quả bom đến thế giới với AI với Claude Fable 5 và nó đã trở thành model được bàn tán nhiều nhất tuần này. Không chỉ vì sức mạnh của nó, mà vì cái cách Anthropic đưa nó ra thế giới: đây là lần đầu tiên một model thuộc dòng Mythos class được phép tiếp cận người dùng thông thường, sau hai tháng bị giữ kín vì lý do an toàn. Fable 5 là gì và tại sao nó khác các model trước? Về bản chất, Fable 5 không phải một model xây từ đầu mà là phiên bản "an toàn hóa" của Mythos 5, tức model mạnh nhất Anthropic từng xây dựng. Hồi tháng 4/2026, Mythos Preview chỉ được cấp quyền truy cập cho một nhóm rất nhỏ các tổ chức như AWS, Apple, Google, Cisco và JPMorgan Chase thông qua Project Glasswing, bởi khả năng phát hiện và khai thác lỗ hổng phần mềm của nó quá mạnh để tung ra đại trà. Anthropic cũng đã ra mắt Claude Opus 4.8 trước đó như một bước đệm trong lộ trình phát triển dòng model thế hệ mới này. Để đưa được Mythos ra ngoài, Anthropic mất thêm hai tháng xây dựng các lớp classifier chạy song song. Đây là những AI chuyên biệt phân tích yêu cầu trước khi model chính xử lý, và khi phát hiện câu hỏi thuộc vùng nhạy cảm, hệ thống tự động chuyển sang Claude Opus 4.8 mà không tính thêm phí. Anthropic cho biết cơ chế này chỉ kích hoạt trong chưa đến 5% số phiên làm việc, nghĩa là phần lớn người dùng thông thường sẽ không nhận thấy sự khác biệt nào so với Mythos 5 thuần. Fable 5 và Mythos 5 có cùng mức giá: $10/triệu token đầu vào và $50/triệu token đầu ra, thấp hơn một nửa so với Mythos Preview trước đây. Người dùng gói Pro, Max, Team và Enterprise được dùng miễn phí đến hết ngày 22/6/2026. Từ ngày 23/6, Anthropic chuyển sang tính phí theo lượng dùng cho đến khi hạ tầng đủ mạnh để đưa model trở lại gói cố định. Fable 5 khác Mythos 5 như thế nào ở phần bảo mật? Dù cùng chia sẻ một model nền, Fable 5 và Mythos 5 là hai sản phẩm khác nhau về mặt thiết kế. Sự khác biệt nằm hoàn toàn ở các lớp classifier an toàn được tích hợp bên trên model gốc. Ba lớp classifier mà Fable 5 có, Mythos 5 không có Fable 5 được trang bị ba lớp phân loại an toàn chạy song song với model chính, gồm: an ninh mạng (Cybersecurity), sinh học và hóa học (Biology and Chemistry) và chưng cất (Distillation). Khi người dùng gửi yêu cầu thuộc các vùng này, Fable 5 tự động chuyển sang xử lý bằng Claude Opus 4.8 thay vì model chính, đồng thời thông báo rõ cho người dùng biết. Mythos 5 không có các lớp lọc này. Nó giữ nguyên toàn bộ khả năng khai thác lỗ hổng phần mềm và nghiên cứu sinh học mà Anthropic đánh giá là quá nguy hiểm để phân phối rộng rãi. Đó là lý do Mythos 5 vẫn chỉ dành cho nhóm hạn chế trong Project Glasswing, bao gồm các chuyên gia phòng thủ mạng, tổ chức hạ tầng trọng yếu và nhà nghiên cứu sinh học được cấp quyền. Hiệu suất thực tế bị ảnh hưởng ra sao? Sự khác biệt về classifier dẫn đến kết quả đo lường khác nhau đáng kể trong các tác vụ chuyên biệt. Trên benchmark ExploitBench dành riêng cho an ninh mạng, Mythos 5 đạt 78%, trong khi Fable 5 chỉ đạt gần mức 40% của Opus 4.8, bởi cơ chế fallback kích hoạt ngay khi phát hiện các yêu cầu liên quan đến tấn công mạng. Với nghiên cứu khoa học, Mythos 5 có thể thiết kế protein và tạo giả thuyết mới với tốc độ gấp 10 lần phương pháp trước, trong khi những khả năng này bị giới hạn trong Fable 5 để đảm bảo an toàn. Nếu bạn là nhà nghiên cứu hoặc làm việc trong lĩnh vực an ninh mạng hợp pháp, cần lưu ý rằng Fable 5 có thể tự động chuyển hướng một số yêu cầu sang Opus 4.8, ngay cả khi ngữ cảnh hoàn toàn hợp lệ. Anthropic thừa nhận điều này và đang tiếp tục cải thiện độ chính xác của classifier. Hiệu năng thực tế: con số nói gì? Trên benchmark SWE-Bench Pro dành cho lập trình, Fable 5 đạt 80,3%, so với 69,2% của Opus 4.8 và 58,6% của GPT-5.5. Con số ấn tượng hơn đến từ môi trường thực tế: Stripe dùng Fable 5 để di trú toàn bộ codebase Ruby 50 triệu dòng trong một ngày, trong khi cả nhóm kỹ sư làm thủ công cần hơn hai tháng cho cùng tác vụ đó. Với phân tích kinh doanh, Fable 5 là model đầu tiên vượt mốc 90% trên bộ kiểm tra analytics phức tạp của Hex, cao hơn Opus 4.8 tới 10 điểm phần trăm. IMC, một công ty giao dịch tài chính, cho biết model đạt điểm gần như tuyệt đối trên bộ đánh giá nội bộ bao gồm tra cứu dữ kiện, suy luận nhân quả và tính toán giá trị kỳ vọng. Điểm khác biệt lớn nhất so với các model trước nằm ở khả năng duy trì tập trung trong tác vụ dài nhiều ngày mà không cần con người giám sát từng bước. Thay vì nhận lệnh và chạy từng câu lệnh rời rạc, Fable 5 có thể tiếp nhận một dự án lớn, tự lập kế hoạch, chạy kiểm thử và xử lý lỗi theo vòng lặp, hoạt động gần với cách một kỹ sư làm việc hơn là một công cụ trả lời câu hỏi. Fable 5 hiện có trên Claude API với model ID claude-fable-5, đồng thời hỗ trợ trên Amazon Bedrock và Google Vertex AI dành cho doanh nghiệp theo gói tiêu thụ. Notion tích hợp Fable 5: từ ghi chú rời rạc đến kế hoạch hoàn chỉnh Notion là một trong những ứng dụng đầu tiên tích hợp Fable 5, và lý do khá dễ hiểu. Loại tác vụ mà Fable 5 xử lý tốt nhất, cụ thể là đọc nhiều nguồn dữ liệu rời rạc, tổng hợp và tạo ra cấu trúc có logic, chính xác là những gì người dùng Notion cần nhất trong công việc hằng ngày. Simon Last, đồng sáng lập Notion, mô tả use case chính là biến ghi chú cuộc họp lộn xộn thành bảng công việc có phân công và thứ tự ưu tiên. Thay vì người dùng phải đọc lại toàn bộ biên bản, tóm tắt và tạo task thủ công, Fable 5 thực hiện toàn bộ chuỗi đó mà không cần được nhắc từng bước. Chưa có thông báo gì với Notion về Fable 5 sau ngày 22/6. Sau mốc đó, chi phí chưa biết sẽ tính toán như thế nào với Notion AI nếu rẻ hơn chính chủ Anthropic thì thật là tuyệt vời. Một số điều cần lưu ý trước khi dùng Fable 5 mạnh, nhưng có hai điểm đáng cân nhắc trước khi đưa vào quy trình làm việc thực tế. Thứ nhất, mức giá $50/ 1 triệu token đầu ra là khá cao so với mặt bằng chung, phù hợp với tác vụ kỹ thuật hoặc phân tích phức tạp, nhưng không nhất thiết phải dùng cho các tác vụ đơn giản mà Sonnet hay Haiku xử lý tốt với chi phí thấp hơn nhiều. Thứ hai, lớp classifier bảo vệ hoạt động tốt trong hầu hết trường hợp nhưng cũng có thể kích hoạt nhầm trong một số ngữ cảnh nghiên cứu hợp lệ, điều mà Anthropic thừa nhận và đang tiếp tục cải thiện. Với người dùng cá nhân đang ở gói Pro hoặc Max, những ngày còn lại trước mốc 22/6 là đủ để đánh giá xem Fable 5 có thực sự với giá đó có tạo ra được lợi nhuận không trước khi quyết định có nên trả thêm tiền hay không.

Nam
10 thg 6, 2026
Claude Code tự điều phối công việc với Dynamic Workflows

Bài đăng của Thariq Shihipar từ team Claude Code đã gây chú ý lớn trong cộng đồng sử dụng AI. Anh ấy tiết lộ Dynamic Workflows, tính năng cho phép Claude tự thiết kế quy trình làm việc thay vì chỉ chờ lệnh, và đây được coi là bản nâng cấp quan trọng nhất kể từ khi Claude Code có skills và subagents. Tính năng này là khái niệm harness làm bản chất để giải thích các yêu cầu kĩ thuật. Ba lỗi chí mạng nào khiến AI agent thất bại ở nhiệm vụ phức tạp Trước khi nói về giải pháp, Thariq chỉ ra một thực tế khó chịu: hầu hết AI agent hiện nay đều gặp vấn đề nghiêm trọng khi xử lý nhiệm vụ phức tạp, đa bước trong một cửa sổ ngữ cảnh duy nhất. Ông phân loại chúng thành ba dạng thất bại cốt lõi mà gần như mọi hệ thống agent đều mắc phải. Khi AI lười biếng bằng cách tự tuyên bố xong dù mới làm nửa việc Đây là hiện tượng Agentic Laziness, khi agent thực hiện một phần công việc rồi tự báo cáo là đã hoàn thành. Ví dụ cụ thể: bạn yêu cầu agent review 50 file code, nhưng nó chỉ xem qua 20 file rồi kết luận rằng mọi thứ ổn. Nguyên nhân nằm ở giới hạn cửa sổ ngữ cảnh, khi lượng thông tin quá lớn, agent có xu hướng đi tắt để hoàn thành nhanh hơn. Agent sẽ tự thiên vị bản thân nó đúng không Agent tự thiên thị nó gọi là Self-Preferential Bias, điều này xảy ra khi bạn yêu cầu agent kiểm tra lại kết quả của chính nó. Giống như nhờ một học sinh tự chấm bài thi, agent có xu hướng nghiêng về phía kết quả mà nó đã tạo ra, dẫn đến xác nhận thiếu phê phán và bỏ qua các lỗi tiềm ẩn. Điều này đặc biệt nguy hiểm trong các nhiệm vụ đòi hỏi độ chính xác cao. Làm sao để agent không mất dần ý định ban đầu qua mỗi bước Hiện tượng trôi mất mục tiêu (Goal Drift) là hiện tượng agent dần quên mục tiêu ban đầu sau nhiều bước xử lý hoặc sau quá trình nén ngữ cảnh (context compaction). Những ràng buộc cụ thể như "không làm X" hoặc các trường hợp quan trọng có thể bị loại bỏ khi bộ nhớ bị tóm tắt lại vì vậy kết quả cuối cùng lệch khỏi yêu cầu gốc mà agent không hề nhận ra. Dynamic Workflows giúp Claude tự viết bộ khung điều phối công việc Giải pháp của Anthropic không phải là làm model thông minh hơn, mà là thay đổi cách Claude tổ chức công việc. Dynamic Workflows biến Claude từ agent viết code thành agent thiết kế quy trình vận hành cho công việc phức tạp. Khái niệm cốt lõi ở đây là tự tổ chức (self-organization): Claude có thể tự phân tích mục tiêu, chọn chế độ làm việc phù hợp và tạo ra quy trình nội bộ trước khi bắt tay vào thực hiện. Harness tùy chỉnh thay vì quy trình cố định Thay vì hoạt động trong một môi trường cố định, Claude viết một bộ khung harness bằng JavaScript được thiết kế riêng cho từng nhiệm vụ. Harness này đóng vai trò như một quản lý dự án: nó chia nhỏ công việc, khởi tạo các sub-agent chuyên biệt cho từng phần, chỉ định công cụ phù hợp, định tuyến công việc đến các model khác nhau và thực hiện xác minh đối kháng (adversarial verification) để đảm bảo chất lượng. Harness hoạt động như thế nào? Để hiểu rõ hơn, hãy hình dung harness như một kịch bản sân khấu mà Claude tự soạn trước khi diễn. Khi nhận được một nhiệm vụ phức tạp, Claude không lao vào làm ngay mà dừng lại để viết một đoạn JavaScript mô tả toàn bộ quy trình: cần bao nhiêu sub-agent, mỗi agent làm gì, thứ tự thực hiện ra sao và kết quả từ agent này được chuyển cho agent kia như thế nào. Ví dụ cụ thể: nếu bạn yêu cầu Claude audit 1.000 tin nhắn Slack để tìm sự cố lặp lại, harness có thể trông như thế này về mặt logic: Agent 1 (phân loại): đọc toàn bộ tin nhắn và gán nhãn theo chủ đề Agent 2, 3, 4 (xử lý song song): mỗi agent phân tích sâu một nhóm chủ đề riêng Agent 5 (tổng hợp): gom kết quả từ ba agent trên, loại bỏ trùng lặp Agent 6 (kiểm tra chéo): đọc lại kết quả tổng hợp và phản biện độc lập Điểm quan trọng là Claude viết harness này dựa trên đặc điểm cụ thể của từng nhiệm vụ, không phải theo một khuôn mẫu cứng nhắc. Nhiệm vụ khác nhau sẽ cho ra harness khác nhau, và đó chính là lý do tính năng này được gọi là "dynamic". Harness được viết bằng JavaScript và chạy trong môi trường Claude Code. Bạn có thể kích hoạt Dynamic Workflows bằng cách nói “use a workflow” tuy nhiên từ này rất dễ bị nhầm với workflow thông thường vì vậy mọi người nên dùng từ khóa "ultracode" trong câu lệnh thì sẽ phân rõ workflow thông thường và Dynamic Workflow để tiết kiệm token hơn. Cô lập ngữ cảnh để ngăn sự suy thoái của ngữ cảnh Một trong những thiết kế thông minh nhất của Dynamic Workflows là tính năng Isolation. Mỗi sub-agent được cấp cửa sổ ngữ cảnh riêng biệt, hoàn toàn độc lập với các agent khác. Điều này ngăn chặn hiện tượng suy thoái ngữ cảnh (context rot) tức sự suy giảm chất lượng khi ngữ cảnh bị quá tải, đồng thời triệt tiêu cả Agentic Laziness lẫn Goal Drift vì mỗi agent chỉ tập trung vào phần việc nhỏ được giao. Sáu mẫu điều phối có thể tái sử dụng Claude có thể kết hợp sáu mẫu điều phối sẵn có để xử lý đa dạng tình huống: Phân loại và hành động: phân loại đầu vào rồi chọn hành động phù hợp Phân chi và tổng hợp: chia công việc ra nhiều nhánh song song rồi tổng hợp kết quả Kiểm tra chéo: dùng agent khác kiểm tra chéo kết quả Tạo và lọc: tạo nhiều phương án rồi lọc ra phương án tốt nhất Tạo ra giải đấu: cho các phương án "đấu đối khảng trực tiếp với nhau rồi loại dần Vòng lặp: lặp lại cho đến khi đạt tiêu chuẩn chất lượng Có thể tối ưu chi phí khi sử dụng Dynamic Workflows không Chạy nhiều sub-agent song song nghe có vẻ tốn kém, nhưng thực tế Dynamic Workflows được thiết kế để tối ưu chi phí theo một số cách cụ thể. Định tuyến thông minh đến model phù hợp Không phải mọi bước trong quy trình đều cần model mạnh nhất. Harness cho phép Claude định tuyến từng tác vụ đến model phù hợp với độ phức tạp của nó: các bước phân loại đơn giản có thể chạy trên model nhỏ hơn và rẻ hơn, trong khi chỉ những bước đòi hỏi suy luận sâu mới cần đến model lớn. Kết quả là tổng chi phí thường thấp hơn so với việc chạy toàn bộ quy trình trên một model duy nhất. Cô lập ngữ cảnh giúp giảm token tiêu thụ Vì mỗi sub-agent chỉ nhận đúng phần ngữ cảnh cần thiết cho công việc của mình, tổng lượng token tiêu thụ trên toàn bộ quy trình thường thấp hơn đáng kể so với cách tiếp cận truyền thống, khi toàn bộ lịch sử hội thoại được nhồi vào một cửa sổ ngữ cảnh duy nhất ngày càng phình to. Tránh làm lại công việc nhờ kiểm tra lại sớm Harness có thể cài các điểm kiểm tra chất lượng (checkpoint) giữa các bước. Nếu một bước cho ra kết quả không đạt yêu cầu, hệ thống dừng và xử lý lại đúng bước đó thay vì chạy tiếp toàn bộ quy trình rồi mới phát hiện lỗi ở cuối. Cách này tiết kiệm đáng kể chi phí cho các tác vụ dài nhiều bước. Nếu bạn lo ngại về chi phí, hãy bắt đầu với các tác vụ có khối lượng vừa phải để quan sát mức tiêu thụ token thực tế trước khi mở rộng quy mô. Ứng dụng thực tế của Dynamic Workflow như thế nào Điều khiến Thariq hào hứng nhất không phải là khả năng code, mà là việc Dynamic Workflows mở rộng Claude Code sang các nhiệm vụ phi kỹ thuật. Tính năng này có thể kích hoạt bằng ngôn ngữ tự nhiên (ví dụ: "use a workflow") hoặc từ khóa "ultracode." Các ứng dụng thực tế bao gồm: Audit hàng nghìn tin nhắn trên Slack để tìm sự cố lặp lại Xếp hạng và sàng lọc bộ hồ sơ ứng viên lớn một cách có hệ thống Chạy giải đấu loại trực tiếp tự động để chọn tên tốt nhất cho CLI tool Xử lý các nhiệm vụ vận hành đòi hỏi độ chính xác cao mà trước đây chỉ con người mới làm được Triết lý thiết kế là ràng buộc kiến trúc thay vì trí tuệ thô Điểm đáng chú ý nhất trong cách tiếp cận của Anthropic là triết lý thiết kế: thay vì cố gắng tăng trí thông minh thô của model, họ xây dựng các ràng buộc kiến trúc (architectural constraints) vào quy trình làm việc. Nói cách khác, thay vì hy vọng model tự biết cách tránh lỗi, họ thiết kế hệ thống sao cho lỗi khó xảy ra ngay từ đầu, và harness chính là công cụ thực thi triết lý đó. Dynamic Workflows cho thấy bước tiến tiếp theo của AI agent không nằm ở model thông minh hơn mà ở khả năng tự thiết kế quy trình. Giống cách một quản lý giỏi phân chia công việc cho đội ngũ thay vì tự làm tất cả, Claude giờ đây có thể tự tổ chức đội ngũ sub-agent của mình, và đây là tín hiệu rõ ràng rằng tương lai của AI coding không chỉ còn là viết code nhanh hơn mà là tổ chức công việc tốt hơn.

Nam
5 thg 6, 2026
Microsoft tung 7 mô hình AI mới thách thức OpenAI

Microsoft vừa tung cùng lúc 7 mô hình AI mới tại Build 2026, trong đó MAI-Thinking-1 sở hữu 35 tỉ tham số và được huấn luyện hoàn toàn từ dữ liệu sạch. Đây là lần đầu tiên gã khổng lồ phần mềm công khai thách thức vị thế của chính đối tác chiến lược OpenAI trên sân chơi mô hình AI. MAI-Thinking-1 và tham vọng suy luận AI của riêng Microsoft Tâm điểm của sự kiện Build 2026 chính là MAI-Thinking-1, mô hình AI suy luận đầu tiên do Microsoft tự phát triển từ đầu. Với khoảng 35 tỉ tham số hoạt động, mô hình này được thiết kế để xử lý các tác vụ đòi hỏi suy luận nhiều bước, làm việc với ngữ cảnh dài và hỗ trợ lập trình phức tạp, tất cả với chi phí thấp hơn so với nhiều mô hình AI quy mô lớn hiện nay. Điểm đáng chú ý nhất là Microsoft khẳng định MAI-Thinking-1 được huấn luyện từ dữ liệu sạch, không sử dụng phương pháp chắt lọc (distillation) từ các mô hình AI của bên thứ ba. Nói cách khác, đây là lời tuyên bố rõ ràng rằng Microsoft đủ năng lực nghiên cứu AI độc lập mà không cần "mượn" tri thức từ GPT hay bất kỳ mô hình nào khác. Theo kết quả đánh giá mà Microsoft công bố, MAI-Thinking-1 đạt hiệu suất cạnh tranh trong các bài kiểm tra lập trình và được đánh giá tương đương nhiều mô hình AI hàng đầu hiện nay trong các thử nghiệm đánh giá mù. Con số 35 tỉ tham số cũng cho thấy Microsoft đang hướng tới hiệu quả thay vì chạy đua kích thước, vì nhiều mô hình đối thủ có số tham số lớn hơn gấp nhiều lần nhưng chưa chắc đã vượt trội về chất lượng đầu ra. Từ lập trình đến giọng nói: hệ sinh thái AI khép kín Không chỉ dừng ở mô hình suy luận, Microsoft còn giới thiệu thêm 6 mô hình AI mới nhằm xây dựng một hệ sinh thái AI hoàn chỉnh phục vụ cả người dùng cá nhân lẫn doanh nghiệp. Từ lập trình, tạo ảnh cho đến giọng nói, mỗi mảnh ghép đều có mô hình chuyên biệt. Lập trình thông minh hơn với MAI-Code-1-Flash Đối với các lập trình viên, MAI-Code-1-Flash là tin vui lớn. Mô hình này chuyên về sinh mã nguồn và hỗ trợ phát triển phần mềm, được tối ưu hóa cho các tác vụ lập trình thực tế. Điều quan trọng hơn là nó sẽ được tích hợp trực tiếp vào GitHub Copilot và Visual Studio Code, hai công cụ mà hàng triệu lập trình viên sử dụng hằng ngày. Điều này có nghĩa là trải nghiệm gợi ý mã nguồn và viết code tự động sẽ được nâng cấp đáng kể ngay trên môi trường làm việc quen thuộc. Hình ảnh và giọng nói: hai mảnh ghép còn thiếu Ở mảng sáng tạo nội dung, Microsoft công bố MAI-Image-2.5 cùng phiên bản MAI-Image-2.5-Flash. Đây là các mô hình tạo sinh và chỉnh sửa hình ảnh thế hệ mới, trong đó phiên bản Flash được tối ưu cho khả năng phản hồi nhanh, phù hợp với các ứng dụng cần xử lý thời gian thực như chỉnh sửa ảnh trực tiếp hay tạo hình minh họa theo yêu cầu. Về lĩnh vực âm thanh, Microsoft giới thiệu hai mô hình quan trọng: MAI-Voice-2 với khả năng tổng hợp giọng nói tự nhiên hơn và hỗ trợ thêm nhiều ngôn ngữ mới MAI-Transcribe-1.5 chuyển đổi giọng nói thành văn bản với tốc độ xử lý nhanh hơn đáng kể so với thế hệ trước Ngoài ra, Microsoft cũng phát triển thêm những biến thể được tối ưu riêng cho nền tảng Microsoft Foundry, giúp doanh nghiệp dễ dàng xây dựng và triển khai ứng dụng AI của riêng mình. Chiến lược giảm phụ thuộc OpenAI Nếu như trước đây Microsoft chủ yếu được nhìn nhận là đối tác cung cấp hạ tầng và nền tảng triển khai cho OpenAI, thì Build 2026 cho thấy hãng đang từng bước sở hữu đầy đủ các mảnh ghép quan trọng trong hệ sinh thái AI. Microsoft hiện đã có mô hình suy luận, mô hình lập trình, mô hình tạo ảnh, mô hình tổng hợp giọng nói và mô hình nhận dạng giọng nói, tất cả được kết nối trực tiếp với hệ sinh thái Azure, Copilot và Microsoft Foundry. Chiến lược này giúp Microsoft chủ động hơn trong việc phát triển công nghệ cốt lõi, đồng thời giảm rủi ro khi phụ thuộc vào các đối tác bên ngoài. Cụ thể hơn, việc sở hữu mô hình AI riêng cho phép Microsoft kiểm soát lộ trình sản phẩm, tối ưu chi phí vận hành và tùy chỉnh mô hình theo nhu cầu cụ thể của từng dịch vụ mà không phải chờ đợi hay đàm phán với bên thứ ba. Cuộc đua mô hình AI sẽ đi về đâu? Việc ra mắt đồng thời 7 mô hình AI mới cho thấy Microsoft đang đầu tư mạnh vào các công nghệ nền tảng nhằm cạnh tranh trực tiếp với những tên tuổi lớn như OpenAI, Google hay Anthropic. Khi đối tác lớn nhất của OpenAI quyết định tự xây mô hình AI riêng, đó là tín hiệu rõ ràng nhất rằng cuộc đua AI đã bước sang giai đoạn mới, nơi không ai muốn đặt tương lai công nghệ của mình vào tay kẻ khác. Với các nhà phát triển và doanh nghiệp, đây là lúc để theo dõi sát nền tảng Microsoft Foundry và hệ sinh thái Azure AI, vì những công cụ mà trước đây chỉ có OpenAI mới cung cấp sắp xuất hiện ngay trong hệ sinh thái Microsoft quen thuộc. Build 2026 có thể sẽ được nhớ đến như thời điểm Microsoft chính thức phát đi tuyên ngôn về một hệ sinh thái AI độc lập, toàn diện và mang đậm dấu ấn riêng.

Nam
4 thg 6, 2026
Claude Code, NotebookLM và Obsidian cho nghiên cứu thông minh hơn

Rất nhiều người vẫn nghiên cứu theo cách thủ công: mở hàng chục tab, xem video, đọc bài viết, ghi chú rời rạc rồi mất thêm thời gian tự tổng hợp. Bài viết long-form của monokern trên X gợi ý một cách làm khác: dùng Claude Code để điều phối, NotebookLM để phân tích nguồn và Obsidian để lưu trí nhớ dài hạn. Khi kết hợp đúng, đây không còn là một lần tìm kiếm thông tin mà trở thành một workflow AI có khả năng tích lũy qua từng phiên làm việc. Ý tưởng cốt lõi khá thực dụng: Claude Code không cần tự làm mọi thứ trong một context đắt đỏ. Nó có thể gọi công cụ, chạy skill, tạo file và chuyển phần xử lý nặng sang NotebookLM. Sau đó toàn bộ kết quả được lưu về Obsidian dưới dạng markdown để lần nghiên cứu tiếp theo có ngữ cảnh tốt hơn. Theo tác giả, phần thiết lập ban đầu có thể hoàn thành trong khoảng dưới 30 phút nếu máy đã có các công cụ cần thiết. Vì sao bộ ba này hoạt động tốt với nhau? Điểm mạnh của workflow này nằm ở việc mỗi công cụ chỉ đảm nhiệm một lớp rõ ràng. Claude Code đóng vai trò execution engine: nhận yêu cầu bằng ngôn ngữ tự nhiên, gọi skill, chạy lệnh, quản lý file và điều phối toàn bộ pipeline. Thay vì bắt người dùng thao tác từng bước, Claude Code trở thành người vận hành hệ thống. NotebookLM là lớp phân tích. Công cụ của Google có thể đọc nguồn, tóm tắt, tạo phân tích, flashcard, mindmap, infographic hoặc audio overview. Khi Claude Code đẩy phần đọc nguồn sang NotebookLM, người dùng tận dụng hạ tầng xử lý của Google thay vì đốt toàn bộ token Claude cho việc nghiền dữ liệu dài. Obsidian là lớp trí nhớ. Mọi kết quả sau khi phân tích được lưu thành markdown trong vault cá nhân. Qua thời gian, vault này trở thành kho tri thức có cấu trúc gồm chủ đề, nguồn, nhận định, pattern và kết luận. Claude Code có thể đọc lại các file đó để hiểu người dùng quan tâm điều gì, thích format nào và thường đánh giá vấn đề theo hướng nào. Skill Creator biến workflow thành công cụ tái sử dụng Phần quan trọng đầu tiên trong hướng dẫn là cài Skill Creator trong Claude Code. Đây là lớp cho phép người dùng mô tả một kỹ năng bằng ngôn ngữ tự nhiên, sau đó Claude Code tạo cấu trúc skill, cài đặt và biến nó thành lệnh có thể gọi lại. Nói cách khác, thay vì mỗi lần nghiên cứu lại prompt từ đầu, người dùng đóng gói thao tác thành một skill riêng. Ví dụ đầu tiên trong bài là tạo skill tìm kiếm YouTube. Skill này dùng yt-dlp để tìm video theo truy vấn, lấy metadata như tiêu đề, kênh, lượt xem, thời lượng, ngày đăng, URL và tỷ lệ view trên subscriber. Với nghiên cứu thị trường nội dung, dữ liệu này quan trọng hơn danh sách link thông thường vì nó cho biết nguồn nào đang thật sự thu hút sự chú ý. NotebookLM là nơi xử lý phần phân tích nặng Bài viết đề xuất kết nối Claude Code với NotebookLM thông qua dự án notebooklm-py vì NotebookLM chưa có public API chính thức. Sau khi cài và xác thực tài khoản Google, Claude Code có thể dùng skill riêng để tạo notebook mới, thêm nguồn như URL YouTube, văn bản hoặc file, rồi yêu cầu NotebookLM sinh phân tích hoặc deliverable. Điểm đáng chú ý là NotebookLM không chỉ tóm tắt. Trong một pipeline nghiên cứu thực tế, nó có thể nhận 10 video liên quan đến một chủ đề, phân tích xem framework nào đang tăng trưởng, framework nào bị thổi phồng, đâu là điểm tranh luận trong cộng đồng và khoảng trống nội dung nào chưa được ai khai thác tốt. Phần xử lý này tốn thời gian, nhưng chủ yếu diễn ra ở phía NotebookLM. Pipeline hoàn chỉnh: một lệnh để nghiên cứu cả chủ đề Khi đã có skill YouTube search và skill NotebookLM, bước tiếp theo là tạo một pipeline skill kết hợp cả hai. Người dùng chỉ cần đưa chủ đề, ví dụ nghiên cứu các AI agent framework trong năm 2026, rồi pipeline sẽ tự tìm nguồn liên quan, tạo notebook, thêm nguồn, chạy phân tích và trả kết quả thành markdown. Trong ví dụ của monokern, pipeline tìm 10 nguồn video, đẩy sang NotebookLM, tạo phân tích, sinh infographic và lưu lại kết quả vào Obsidian. Tổng thời gian xử lý được mô tả khoảng 6 phút, trong đó phần lớn là thời gian NotebookLM xử lý nguồn. Giá trị thực tế nằm ở việc người dùng không phải tự mở từng tab, copy từng link hay tự tổng hợp metadata. Kết quả cuối cùng không chỉ là một đoạn trả lời trong chat. Nó gồm phân tích đầy đủ, danh sách nguồn, chỉ số tương tác, nhận định về xu hướng, deliverable trực quan và file markdown được lưu vào vault. Đây là điểm khiến workflow này khác với một chatbot hỏi đáp thông thường. Obsidian khiến hệ thống thông minh hơn theo thời gian Phần thú vị nhất là Obsidian. Nếu chỉ chạy một lần, workflow này đã tiết kiệm thời gian. Nhưng nếu chạy đều đặn, mỗi file markdown mới sẽ làm kho tri thức cá nhân dày hơn. Sau một tháng, Claude Code có thể nhìn thấy các chủ đề bạn quay lại nhiều lần, loại insight bạn đánh giá cao và cách bạn muốn dữ liệu được trình bày. Tác giả cũng nhấn mạnh vai trò của file claude.md trong vault. Đây có thể trở thành nơi mô tả quy ước làm việc, phong cách phân tích và format đầu ra mong muốn. Sau mỗi vài phiên nghiên cứu, người dùng có thể yêu cầu Claude Code đọc lại kết quả gần đây và cập nhật file này để phản ánh cách làm việc mới. Điểm mạnh thật sự là cấu trúc, không phải YouTube YouTube chỉ là nguồn dữ liệu trong ví dụ. Cấu trúc pipeline mới là phần có giá trị. Người dùng có thể thay YouTube bằng PDF học thuật, báo cáo ngành, tài liệu public, trang web, file local, transcript hoặc tài liệu Google Drive. Miễn là Claude Code có cách truy cập và đưa nguồn vào lớp phân tích, template vận hành vẫn giữ nguyên. Điều này mở ra nhiều ứng dụng thực tế: nghiên cứu một hệ sinh thái crypto bằng whitepaper và tài liệu public, phân tích một công nghệ mới qua talk hội nghị, tìm khoảng trống nội dung trong một niche, hoặc theo dõi động lực thị trường từ báo cáo công khai. Với mỗi trường hợp, pipeline vẫn gồm ba lớp: lấy nguồn, phân tích, lưu tri thức. Cần lưu ý gì trước khi áp dụng? Workflow này mạnh nhưng không phải dành cho mọi người. Nó yêu cầu người dùng quen với Claude Code, có Obsidian vault, biết cài công cụ CLI như yt-dlp và chấp nhận dùng một thư viện không chính thức để kết nối NotebookLM. Ngoài ra, vì NotebookLM và YouTube có thể thay đổi giao diện hoặc hạn chế truy cập, các skill nên được xem như công cụ cần bảo trì chứ không phải giải pháp cài một lần mãi mãi. Dù vậy, ý tưởng đằng sau rất đáng chú ý: thay vì dùng AI như một hộp chat rời rạc, hãy biến AI thành một hệ thống nghiên cứu có bộ nhớ, có pipeline và có khả năng học từ lịch sử làm việc của chính bạn. Với những người thường xuyên phân tích thị trường, công nghệ hoặc nội dung, đây là một hướng triển khai thực dụng hơn rất nhiều so với việc mở 10 tab rồi tự tổng hợp mọi thứ bằng tay.

Nam
2 thg 6, 2026