Quay lại trang tin tức

Gemini đồng hành cùng Argentina và Messi tại World Cup 2026

Xuất bản vào 17 tháng 06, 2026
Gemini đồng hành cùng Argentina và Messi tại World Cup 2026

Tóm tắt nhanh

Sự hợp tác chiến lược giữa Google và Liên đoàn bóng đá Argentina AFA đánh dấu một chương mới khi mô hình Gemini được đưa lên áo tập của đội tuyển quốc gia. Vai trò của Gemini vượt qua mục đích thương mại thông thường bởi trợ lý AI này sẽ tham gia hỗ trợ ban kỹ thuật phân tích chiến thuật trực tiếp ngay bên đường biên. Đội tuyển đương kim vô địch với sự dẫn dắt của Lionel Messi sẽ sử dụng Gemini để phân tích lối chơi, theo dõi thể trạng cầu thủ và tối ưu hóa phục hồi chấn thương. Người hâm mộ cũng sẽ được trải nghiệm các tính năng tìm kiếm hội thoại thông minh và nội dung sáng tạo trong suốt vòng chung kết World Cup 2026. Đây được coi là bài thử nghiệm áp lực lớn nhất đối với tính chính xác và độ tin cậy của AI trong thể thao đỉnh cao.

Gemini đã thắng lớn theo đúng nghĩa đen ngay khi Messi lập cú hat-trick đầu tiên tại World Cup 2026, giúp Argentina đè bẹp Algeria với tỷ số 3-0 và cân bằng kỷ lục 16 bàn thắng của Miroslav Klose. Khoảnh khắc lịch sử này chính là bệ phóng hoàn hảo cho Gemini. Trước đó vào tháng 3/2026, Google và Liên đoàn bóng đá Argentina (AFA) đã đưa ra một quyết định táo bạo: thay vì chỉ in logo trên áo tập, họ ký hợp đồng để AI này tham gia hỗ trợ chiến thuật và đưa ra các quyết định chuyên môn. Đến nay, thương vụ đặt cược này đã chứng minh đó là một chiến lược hoàn toàn đúng đắn.

Từ áo tập đến phòng họp chiến thuật

Thỏa thuận giữa AFA và Google được công bố tại Times Square, New York, một địa điểm được chọn có chủ ý để gây chú ý với truyền thông toàn cầu. Logo Gemini xuất hiện trên toàn bộ trang phục tập luyện của đội tuyển nam, nữ lẫn các lứa trẻ Argentina, đứng ngang hàng với Adidas và American Express trong tầng tài trợ cao nhất của AFA.

Gemini xuất hiện trên áo tập của Messi tại World Cup 2026
Gemini xuất hiện trên áo tập của Messi tại World Cup 2026

Nhưng phần thú vị không nằm ở chiếc áo. Theo thông tin từ Inside World Football, ban huấn luyện Argentina sẽ dùng Gemini cho ba việc cụ thể: phân tích chiến thuật, phòng ngừa chấn thương và hỗ trợ ra quyết định. Nói cách khác, Gemini có mặt trong những cuộc họp mà trước đây chỉ có Scaloni và các trợ lý của ông được ngồi.

Gemini làm gì trong phòng thay đồ?

Argentina đến World Cup 2026 với tư cách nhà đương kim vô địch. Mọi quyết định của Scaloni, từ danh sách triệu tập đến lựa chọn đội hình, đều bị soi kỹ hơn bất kỳ đội nào khác, và đây cũng chính là lý do Argentina trở thành phòng thí nghiệm lý tưởng nhất mà Google từng có cho Gemini trong môi trường bóng đá chuyên nghiệp và đặc biệt là ở giải đấu lớn.

Phân tích chiến thuật

Gemini được dùng để xử lý dữ liệu trận đấu của cả Argentina lẫn đối thủ, bao gồm thống kê di chuyển, mẫu hình tấn công và điểm yếu phòng thủ. Thay vì ban huấn luyện phải ngồi xem lại hàng giờ video, AI tổng hợp và đưa ra các sơ đồ chiến thuật được tạo tự động điều này sẽ tiết kiệm đáng kể thời gian chuẩn bị trước mỗi trận.

Phòng ngừa chấn thương

Đây là bài toán mà mọi đội bóng lớn đều muốn giải, đặc biệt khi Messi và nhiều trụ cột đã ở độ tuổi cần quản lý tải lượng tập luyện cẩn thận. Gemini phân tích dữ liệu sinh học và lịch sử chấn thương để đưa ra cảnh báo sớm, giúp ban huấn luyện điều chỉnh cường độ tập trước khi vấn đề thực sự xảy ra. Đó là lý do vì sao vừa ghi hat-trick Scaloni đã quyết định thay Messi ra để đảm bảo thể lực và an toàn cho các trận đấu sau.

Phía người hâm mộ: tạo ảnh Messi, theo dõi tỉ số không cần mở khóa màn hình

Song song với việc hỗ trợ ban huấn luyện, Gemini cũng triển khai một loạt tính năng hướng đến người hâm mộ, và đây mới là phần mà hàng trăm triệu người thực sự chạm vào.

Gemini cho phép tạo nội dung về cầu thủ luôn

Người dùng có thể tạo ảnh, bài nhạc và nội dung kỹ thuật số gắn với các cầu thủ Argentina như Messi ngay trong ứng dụng Gemini. Tính năng này được thiết kế để đưa trải nghiệm World Cup đến gần hơn với những người không thể đến sân trực tiếp.

Tỉ số thời gian thực và bản tin tự động

Trên Google Search, tỉ số trận đấu được ghim lên màn hình khóa và cập nhật theo thời gian thực, có animation riêng cho bàn thắng và thẻ đỏ mà không cần mở khóa điện thoại. Với người dùng Gemini trả phí, tính năng Scheduled Actions cho phép thiết lập bản tin bóng đá tự động mỗi ngày, bao gồm tỉ số, tin tức và lịch thi đấu, được giao đúng giờ đã chọn mà không cần nhắc lại mỗi ngày.

Hạ tầng phục vụ ngày thi đấu

Google cập nhật Street View tại 16 sân vận động chủ nhà và tối ưu hóa lộ trình trên Waze cho ngày thi đấu. Waze còn hiển thị tỉ số trực tiếp khi xe dừng đèn đỏ, để người lái không cần cầm điện thoại trong lúc di chuyển.

World Cup 2026 là phép thử thật sự cho AI trong thể thao

Google không chỉ tài trợ cho Argentina. Gemini còn có mặt trên áo của Pháp, Morocco, Iraq, Thổ Nhĩ Kỳ và Mỹ, trong khi Pixel là điện thoại chính thức của đội Pháp với Gemini được dùng cho liên lạc nội bộ. Đây rõ ràng là chiến lược tổng thể của Google và không phải một hợp đồng đơn lẻ.

Điều khiến World Cup 2026 trở nên đặc biệt là nó sẽ trả lời một câu hỏi mà không phòng lab nào làm được: người dùng thực sự dùng AI để làm gì khi có một giải đấu World Cup 2026 kéo dài 6 tuần với 104 trận?

Giám đốc truyền thông Google khu vực Mỹ Latinh, Flor Sabatini, phát biểu rằng World Cup 2026 sẽ đánh dấu một trước và sau trong lịch sử bóng đá nhờ AI. Câu nói nghe có vẻ marketing, nhưng thực tế là lần đầu tiên một mô hình AI lớn được tích hợp vào chuẩn bị của đội đương kim vô địch, ngay giữa một giải đấu được xem nhiều nhất hành tinh.

World Cup 2026 là bài kiểm tra thật của Gemini

Điểm đáng chú ý nhất của toàn bộ câu chuyện này không phải logo Gemini trên áo Messi. Đó là việc Argentina tất nhiên vẫn là đội được kỳ vọng nhất và bị soi kỹ nhất, với áp lực bảo vệ chức vô địch vẫn đặt một phần quy trình chuẩn bị của mình vào AI.

Nếu Argentina thành công, Gemini có một case study không thể mua bằng tiền quảng cáo. Nếu Argentina thất bại mà ban huấn luyện quy trách nhiệm một phần cho AI, câu chuyện sẽ đi theo chiều ngược lại hoàn toàn. Dù kết quả thế nào, đây là lần đầu tiên AI phải chịu trách nhiệm ở một sân khấu thực sự có giá trị, không phải benchmark, không phải demo, mà là World Cup.

Với người dùng AI, điều đáng theo dõi không chỉ là Argentina có vô địch hay không, mà là xem liệu Gemini có thực sự thay đổi cách một đội bóng vận hành, hay chỉ là logo trên áo tập đẹp hơn mọi năm.

Thảo luận (0)

Đăng nhập để tham gia thảo luận.

Chưa có bình luận nào. Hãy là người đầu tiên!

Các bài viết liên quan

Toàn cảnh công nghệ AI tại World Cup 2026

Quả bóng Adidas Trionda, mô hình 3D cầu thủ chính xác đến từng milimet, robot chó tuần tra sân vận động và Google Gemini ngồi ngay bên đường biên cùng đội tuyển Argentina. World Cup 2026 không chỉ là giải đấu lớn nhất lịch sử với 104 trận đấu tại 16 thành phố ở Mỹ, Canada và Mexico mà còn là cuộc triển khai AI quy mô nhất từng có trong thể thao. Quả bóng thông minh Adidas Trionda hoạt động như thế nào Quả bóng chính thức của giải đấu mang tên Adidas Trionda được trang bị cảm biến IMU (Inertial Measurement Unit) hoạt động ở tần số 500Hz, tức là mỗi giây nó thu thập 500 điểm dữ liệu về chuyển động, độ xoáy và thời điểm chính xác bóng chạm chân cầu thủ. Điều này đặc biệt quan trọng cho các tình huống việt vị, bởi cảm biến sẽ xác định chính xác đến từng mili giây thời điểm bóng rời chân người chuyền. Dấu thời gian (timestamp) từ cảm biến được đồng bộ ngay lập tức với hệ thống theo dõi cầu thủ, giúp khóa chặt vị trí của mọi cái bóng trên sân tại đúng khoảnh khắc ấy thay vì phụ thuộc vào mắt thường vốn có thể lệch đến nửa giây. Kết quả là những quyết định việt vị được đưa ra nhanh chóng và chính xác hơn bao giờ hết. Công nghệ tối tân này đã lập tức cứu nguy cho đội tuyển Thụy Điển khi xác định chính xác thời điểm chạm bóng của tiền đạo Alexander Isak . Trước đó, niềm vui của người ghi bàn Svanberg phải tạm chùng xuống khi tổ VAR vào cuộc kiểm tra. Trong pha bóng diễn ra với tốc độ chóng mặt, anh dường như đã đứng dưới hàng thủ Tunisia khi bóng được đưa vào vòng cấm, khiến nhiều người tin rằng bàn thắng sẽ bị hủy bỏ. Thế nhưng, chính dữ liệu từ cảm biến chuyển động gắn bên trong quả bóng Trionda của Adidas đã chứng minh Svanberg kịp di chuyển trở lại vị trí hợp lệ, mang về bàn thắng hợp pháp cho Thụy Điển trong sự vỡ òa của người hâm mộ. . Công nghệ việt vị bán tự động với mô hình 3D cầu thủ Công nghệ bắt việt vị bán tự động (SAOT) đã được nâng cấp đáng kể cho World Cup 2026 với điểm nhấn là avatar 3D của từng cầu thủ. Mỗi cầu thủ tham dự giải đấu được quét kỹ thuật số toàn thân chỉ trong khoảng một giây, tạo ra mô hình 3D với kích thước cơ thể chi tiết đến từng bộ phận. Khi có tình huống cần VAR xem xét, hệ thống sẽ phủ các mô hình 3D này lên dữ liệu theo dõi thời gian thực từ hơn 12 camera chuyên dụng tại mỗi sân vận động. Cách tiếp cận này giải quyết triệt để vấn đề tồn tại lâu nay của đường kẻ việt vị 2D, khi cánh tay, vai hoặc bàn chân cầu thủ có thể bị che khuất từ một góc camera nhất định. Mô hình 3D lấp đầy những khoảng trống đó bằng dữ liệu giải phẫu thực tế, và kết quả hiện lên dưới dạng hoạt hình 3D hoàn chỉnh trên sân cũng như trên sóng truyền hình, thay thế hoàn toàn những đường kẻ phẳng xanh đỏ từng gây bối rối cho khán giả. Football AI Pro: nền tảng phân tích AI cho cả 48 đội FIFA đã hợp tác cùng Lenovo để xây dựng Football AI Pro, một nền tảng phân tích được xây dựng trên mô hình nền tảng Football Language của FIFA, vốn được huấn luyện từ hàng trăm triệu điểm dữ liệu bóng đá qua nhiều thập kỷ thi đấu. Đây là lần đầu tiên trong lịch sử World Cup mà tất cả 48 đội tham dự đều có quyền truy cập vào cùng một nền tảng phân tích, thay vì các liên đoàn giàu có hơn nắm lợi thế nhờ công cụ dữ liệu tốt hơn. Nền tảng này xuất kết quả dưới nhiều định dạng: tóm tắt văn bản, clip video, biểu đồ tương tác và trực quan hóa chiến thuật 3D. Các đội có thể sử dụng nó trước và sau trận đấu để phân tích chiến thuật đối thủ, phát hiện mẫu hình đá phạt, theo dõi cường độ vận động cầu thủ và phân tích lịch sử đối đầu. Tuy nhiên, FIFA cấm sử dụng trong thời gian thi đấu, ban huấn luyện chỉ được dùng vào giờ nghỉ giữa hiệp và sau trận. Camera trên ngực trọng tài với AI ổn định hình ảnh Lần đầu tiên trong lịch sử, trọng tài ở cả 104 trận World Cup đều đeo camera trên ngực. Hình ảnh thô từ camera khi trọng tài chạy ở tốc độ cao vốn rung lắc và không thể dùng cho phát sóng, nhưng FIFA chạy mô hình AI ổn định hình ảnh theo thời gian thực trên từng khung hình, tạo ra chất lượng đủ chuẩn phát sóng. Kết quả là góc nhìn "Referee View" mang đến trải nghiệm chủ quan từ mặt sân, nhanh chóng trở thành một trong những đổi mới phát sóng được yêu thích nhất. Góc nhìn này không chỉ phục vụ giải trí mà còn cung cấp cho các nhà phân tích một nguồn dữ liệu mới: chính xác tầm nhìn mà trọng tài có khi đưa ra quyết định. Google Gemini trên đường biên và trải nghiệm người hâm mộ Tháng 3 năm 2026, Liên đoàn bóng đá Argentina công bố Google là nhà tài trợ toàn cầu chính thức, với logo Gemini xuất hiện trên áo tập của cả đội nam, nữ và trẻ. Nhưng sự hợp tác này vượt xa quảng cáo thương hiệu, vì ban kỹ thuật Argentina sử dụng Gemini trực tiếp cho phân tích chiến thuật từ video trận đấu, theo dõi dữ liệu tải trọng và phục hồi chấn thương, truy vấn dữ liệu lịch sử về các kịch bản đối đầu cụ thể, cũng như tạo bản tóm tắt đối thủ riêng cho từng cầu thủ. Đáng chú ý, cầu thủ và huấn luyện viên Argentina sử dụng Gemini qua ứng dụng tiêu chuẩn chứ không qua giao diện tùy chỉnh nào, phản ánh mức độ trưởng thành của các công cụ AI đa năng trong ứng dụng thể thao chuyên nghiệp. Bên cạnh đó, Google cũng triển khai hàng loạt tính năng cho người hâm mộ: tỷ số trực tiếp ghim trên màn hình khóa Android, tóm tắt trận đấu AI trên ứng dụng Gemini, sơ đồ chiến thuật theo yêu cầu, mẫu áo đấu trên Google Photos, điều hướng sân vận động qua Google Maps và thống kê trận đấu trên Google Search. Robot chó, nhận diện khuôn mặt và an ninh AI Tại các địa điểm tổ chức, FIFA triển khai robot chó Boston Dynamics Spot cho tuần tra an ninh vòng ngoài và kiểm tra cơ sở vật chất. Những robot này thực hiện tuần tra tự động ở các khu vực hạn chế, với camera trên thân kết nối vào hệ thống AI an ninh của sân vận động, đặc biệt hiệu quả ở những không gian khó giám sát liên tục như khu vực đường hầm, hành lang kỹ thuật ngầm và vòng ngoài sân vào ban đêm. Tầng sinh trắc học cũng đáng chú ý không kém: một số sân vận động sử dụng nhận diện khuôn mặt cho việc vào cổng, khuôn mặt bạn chính là vé vào, được xử lý đối chiếu với cơ sở dữ liệu trong chưa đầy một giây. Tuy nhiên, sự hiện diện rộng rãi của giám sát AI cũng đặt ra câu hỏi về quyền riêng tư trong các sự kiện thể thao quy mô lớn. AI dự đoán nhà vô địch: mỗi mô hình một đáp án Trước khi giải đấu khởi tranh, nhiều hệ thống AI đã mô phỏng toàn bộ 104 trận đấu để dự đoán nhà vô địch, và kết quả hoàn toàn không thống nhất. ChatGPT dự đoán Tây Ban Nha, mô hình nghiên cứu của FanDuel chọn Pháp (thắng Argentina 3 trên 2 trong trận chung kết), còn Yahoo Sports cùng DataCamp đều đặt cược vào Brazil. Sự bất đồng này rất đáng suy ngẫm, bởi mọi mô hình đều được cung cấp cùng một nguồn dữ liệu công khai gồm bảng xếp hạng FIFA, điểm ELO, phong độ vòng loại và báo cáo chấn thương, nhưng cách đánh trọng số khác nhau lại tạo ra những kết quả hoàn toàn khác biệt. Và tất nhiên, không mô hình nào có thể tính toán được cú sút chân trái của Messi ở phút 89 trong trận knock-out. Đó vẫn là bóng đá. AI không còn là thử nghiệm mà là hạ tầng Điều tạo nên sự khác biệt của World Cup 2026 so với các giải đấu trước không nằm ở bất kỳ công nghệ đơn lẻ nào, mà ở việc AI đã chuyển từ giai đoạn thử nghiệm sang hạ tầng vận hành. Quả bóng thông minh, hệ thống việt vị 3D, camera trọng tài, nền tảng phân tích: không thứ nào trong số này là dự án thí điểm. Chúng là nền tảng hoạt động cơ bản cho mọi trận đấu. Cảm biến 500Hz trong quả bóng không hiểu gì về bóng đá, nó chỉ đo độ xoáy. Nhưng quyết định mà nó tạo ra, chính xác đến milimet, hiển thị dưới dạng 3D và trả kết quả trong vài giây tình huống của tuyển Thụy Điển là điển hình và từ đó nó sẽ thay đổi cách môn bóng đá được vận hành. Đó mới là hình dạng thực sự của AI khi vận hành ở quy mô lớn.

Nam
16 thg 6, 2026
Anthropic vừa ra mắt model cực kì mạnh mẽ Claude Fable 5

Anthropic đã thả một quả bom đến thế giới với AI với Claude Fable 5 và nó đã trở thành model được bàn tán nhiều nhất tuần này. Không chỉ vì sức mạnh của nó, mà vì cái cách Anthropic đưa nó ra thế giới: đây là lần đầu tiên một model thuộc dòng Mythos class được phép tiếp cận người dùng thông thường, sau hai tháng bị giữ kín vì lý do an toàn. Fable 5 là gì và tại sao nó khác các model trước? Về bản chất, Fable 5 không phải một model xây từ đầu mà là phiên bản "an toàn hóa" của Mythos 5, tức model mạnh nhất Anthropic từng xây dựng. Hồi tháng 4/2026, Mythos Preview chỉ được cấp quyền truy cập cho một nhóm rất nhỏ các tổ chức như AWS, Apple, Google, Cisco và JPMorgan Chase thông qua Project Glasswing, bởi khả năng phát hiện và khai thác lỗ hổng phần mềm của nó quá mạnh để tung ra đại trà. Anthropic cũng đã ra mắt Claude Opus 4.8 trước đó như một bước đệm trong lộ trình phát triển dòng model thế hệ mới này. Để đưa được Mythos ra ngoài, Anthropic mất thêm hai tháng xây dựng các lớp classifier chạy song song. Đây là những AI chuyên biệt phân tích yêu cầu trước khi model chính xử lý, và khi phát hiện câu hỏi thuộc vùng nhạy cảm, hệ thống tự động chuyển sang Claude Opus 4.8 mà không tính thêm phí. Anthropic cho biết cơ chế này chỉ kích hoạt trong chưa đến 5% số phiên làm việc, nghĩa là phần lớn người dùng thông thường sẽ không nhận thấy sự khác biệt nào so với Mythos 5 thuần. Fable 5 và Mythos 5 có cùng mức giá: $10/triệu token đầu vào và $50/triệu token đầu ra, thấp hơn một nửa so với Mythos Preview trước đây. Người dùng gói Pro, Max, Team và Enterprise được dùng miễn phí đến hết ngày 22/6/2026. Từ ngày 23/6, Anthropic chuyển sang tính phí theo lượng dùng cho đến khi hạ tầng đủ mạnh để đưa model trở lại gói cố định. Fable 5 khác Mythos 5 như thế nào ở phần bảo mật? Dù cùng chia sẻ một model nền, Fable 5 và Mythos 5 là hai sản phẩm khác nhau về mặt thiết kế. Sự khác biệt nằm hoàn toàn ở các lớp classifier an toàn được tích hợp bên trên model gốc. Ba lớp classifier mà Fable 5 có, Mythos 5 không có Fable 5 được trang bị ba lớp phân loại an toàn chạy song song với model chính, gồm: an ninh mạng (Cybersecurity), sinh học và hóa học (Biology and Chemistry) và chưng cất (Distillation). Khi người dùng gửi yêu cầu thuộc các vùng này, Fable 5 tự động chuyển sang xử lý bằng Claude Opus 4.8 thay vì model chính, đồng thời thông báo rõ cho người dùng biết. Mythos 5 không có các lớp lọc này. Nó giữ nguyên toàn bộ khả năng khai thác lỗ hổng phần mềm và nghiên cứu sinh học mà Anthropic đánh giá là quá nguy hiểm để phân phối rộng rãi. Đó là lý do Mythos 5 vẫn chỉ dành cho nhóm hạn chế trong Project Glasswing, bao gồm các chuyên gia phòng thủ mạng, tổ chức hạ tầng trọng yếu và nhà nghiên cứu sinh học được cấp quyền. Hiệu suất thực tế bị ảnh hưởng ra sao? Sự khác biệt về classifier dẫn đến kết quả đo lường khác nhau đáng kể trong các tác vụ chuyên biệt. Trên benchmark ExploitBench dành riêng cho an ninh mạng, Mythos 5 đạt 78%, trong khi Fable 5 chỉ đạt gần mức 40% của Opus 4.8, bởi cơ chế fallback kích hoạt ngay khi phát hiện các yêu cầu liên quan đến tấn công mạng. Với nghiên cứu khoa học, Mythos 5 có thể thiết kế protein và tạo giả thuyết mới với tốc độ gấp 10 lần phương pháp trước, trong khi những khả năng này bị giới hạn trong Fable 5 để đảm bảo an toàn. Nếu bạn là nhà nghiên cứu hoặc làm việc trong lĩnh vực an ninh mạng hợp pháp, cần lưu ý rằng Fable 5 có thể tự động chuyển hướng một số yêu cầu sang Opus 4.8, ngay cả khi ngữ cảnh hoàn toàn hợp lệ. Anthropic thừa nhận điều này và đang tiếp tục cải thiện độ chính xác của classifier. Hiệu năng thực tế: con số nói gì? Trên benchmark SWE-Bench Pro dành cho lập trình, Fable 5 đạt 80,3%, so với 69,2% của Opus 4.8 và 58,6% của GPT-5.5. Con số ấn tượng hơn đến từ môi trường thực tế: Stripe dùng Fable 5 để di trú toàn bộ codebase Ruby 50 triệu dòng trong một ngày, trong khi cả nhóm kỹ sư làm thủ công cần hơn hai tháng cho cùng tác vụ đó. Với phân tích kinh doanh, Fable 5 là model đầu tiên vượt mốc 90% trên bộ kiểm tra analytics phức tạp của Hex, cao hơn Opus 4.8 tới 10 điểm phần trăm. IMC, một công ty giao dịch tài chính, cho biết model đạt điểm gần như tuyệt đối trên bộ đánh giá nội bộ bao gồm tra cứu dữ kiện, suy luận nhân quả và tính toán giá trị kỳ vọng. Điểm khác biệt lớn nhất so với các model trước nằm ở khả năng duy trì tập trung trong tác vụ dài nhiều ngày mà không cần con người giám sát từng bước. Thay vì nhận lệnh và chạy từng câu lệnh rời rạc, Fable 5 có thể tiếp nhận một dự án lớn, tự lập kế hoạch, chạy kiểm thử và xử lý lỗi theo vòng lặp, hoạt động gần với cách một kỹ sư làm việc hơn là một công cụ trả lời câu hỏi. Fable 5 hiện có trên Claude API với model ID claude-fable-5, đồng thời hỗ trợ trên Amazon Bedrock và Google Vertex AI dành cho doanh nghiệp theo gói tiêu thụ. Notion tích hợp Fable 5: từ ghi chú rời rạc đến kế hoạch hoàn chỉnh Notion là một trong những ứng dụng đầu tiên tích hợp Fable 5, và lý do khá dễ hiểu. Loại tác vụ mà Fable 5 xử lý tốt nhất, cụ thể là đọc nhiều nguồn dữ liệu rời rạc, tổng hợp và tạo ra cấu trúc có logic, chính xác là những gì người dùng Notion cần nhất trong công việc hằng ngày. Simon Last, đồng sáng lập Notion, mô tả use case chính là biến ghi chú cuộc họp lộn xộn thành bảng công việc có phân công và thứ tự ưu tiên. Thay vì người dùng phải đọc lại toàn bộ biên bản, tóm tắt và tạo task thủ công, Fable 5 thực hiện toàn bộ chuỗi đó mà không cần được nhắc từng bước. Chưa có thông báo gì với Notion về Fable 5 sau ngày 22/6. Sau mốc đó, chi phí chưa biết sẽ tính toán như thế nào với Notion AI nếu rẻ hơn chính chủ Anthropic thì thật là tuyệt vời. Một số điều cần lưu ý trước khi dùng Fable 5 mạnh, nhưng có hai điểm đáng cân nhắc trước khi đưa vào quy trình làm việc thực tế. Thứ nhất, mức giá $50/ 1 triệu token đầu ra là khá cao so với mặt bằng chung, phù hợp với tác vụ kỹ thuật hoặc phân tích phức tạp, nhưng không nhất thiết phải dùng cho các tác vụ đơn giản mà Sonnet hay Haiku xử lý tốt với chi phí thấp hơn nhiều. Thứ hai, lớp classifier bảo vệ hoạt động tốt trong hầu hết trường hợp nhưng cũng có thể kích hoạt nhầm trong một số ngữ cảnh nghiên cứu hợp lệ, điều mà Anthropic thừa nhận và đang tiếp tục cải thiện. Với người dùng cá nhân đang ở gói Pro hoặc Max, những ngày còn lại trước mốc 22/6 là đủ để đánh giá xem Fable 5 có thực sự với giá đó có tạo ra được lợi nhuận không trước khi quyết định có nên trả thêm tiền hay không.

Nam
10 thg 6, 2026
Microsoft tung 7 mô hình AI mới thách thức OpenAI

Microsoft vừa tung cùng lúc 7 mô hình AI mới tại Build 2026, trong đó MAI-Thinking-1 sở hữu 35 tỉ tham số và được huấn luyện hoàn toàn từ dữ liệu sạch. Đây là lần đầu tiên gã khổng lồ phần mềm công khai thách thức vị thế của chính đối tác chiến lược OpenAI trên sân chơi mô hình AI. MAI-Thinking-1 và tham vọng suy luận AI của riêng Microsoft Tâm điểm của sự kiện Build 2026 chính là MAI-Thinking-1, mô hình AI suy luận đầu tiên do Microsoft tự phát triển từ đầu. Với khoảng 35 tỉ tham số hoạt động, mô hình này được thiết kế để xử lý các tác vụ đòi hỏi suy luận nhiều bước, làm việc với ngữ cảnh dài và hỗ trợ lập trình phức tạp, tất cả với chi phí thấp hơn so với nhiều mô hình AI quy mô lớn hiện nay. Điểm đáng chú ý nhất là Microsoft khẳng định MAI-Thinking-1 được huấn luyện từ dữ liệu sạch, không sử dụng phương pháp chắt lọc (distillation) từ các mô hình AI của bên thứ ba. Nói cách khác, đây là lời tuyên bố rõ ràng rằng Microsoft đủ năng lực nghiên cứu AI độc lập mà không cần "mượn" tri thức từ GPT hay bất kỳ mô hình nào khác. Theo kết quả đánh giá mà Microsoft công bố, MAI-Thinking-1 đạt hiệu suất cạnh tranh trong các bài kiểm tra lập trình và được đánh giá tương đương nhiều mô hình AI hàng đầu hiện nay trong các thử nghiệm đánh giá mù. Con số 35 tỉ tham số cũng cho thấy Microsoft đang hướng tới hiệu quả thay vì chạy đua kích thước, vì nhiều mô hình đối thủ có số tham số lớn hơn gấp nhiều lần nhưng chưa chắc đã vượt trội về chất lượng đầu ra. Từ lập trình đến giọng nói: hệ sinh thái AI khép kín Không chỉ dừng ở mô hình suy luận, Microsoft còn giới thiệu thêm 6 mô hình AI mới nhằm xây dựng một hệ sinh thái AI hoàn chỉnh phục vụ cả người dùng cá nhân lẫn doanh nghiệp. Từ lập trình, tạo ảnh cho đến giọng nói, mỗi mảnh ghép đều có mô hình chuyên biệt. Lập trình thông minh hơn với MAI-Code-1-Flash Đối với các lập trình viên, MAI-Code-1-Flash là tin vui lớn. Mô hình này chuyên về sinh mã nguồn và hỗ trợ phát triển phần mềm, được tối ưu hóa cho các tác vụ lập trình thực tế. Điều quan trọng hơn là nó sẽ được tích hợp trực tiếp vào GitHub Copilot và Visual Studio Code, hai công cụ mà hàng triệu lập trình viên sử dụng hằng ngày. Điều này có nghĩa là trải nghiệm gợi ý mã nguồn và viết code tự động sẽ được nâng cấp đáng kể ngay trên môi trường làm việc quen thuộc. Hình ảnh và giọng nói: hai mảnh ghép còn thiếu Ở mảng sáng tạo nội dung, Microsoft công bố MAI-Image-2.5 cùng phiên bản MAI-Image-2.5-Flash. Đây là các mô hình tạo sinh và chỉnh sửa hình ảnh thế hệ mới, trong đó phiên bản Flash được tối ưu cho khả năng phản hồi nhanh, phù hợp với các ứng dụng cần xử lý thời gian thực như chỉnh sửa ảnh trực tiếp hay tạo hình minh họa theo yêu cầu. Về lĩnh vực âm thanh, Microsoft giới thiệu hai mô hình quan trọng: MAI-Voice-2 với khả năng tổng hợp giọng nói tự nhiên hơn và hỗ trợ thêm nhiều ngôn ngữ mới MAI-Transcribe-1.5 chuyển đổi giọng nói thành văn bản với tốc độ xử lý nhanh hơn đáng kể so với thế hệ trước Ngoài ra, Microsoft cũng phát triển thêm những biến thể được tối ưu riêng cho nền tảng Microsoft Foundry, giúp doanh nghiệp dễ dàng xây dựng và triển khai ứng dụng AI của riêng mình. Chiến lược giảm phụ thuộc OpenAI Nếu như trước đây Microsoft chủ yếu được nhìn nhận là đối tác cung cấp hạ tầng và nền tảng triển khai cho OpenAI, thì Build 2026 cho thấy hãng đang từng bước sở hữu đầy đủ các mảnh ghép quan trọng trong hệ sinh thái AI. Microsoft hiện đã có mô hình suy luận, mô hình lập trình, mô hình tạo ảnh, mô hình tổng hợp giọng nói và mô hình nhận dạng giọng nói, tất cả được kết nối trực tiếp với hệ sinh thái Azure, Copilot và Microsoft Foundry. Chiến lược này giúp Microsoft chủ động hơn trong việc phát triển công nghệ cốt lõi, đồng thời giảm rủi ro khi phụ thuộc vào các đối tác bên ngoài. Cụ thể hơn, việc sở hữu mô hình AI riêng cho phép Microsoft kiểm soát lộ trình sản phẩm, tối ưu chi phí vận hành và tùy chỉnh mô hình theo nhu cầu cụ thể của từng dịch vụ mà không phải chờ đợi hay đàm phán với bên thứ ba. Cuộc đua mô hình AI sẽ đi về đâu? Việc ra mắt đồng thời 7 mô hình AI mới cho thấy Microsoft đang đầu tư mạnh vào các công nghệ nền tảng nhằm cạnh tranh trực tiếp với những tên tuổi lớn như OpenAI, Google hay Anthropic. Khi đối tác lớn nhất của OpenAI quyết định tự xây mô hình AI riêng, đó là tín hiệu rõ ràng nhất rằng cuộc đua AI đã bước sang giai đoạn mới, nơi không ai muốn đặt tương lai công nghệ của mình vào tay kẻ khác. Với các nhà phát triển và doanh nghiệp, đây là lúc để theo dõi sát nền tảng Microsoft Foundry và hệ sinh thái Azure AI, vì những công cụ mà trước đây chỉ có OpenAI mới cung cấp sắp xuất hiện ngay trong hệ sinh thái Microsoft quen thuộc. Build 2026 có thể sẽ được nhớ đến như thời điểm Microsoft chính thức phát đi tuyên ngôn về một hệ sinh thái AI độc lập, toàn diện và mang đậm dấu ấn riêng.

Nam
4 thg 6, 2026
Claude Code, NotebookLM và Obsidian cho nghiên cứu thông minh hơn

Rất nhiều người vẫn nghiên cứu theo cách thủ công: mở hàng chục tab, xem video, đọc bài viết, ghi chú rời rạc rồi mất thêm thời gian tự tổng hợp. Bài viết long-form của monokern trên X gợi ý một cách làm khác: dùng Claude Code để điều phối, NotebookLM để phân tích nguồn và Obsidian để lưu trí nhớ dài hạn. Khi kết hợp đúng, đây không còn là một lần tìm kiếm thông tin mà trở thành một workflow AI có khả năng tích lũy qua từng phiên làm việc. Ý tưởng cốt lõi khá thực dụng: Claude Code không cần tự làm mọi thứ trong một context đắt đỏ. Nó có thể gọi công cụ, chạy skill, tạo file và chuyển phần xử lý nặng sang NotebookLM. Sau đó toàn bộ kết quả được lưu về Obsidian dưới dạng markdown để lần nghiên cứu tiếp theo có ngữ cảnh tốt hơn. Theo tác giả, phần thiết lập ban đầu có thể hoàn thành trong khoảng dưới 30 phút nếu máy đã có các công cụ cần thiết. Vì sao bộ ba này hoạt động tốt với nhau? Điểm mạnh của workflow này nằm ở việc mỗi công cụ chỉ đảm nhiệm một lớp rõ ràng. Claude Code đóng vai trò execution engine: nhận yêu cầu bằng ngôn ngữ tự nhiên, gọi skill, chạy lệnh, quản lý file và điều phối toàn bộ pipeline. Thay vì bắt người dùng thao tác từng bước, Claude Code trở thành người vận hành hệ thống. NotebookLM là lớp phân tích. Công cụ của Google có thể đọc nguồn, tóm tắt, tạo phân tích, flashcard, mindmap, infographic hoặc audio overview. Khi Claude Code đẩy phần đọc nguồn sang NotebookLM, người dùng tận dụng hạ tầng xử lý của Google thay vì đốt toàn bộ token Claude cho việc nghiền dữ liệu dài. Obsidian là lớp trí nhớ. Mọi kết quả sau khi phân tích được lưu thành markdown trong vault cá nhân. Qua thời gian, vault này trở thành kho tri thức có cấu trúc gồm chủ đề, nguồn, nhận định, pattern và kết luận. Claude Code có thể đọc lại các file đó để hiểu người dùng quan tâm điều gì, thích format nào và thường đánh giá vấn đề theo hướng nào. Skill Creator biến workflow thành công cụ tái sử dụng Phần quan trọng đầu tiên trong hướng dẫn là cài Skill Creator trong Claude Code. Đây là lớp cho phép người dùng mô tả một kỹ năng bằng ngôn ngữ tự nhiên, sau đó Claude Code tạo cấu trúc skill, cài đặt và biến nó thành lệnh có thể gọi lại. Nói cách khác, thay vì mỗi lần nghiên cứu lại prompt từ đầu, người dùng đóng gói thao tác thành một skill riêng. Ví dụ đầu tiên trong bài là tạo skill tìm kiếm YouTube. Skill này dùng yt-dlp để tìm video theo truy vấn, lấy metadata như tiêu đề, kênh, lượt xem, thời lượng, ngày đăng, URL và tỷ lệ view trên subscriber. Với nghiên cứu thị trường nội dung, dữ liệu này quan trọng hơn danh sách link thông thường vì nó cho biết nguồn nào đang thật sự thu hút sự chú ý. NotebookLM là nơi xử lý phần phân tích nặng Bài viết đề xuất kết nối Claude Code với NotebookLM thông qua dự án notebooklm-py vì NotebookLM chưa có public API chính thức. Sau khi cài và xác thực tài khoản Google, Claude Code có thể dùng skill riêng để tạo notebook mới, thêm nguồn như URL YouTube, văn bản hoặc file, rồi yêu cầu NotebookLM sinh phân tích hoặc deliverable. Điểm đáng chú ý là NotebookLM không chỉ tóm tắt. Trong một pipeline nghiên cứu thực tế, nó có thể nhận 10 video liên quan đến một chủ đề, phân tích xem framework nào đang tăng trưởng, framework nào bị thổi phồng, đâu là điểm tranh luận trong cộng đồng và khoảng trống nội dung nào chưa được ai khai thác tốt. Phần xử lý này tốn thời gian, nhưng chủ yếu diễn ra ở phía NotebookLM. Pipeline hoàn chỉnh: một lệnh để nghiên cứu cả chủ đề Khi đã có skill YouTube search và skill NotebookLM, bước tiếp theo là tạo một pipeline skill kết hợp cả hai. Người dùng chỉ cần đưa chủ đề, ví dụ nghiên cứu các AI agent framework trong năm 2026, rồi pipeline sẽ tự tìm nguồn liên quan, tạo notebook, thêm nguồn, chạy phân tích và trả kết quả thành markdown. Trong ví dụ của monokern, pipeline tìm 10 nguồn video, đẩy sang NotebookLM, tạo phân tích, sinh infographic và lưu lại kết quả vào Obsidian. Tổng thời gian xử lý được mô tả khoảng 6 phút, trong đó phần lớn là thời gian NotebookLM xử lý nguồn. Giá trị thực tế nằm ở việc người dùng không phải tự mở từng tab, copy từng link hay tự tổng hợp metadata. Kết quả cuối cùng không chỉ là một đoạn trả lời trong chat. Nó gồm phân tích đầy đủ, danh sách nguồn, chỉ số tương tác, nhận định về xu hướng, deliverable trực quan và file markdown được lưu vào vault. Đây là điểm khiến workflow này khác với một chatbot hỏi đáp thông thường. Obsidian khiến hệ thống thông minh hơn theo thời gian Phần thú vị nhất là Obsidian. Nếu chỉ chạy một lần, workflow này đã tiết kiệm thời gian. Nhưng nếu chạy đều đặn, mỗi file markdown mới sẽ làm kho tri thức cá nhân dày hơn. Sau một tháng, Claude Code có thể nhìn thấy các chủ đề bạn quay lại nhiều lần, loại insight bạn đánh giá cao và cách bạn muốn dữ liệu được trình bày. Tác giả cũng nhấn mạnh vai trò của file claude.md trong vault. Đây có thể trở thành nơi mô tả quy ước làm việc, phong cách phân tích và format đầu ra mong muốn. Sau mỗi vài phiên nghiên cứu, người dùng có thể yêu cầu Claude Code đọc lại kết quả gần đây và cập nhật file này để phản ánh cách làm việc mới. Điểm mạnh thật sự là cấu trúc, không phải YouTube YouTube chỉ là nguồn dữ liệu trong ví dụ. Cấu trúc pipeline mới là phần có giá trị. Người dùng có thể thay YouTube bằng PDF học thuật, báo cáo ngành, tài liệu public, trang web, file local, transcript hoặc tài liệu Google Drive. Miễn là Claude Code có cách truy cập và đưa nguồn vào lớp phân tích, template vận hành vẫn giữ nguyên. Điều này mở ra nhiều ứng dụng thực tế: nghiên cứu một hệ sinh thái crypto bằng whitepaper và tài liệu public, phân tích một công nghệ mới qua talk hội nghị, tìm khoảng trống nội dung trong một niche, hoặc theo dõi động lực thị trường từ báo cáo công khai. Với mỗi trường hợp, pipeline vẫn gồm ba lớp: lấy nguồn, phân tích, lưu tri thức. Cần lưu ý gì trước khi áp dụng? Workflow này mạnh nhưng không phải dành cho mọi người. Nó yêu cầu người dùng quen với Claude Code, có Obsidian vault, biết cài công cụ CLI như yt-dlp và chấp nhận dùng một thư viện không chính thức để kết nối NotebookLM. Ngoài ra, vì NotebookLM và YouTube có thể thay đổi giao diện hoặc hạn chế truy cập, các skill nên được xem như công cụ cần bảo trì chứ không phải giải pháp cài một lần mãi mãi. Dù vậy, ý tưởng đằng sau rất đáng chú ý: thay vì dùng AI như một hộp chat rời rạc, hãy biến AI thành một hệ thống nghiên cứu có bộ nhớ, có pipeline và có khả năng học từ lịch sử làm việc của chính bạn. Với những người thường xuyên phân tích thị trường, công nghệ hoặc nội dung, đây là một hướng triển khai thực dụng hơn rất nhiều so với việc mở 10 tab rồi tự tổng hợp mọi thứ bằng tay.

Nam
2 thg 6, 2026