Milla Jovovich đang xây dựng Red Queen mới bằng MemPalace

Published on 8 April, 2026

Quick Summary

Milla Jovovich, ngôi sao của Resident Evil, đang hiện thực hóa siêu máy tính Red Queen thông qua dự án AI MemPalace - một hệ thống giúp trí tuệ nhân tạo có khả năng ghi nhớ vĩnh viễn và bảo mật tuyệt đối.

Milla Jovovich (nếu ai đã xem series Resident Evil chắc chắn quen mặt với Alice và cả Leeloo trong The Fifth Element nữa) Cô đã gây bất ngờ lớn cho cộng đồng AI khi ra mắt MemPalace – một hệ thống bộ nhớ AI mã nguồn mở, miễn phí, đạt điểm cao nhất từ trước đến nay trên benchmark LongMemEval. Mọi người đang nói đùa rằng cô vẫn chưa hề thoát vai khi vẫn tiếp tục làm cho tổ chức Umbrella để xây dựng Red Queen mới.

Dự án này được cô hợp tác phát triển cùng lập trình viên Ben Sigman, lấy cảm hứng từ kỹ thuật “Memory Palace” (Cung điện ký ức) cổ xưa của người Hy Lạp. Thay vì chỉ tóm tắt hay lưu trữ thông tin một cách rời rạc, MemPalace xây dựng một “cung điện ảo” có cấu trúc rõ ràng: các cánh, hành lang, phòng, tủ, ngăn kéo… để tổ chức toàn bộ cuộc trò chuyện, ý tưởng và kiến thức một cách logic và dễ tìm kiếm.

Điều đó cho ta thấy tiềm năng của AI cực lớn như thế nào khi mà nó hỗ trợ từ diễn viên, giáo sư bác sĩ tạo ra những nền tảng AI mạnh mẽ hoàn toàn có thể sử dụng được trong công việc.

Milla Jovovich cái tên quen mặt với Resident Evil

Tại sao MemPalace gây bất ngờ?

Điều bất ngờ đầu tiên là tài khoản Github của cô là chính chủ mọi người có thể xem tại https://github.com/milla-jovovich/ và điều thứ hai là Milla Jovovich không hoạt động như một KOL tham gia vào MemPalace hoàn toàn nghiêm túc, cô ấy commit code bằng chính tài khoản Github chính chủ đó, quá bất ngờ nếu mọi người không tin có thể xem ở Commit này.

Còn nếu nói về thuần kĩ thuật thì MemPalace hiện đang xuất hiện những ưu điểm sau

Hoàn toàn cục bộ (local): Chạy trên máy tính cá nhân của bạn, không cần cloud, không gửi dữ liệu ra ngoài, bảo mật cao và không tốn phí.
Lưu trữ 100% thông tin: Không tóm tắt (summarization) nên không mất mát chi tiết quan trọng.
Tích hợp dễ dàng: Hỗ trợ nhiều mô hình AI như Claude, ChatGPT, Gemini, Llama… và có thể nhập dữ liệu từ lịch sử chat, Slack, v.v.
Benchmark ấn tượng: Đạt điểm cao nhất (gần perfect score) trên LongMemEval – một bài kiểm tra khả năng nhớ dài hạn, truy vấn đa bước và cập nhật kiến thức theo thời gian.

MemPalace không chỉ là một công cụ lưu trữ, mà là cách tiếp cận mới giúp AI “nhớ như người thật” – tổ chức thông tin theo không gian thay vì chỉ dựa vào vector search hay tóm tắt.

Phân tích công nghệ AAK ngôn ngữ bí mật giúp nén bộ nhớ

Một điểm nổi bật trong MemPalace là công nghệ AAK (experimental Abbreviation-As-A-Key). Đây là lớp nén thông minh, hoạt động như một “ngôn ngữ rút gọn” mà bất kỳ LLM nào cũng có thể đọc được mà không cần decoder riêng.

AAK là gì và nó có dễ hiểu không?

Hãy tưởng tượng bạn có một cuốn sổ tay dày cộm ghi chép hàng tháng cuộc trò chuyện. Thay vì giữ nguyên từng chữ (tốn nhiều dung lượng và token), AAK sẽ rút gọn thông tin lặp lại một cách khéo léo:

Sử dụng mã viết tắt cho các thực thể thường gặp (entity codes).
Thêm dấu cấu trúc để giữ mối quan hệ.
Cắt ngắn câu nhưng vẫn giữ ý chính.

Ví dụ đơn giản: Thay vì lặp lại “Người dùng thích dùng PostgreSQL vì nó ổn định, mã nguồn mở và hiệu suất cao”, AAK có thể nén thành dạng ngắn gọn nhưng vẫn dễ hiểu như “User prefers Postgres [reason: stable, open-source, high perf]” và tất nhiên nó có thể tiết kiệm token.

Ưu điểm của AAK là gì

Nén mạnh (có thể lên đến 30x ở một số trường hợp), giúp đưa hàng tháng dữ liệu vào context window mà không vượt giới hạn.
Vẫn readable (đọc được) trực tiếp bởi mọi mô hình AI.
Hoàn toàn cục bộ, không phụ thuộc cloud.

Nhược điểm hiện tại của AAK

Đây là tính năng thử nghiệm. Trên benchmark LongMemEval, phiên bản dùng AAK đôi khi cho điểm thấp hơn chế độ raw (không nén) vì tính “lossy” (mất một phần thông tin). Đội ngũ đang tiếp tục cải tiến.

Tóm lại, AAK giống như việc bạn viết “ngắn gọn nhưng vẫn đủ ý” trong ghi chú cá nhân, giúp AI đọc nhanh và nhớ nhiều hơn mà không cần mô hình siêu lớn.

So sánh Mem0 và Zep các ông lớn bộ nhớ AI hiện nay

Mem0 và Zep là hai framework bộ nhớ AI phổ biến nhất cho agent và ứng dụng chat. Chúng giải quyết vấn đề “AI hay quên” theo cách khác nhau.

Mem0 (như “người bạn cá nhân hóa”)

Cách hoạt động: Tự động trích xuất thông tin quan trọng từ cuộc trò chuyện rồi lưu vào vector database + tùy chọn knowledge graph.
Ưu điểm: Dễ dùng, tiết kiệm token, tốt cho cá nhân hóa lâu dài.
Nhược điểm: Có thể bỏ sót chi tiết nếu tóm tắt quá mạnh. Điểm benchmark LongMemEval khoảng 49%.

Zep hoạt động như nhà sử học chuyên nghiệp

Cách hoạt động: Xây dựng temporal knowledge graph – mọi sự kiện đều có mốc thời gian rõ ràng.
Ưu điểm: Mạnh về truy vấn phức tạp, theo dõi sự thay đổi theo thời gian. Điểm benchmark khoảng 64%.
Nhược điểm: Xây dựng graph tốn thời gian và tài nguyên hơn.

Bảng so sánh nhanh

Tiêu chí	Mem0	Zep	MemPalace (Milla Jovovich)
Phong cách	Cá nhân hóa, tiết kiệm	Temporal (thời gian), sâu sắc	Cung điện ký ức – tổ chức không gian
Lưu trữ	Vector + Graph (tùy chọn)	Temporal Knowledge Graph	Toàn bộ dữ liệu + cấu trúc phòng + AAK nén
Benchmark	~49%	~64%	Cao nhất (gần 100% ở một số config)
Chi phí/Tài nguyên	Thấp	Trung bình – cao	Rất thấp (chạy local, miễn phí)
Dễ dùng	Rất dễ	Trung bình	Dễ, một lệnh cài đặt
Bảo mật	Tốt (có self-host)	Tốt (có cloud)	Xuất sắc (100% local)

MemPalace mang lại điều gì cho cộng đồng AI

MemPalace của Milla Jovovich mang đến làn gió mới cho lĩnh vực AI memory: chứng minh rằng không cần mô hình khổng lồ hay cloud đắt tiền, chỉ cần ý tưởng sáng tạo từ kỹ thuật cổ xưa kết hợp công nghệ hiện đại cũng có thể tạo ra kết quả vượt trội.

Nếu bạn đang xây dựng AI agent hoặc muốn AI cá nhân của mình “nhớ dai” hơn, MemPalace đáng để thử ngay (cài qua pip và chạy local). Đây không chỉ là công cụ, mà là bước tiến thú vị trong việc làm AI gần gũi và đáng tin cậy hơn với con người.

Discussion (0)

No comments yet. Be the first!

Tính năng lắc điện thoại để tóm tắt của Firefox đã có mặt trên Android

Bạn có bao giờ mở một bài viết dài 3.000 chữ trên web trong điện thoại rồi không biết nên đọc hay thoát ra không? Mozilla có câu trả lời: lắc điện thoại. Tính năng "Shake to Summarize" từng được TIME vinh danh là một trong những phát minh tốt nhất năm 2025 vừa chính thức ra mắt trên Android cùng với Firefox 150. Shake to Summarize là gì và nó hoạt động ra sao? Shake to Summarize là tính năng AI tích hợp sẵn trong trình duyệt Firefox, cho phép người dùng nhận ngay bản tóm tắt nội dung của bất kỳ trang web nào mà không cần rời khỏi trình duyệt hay mở thêm ứng dụng nào khác. Để kích hoạt, người dùng có ba cách: Lắc điện thoại trong khi đang xem trang web Nhấn biểu tượng sấm sét trên thanh địa chỉ Vào menu ba chấm → Summarize Page Sau vài giây, Firefox mở một bảng nhỏ và hiển thị các ý chính của trang. Điểm đáng chú ý là bản tóm tắt thích nghi theo loại nội dung — công thức nấu ăn thì rút ra các bước cần làm, bài thể thao thì tập trung vào tỷ số và thống kê, bài tin tức thì làm nổi bật những diễn biến then chốt. Tính năng hoạt động với các trang dưới 5.000 từ. Với các trang dài hơn, Firefox sẽ không thể tạo tóm tắt. Hành trình từ iOS đến Android Shake to Summarize ra mắt lần đầu trên iOS vào tháng 9 năm 2025, ban đầu chỉ dành cho người dùng tại Mỹ với giao diện tiếng Anh. Phản hồi tích cực đến mức Mozilla nhận được đề cử đặc biệt từ TIME Best Inventions 2025 một giải thưởng hiếm khi dành cho tính năng của trình duyệt. Phiên bản Android đi qua giai đoạn thử nghiệm kỹ lưỡng trên Firefox Nightly trước khi được đưa vào bản chính thức Firefox 150, phát hành tháng 4 năm 2026. Trước đó, muốn dùng thử trên Android, người dùng phải mở Settings → About Firefox Nightly → nhấn logo ba lần để vào "Secret Settings" rồi bật thủ công — một quy trình rõ ràng là chỉ dành cho người dùng kỹ thuật. AI nào đứng sau tính năng này? Mozilla không dùng một mô hình duy nhất mà phân chia theo thiết bị: Với iPhone 15 Pro trở lên chạy iOS 26+, tóm tắt được tạo hoàn toàn trên máy nhờ Apple Intelligence dữ liệu không rời khỏi thiết bị. Với các thiết bị còn lại, nội dung trang được gửi đến máy chủ AI của Mozilla, xử lý xong rồi trả kết quả về. Về phía Mozilla, đội ngũ kỹ thuật đã thử nghiệm nhiều mô hình gồm Mistral Nemo, Mistral Small, Jamba 1.5 Mini, Gemini Flash 2.0 và Llama 4 Maverick trước khi chọn Mistral Small làm mô hình chính. Lý do: Mistral Small có trọng số mở (open weights), tốc độ xử lý nhanh và chi phí inference thấp hơn đáng kể so với các đối thủ — trong khi chất lượng tóm tắt vẫn ở mức cao. Mozilla cung cấp Shake to Summarize miễn phí và tự chịu toàn bộ chi phí inference, không tính phí người dùng. Người dùng không muốn AI thì sao? Đây là điểm Mozilla xử lý khá khéo. Sau khi bị phản ứng từ cộng đồng người dùng lâu năm những người lo ngại Firefox đang rời bỏ giá trị cốt lõi về quyền riêng tư Mozilla đã thêm nút tắt toàn bộ tính năng AI trong cài đặt trình duyệt. Trên desktop, tùy chọn "Block AI enhancements" cho phép tắt tất cả tính năng AI hiện tại lẫn tương lai, hoặc chọn lọc từng tính năng muốn giữ. Trên Android, Shake to Summarize được liên kết với bộ điều khiển AI Controls mới cả khi tắt AI, cả cử chỉ lắc và nút tóm tắt đều bị vô hiệu hóa đồng thời. Tính năng hiện chỉ hỗ trợ nội dung tiếng Anh. Người dùng tại Việt Nam muốn dùng cần chuyển ngôn ngữ hệ thống hoặc chờ Mozilla mở rộng hỗ trợ thêm ngôn ngữ. Firefox 150 còn có gì khác? Bên cạnh Shake to Summarize trên Android, Firefox 150 đem theo một số cập nhật đáng chú ý: Mở link trong chế độ split view (xem hai trang song song) Sao chép URL từ nhiều tab cùng lúc Dịch riêng tư theo thời gian thực trên trang chuyên dụng VPN tích hợp miễn phí mở rộng sang Canada (trước đó chỉ có ở một số thị trường) Hệ thống quản lý profile mới dành cho tất cả người dùng Firefox 151 dự kiến ra mắt ngày 19 tháng 5 năm 2026 và có thể sẽ tiếp tục mở rộng AI Controls trên di động. Đánh giá thực tế từ người dùng Shake to Summarize giải quyết đúng một vấn đề thực sự: đọc lướt trên điện thoại rất khó chịu, nhưng đọc toàn bộ thì tốn thời gian. Thay vì mở thêm một ứng dụng AI khác, Mozilla nhúng khả năng tóm tắt thẳng vào luồng duyệt web cử chỉ lắc điện thoại tuy trông có vẻ "vui", nhưng thực ra là lối tắt nhanh nhất có thể nghĩ ra trên mobile. Hạn chế lớn nhất hiện tại là giới hạn tiếng Anh, điều này làm giảm đáng kể giá trị với người dùng Việt Nam. Nhưng nếu Mozilla tiếp tục lộ trình mở rộng ngôn ngữ như đã làm với tính năng dịch thuật, đây sẽ là một trong những lý do thuyết phục nhất để quay lại dùng Firefox trên điện thoại.

Nam•

19 May, 2026

HTML sẽ thay thế Markdown khi làm việc với AI ?

Markdown đã là chuẩn mặc định khi làm việc với AI suốt nhiều năm nhưng một kỹ sư đến từ Claude Code tại Anthropic vừa đặt ra câu hỏi đáng suy nghĩ: liệu thói quen đó có thực sự là lựa chọn tốt nhất? Bài viết ngắn của Thariq Shihipar thu hơn 15.000 lượt thích trên X chỉ trong vài ngày, và lý do thuyết phục hơn bạn nghĩ. Markdown ra đời từ thời AI còn nghèo token Nhìn lại thời GPT-4 với cửa sổ ngữ cảnh chỉ 8.192 token, Markdown là lựa chọn hoàn toàn hợp lý trong khi đó HTML cồng kềnh hơn, tốn tài nguyên hơn và trong bối cảnh hạn chế đó, sự tối giản của Markdown là một ưu điểm thực sự chỉ để tiết kiệm. Vì vậy Markdown trở thành chuẩn ngầm định, và thói quen đó theo chúng ta đến tận bây giờ.Ngay cả khi Anthropic tạo ra khái niệm Skill trên Claude họ cũng đã lấy Markdown làm tiêu chuẩn với file SKILL.md, những ai hay làm việc với skill chắc chắn hiểu rõ điều mặc định này. Tuy nhiên, các mô hình AI hiện tại đã vận hành ở quy mô hoàn toàn khác. Nhiều mô hình đang hỗ trợ cửa sổ ngữ cảnh từ 200.000 đến 1 triệu token, và chi phí xử lý không còn là rào cản đáng lo (theo lời của Thariq Shihipar) và anh ấy lập luận rằng đây chính là thời điểm để xem lại mặc định đó. HTML làm được gì mà Markdown không thể? Lý do cốt lõi Thariq đưa ra khá đơn giản: một số loại thông tin vốn có tính không gian nhưng Markdown buộc chúng phải trở thành văn bản tuyến tính. Khi bạn so sánh ba hướng tiếp cận kỹ thuật thì bạn cần nhìn chúng cạnh nhau, không phải đọc lần lượt rồi cố giữ trong đầu. Khi bạn xem lại một đoạn code bạn cần thấy cấu trúc thay đổi tất nhiên không phải một bức tường chữ. HTML giải quyết đúng vấn đề đó vì vậy Thariq đã liệt kê 9 nhóm tình huống cụ thể mà HTML vượt trội hơn Markdown: Khám phá và lên kế hoạch: So sánh nhiều hướng tiếp cận cạnh nhau thay vì đọc tuần tự, rồi chuyển thành kế hoạch triển khai có sơ đồ luồng và mốc thời gian. Xem lại mã nguồn và hiểu cấu trúc dự án: Phần thay đổi được chú thích trực tiếp bằng màu sắc theo mức độ nghiêm trọng, sơ đồ mô-đun dạng hộp và mũi tên — thay vì văn bản thuần túy. Thiết kế giao diện: Bảng màu hiển thị thực tế có thể sao chép ngay, các biến thể thành phần giao diện được dựng trực tiếp thay vì mô tả bằng chữ. Tạo nguyên mẫu nhanh: Bảng điều chỉnh hiệu ứng chuyển động có thanh kéo thông số, màn hình có thể nhấp thực sự, đây là thứ Markdown không thể biểu đạt. Sơ đồ và hình minh họa: Đồ họa véc-tơ nội tuyến cho phép vẽ lưu đồ thực sự, không phải ký tự ASCII ghép lại. Bộ trình chiếu: Vài thẻ <section> và 20 dòng mã JavaScript là một bộ slide điều hướng bằng phím mũi tên mà không cần phần mềm chuyên dụng hay bước xuất file. Nghiên cứu và học tập: Tài liệu có phần thu gọn, tab mã, bảng chú giải thuật ngữ — thay vì đổ toàn bộ nội dung theo một chiều dọc. Báo cáo định kỳ: Bản tóm tắt trạng thái hàng tuần với biểu đồ nhỏ và màu sắc phân biệt tiến độ khiến người đọc thực sự đọc, không chỉ lướt qua. Giao diện chỉnh sửa tùy chỉnh: Bảng phân loại nhiệm vụ kéo thả, trình chỉnh cờ tính năng có cảnh báo phụ thuộc đây là công cụ thực sự, không phải văn bản đọc rồi thôi. Thariq đã tập hợp 20 file minh họa tất cả các nhóm này tại thariqs.github.io/html-effectiveness mỗi file mở thẳng trên trình duyệt, không cần cài đặt gì thêm. Dùng HTML với AI như thế nào trong thực tế? Cách áp dụng không phức tạp mà chỉ cần thay đổi cách bạn viết prompt. Thay vì để mô hình tự chọn định dạng đầu ra, hãy chỉ định rõ HTML khi nội dung cần được xem xét, tương tác, hoặc chia sẻ với người khác. Ví dụ câu lệnh Thariq gợi ý để xem lại một đoạn mã: Giúp tôi xem xét PR này bằng cách tạo một tài liệu HTML mô tả nó. Tôi không quen lắm với logic streaming/backpressure nên hãy tập trung vào phần đó. Hiển thị diff thực tế với các chú thích lề nội tuyến, mã màu các phát hiện theo mức độ nghiêm trọng và bất cứ thứ gì khác cần thiết để diễn đạt khái niệm một cách rõ ràng. Tương tự, bạn có thể yêu cầu AI tạo kế hoạch triển khai dưới dạng HTML với mốc thời gian và sơ đồ luồng dữ liệu, hoặc bản báo cáo trạng thái hàng tuần với biểu đồ nhỏ và màu sắc phân biệt tiến độ. Simon Willison tác giả blog kỹ thuật nổi tiếng cũng đã thừa nhận bài viết này khiến ông nhìn lại thói quen dùng Markdown từ thời GPT-4 cho đến tận thời điểm hiện tại. Khi các mô hình AI hiện đại có thể nhúng đồ họa véc-tơ, tiện ích tương tác và điều hướng nội trang, Markdown không còn là lựa chọn mặc định hiển nhiên nữa. Markdown vẫn còn chỗ đứng tất nhiên không phải ở mọi nơi Thariq không nói luôn luôn sử dụng HTML mà anh ấy phân biệt khá rõ: Markdown phù hợp cho trò chuyện thông thường, đoạn mã ngắn, câu trả lời vài dòng, và bất cứ thứ gì thuần văn bản trong khi đó HTML phát huy sức mạnh khi đầu ra cần bố cục không gian, màu sắc, khả năng tương tác, hoặc cấu trúc phức tạp đó là khi nội dung đủ nhiều chiều để Markdown bắt đầu làm phẳng thông tin thay vì truyền tải nó. Cộng đồng đã phản ứng khá nhanh: một skil mang tên html-artifacts đã xuất hiện trên GitHub, giúp AI tự nhận biết khi nào nên tạo file HTML thay vì Markdown bao gồm 9 nhóm tình huống từ bài viết gốc của Thariq hoàn toàn có thể sử dụng với bất cứ model nào hỗ trợ đọc skill. Đặc biệt skill này phần loại trừ rõ ràng cho câu trả lời ngắn và đầu ra chỉ có mã code. Mọi người có thể tham khảo tại github.com/dogum/html-artifacts. Trong bài Thariq không nhắc đến JSON nhưng đây cũng là định dạng hay sử dụng với AI đặc biệt đối với những ai hay dùng n8n, Make hay Zapier. Mặc dù vậy mỗi định dạng mang đến một màu sắc riêng trong những tình huống riêng. Markdown, HTML và JSON phân chia sử dụng như thế nào Cuộc tranh luận thực ra không chỉ là Markdown hay HTML. JSON cũng là định dạng phổ biến khi làm việc với AI, đặc biệt trong các luồng xử lý dữ liệu và tích hợp hệ thống. Ba định dạng này phục vụ ba mục đích khác nhau, và hiểu rõ ranh giới đó giúp bạn chọn đúng công cụ cho từng tình huống. Markdown tốt nhất cho văn bản đọc trực tiếp trong chat: ghi chú, giải thích ngắn, đoạn mã, tài liệu đơn giản. Nhanh, nhẹ, không cần mở thêm gì. HTML tốt nhất khi đầu ra cần được nhìn, tương tác hoặc chia sẻ: báo cáo có bố cục, sơ đồ, bảng so sánh, bộ trình chiếu, giao diện tùy chỉnh. Mở bằng trình duyệt là xong. JSON tốt nhất khi đầu ra cần được máy đọc tiếp: lưu trữ dữ liệu có cấu trúc, truyền giữa các hệ thống, hoặc làm đầu vào cho bước xử lý tiếp theo. Con người đọc được nhưng không phải để đọc. Nói cách khác, JSON không cạnh tranh với HTML hay Markdown về mặt trình bày mà nó phục vụ một mục đích hoàn toàn khác. Vấn đề thực sự nằm ở chỗ nhiều người dùng AI mặc định nhận đầu ra dưới dạng Markdown ngay cả khi họ cần HTML để xem, hoặc cần JSON để xử lý tiếp. Chỉ cần chỉ định rõ trong câu lệnh, AI sẽ điều chỉnh theo. Quy tắc chọn nhanh: Đầu ra để đọc trong chat → Markdown. Đầu ra để xem trên trình duyệt → HTML. Đầu ra để máy xử lý tiếp → JSON. Điều này có làm thay đổi gì với người dùng AI thông thường? Nếu bạn dùng AI chủ yếu để hỏi đáp hoặc viết lách, thay đổi này ít tác động hơn. Nhưng nếu bạn đang dùng AI để làm nhiều việc hơn như phân tích dữ liệu, lên kế hoạch dự án, xem lại tài liệu, tổng hợp nghiên cứu, hay tạo báo cáo cho đồng nghiệp đây là điều chỉnh nhỏ trong cách prompt nhưng tạo ra khoảng cách rõ rệt về chất lượng đầu ra, dù bạn đang dùng công cụ AI nào. Bạn nên thử một lần: lần tới khi cần AI so sánh các lựa chọn hoặc tóm tắt một tài liệu phức tạp, thêm vào cuối câu lệnh "tạo dưới dạng file HTML ". Mở file đó trên trình duyệt và so sánh với cách bạn vẫn làm với Markdown hay JSON thì kết quả thường nói lên tất cả.

Nam•

10 May, 2026

Xây dựng bộ não thứ hai với LLM Wiki của Karpathy

Andrej Karpathy — đồng sáng lập OpenAI, cựu giám đốc AI tại Tesla và người đặt ra thuật ngữ "vibe coding" — đã chia sẻ trên X cách ông đang dùng AI, và câu trả lời không phải là viết code nhanh hơn mà là xây một hệ thống kiến thức cho bộ não thứ hai có khả năng tự duy trì, tự liên kết và tự cập nhật — đó là LLM Wiki. Wiki nghiên cứu của anh ấy viết về một chủ đề đã đạt 100 bài viết và 400.000 từ và điều đáng chú ý là toàn bộ do AI viết mà không cần ông gõ một chữ nào. Vấn đề với cách chúng ta đang dùng AI để tổ chức kiến thức RAG có tích lũy kiến thức theo thời gian như bộ não chúng ta không Hầu hết công cụ AI hiện tại xử lý tài liệu theo mô hình RAG — bạn tải lên tài liệu, đặt câu hỏi, hệ thống tìm đoạn văn bản liên quan rồi AI tổng hợp câu trả lời. NotebookLM của Google, ChatGPT với file upload, và hầu hết các quy trình AI đều dùng cách này vì nó rất đơn giản và dễ triển khai. Tuy nhiên Karpathy chỉ ra vấn đề cốt lõi mà ít người chú ý: RAG không tích lũy kiến thức. Mỗi lần bạn hỏi, hệ thống bắt đầu lại từ đầu — đọc lại tài liệu, tìm đoạn liên quan, ghép câu trả lời — rồi hỏi lại câu đó hôm sau thì nó lặp lại toàn bộ quá trình như chưa từng xảy ra. Tài liệu từ tháng 3 và tài liệu từ tháng 10 không tự kết nối với nhau tất nhiên là không có gì tích lũy và không có gì học được từ lần trước hoàn toàn không giống như cách bộ não chúng ta hoạt động. Karpathy mô tả sự thay đổi trong tư duy của mình bằng một câu rất ngắn nhưng nói lên nhiều thứ: phần lớn lượng token ông tiêu tốn gần đây không còn đi vào việc thao tác code mà đi vào việc thao tác kiến thức. LLM Wiki hoạt động như thế nào? LLM Wiki không phải phải phần mềm mà đây là một kiến trúc tư duy Obsidian Ý tưởng của Karpathy không phải là một phần mềm hay thư viện mới mà anh ấy công bố nó dưới dạng "idea file" để tạo ra kiến trúc giống với Obsidian — Anh ấy đã tạo ra file GitHub Gist được thiết kế để copy-paste trực tiếp vào một AI agent như Claude Code hoặc OpenAI Codex, rồi để agent tự xây hệ thống theo kiến trúc đó kết hợp với người dùng. Điều này có nghĩa là bạn không cài gì cả, mà thay vào đó bạn mô tả kiến trúc cho AI rồi AI tự triển khai nó cho bạn. Ba lớp kiến trúc cốt lõi của Wiki Hệ thống được tổ chức theo ba lớp rõ ràng và mỗi lớp có vai trò không thể thay thế cho nhau: Thư mục nguồn thô (raw/): Nơi bạn thả bất cứ tài liệu nào vào — PDF, bài báo, transcript, ghi chú, đoạn tweet — và AI đọc nhưng không bao giờ sửa thư mục này. Nguyên tắc thiết kế ở đây rất quan trọng: thu thập trước, tổ chức sau, tức là bạn không cần phải phân loại hay chuẩn bị tài liệu trước khi đưa vào. Wiki (wiki/): Thư mục chứa toàn bộ các file markdown do AI tạo và duy trì, và đây là nơi kiến thức được biên dịch, liên kết và tổng hợp. Mỗi tài liệu trong raw/ được AI đọc và tích hợp vào wiki — cập nhật các trang liên quan, ghi chú mâu thuẫn, tạo backlink sang các khái niệm liên quan. File cấu hình (CLAUDE.md hoặc tương đương): Bộ quy tắc nói cho AI biết cách tổ chức wiki, format bài viết, xử lý mâu thuẫn và duy trì nhất quán xuyên suốt toàn bộ hệ thống. Karpathy mô tả mối quan hệ giữa các thành phần bằng một câu rất hình ảnh: "Obsidian là IDE. LLM là lập trình viên. Wiki là codebase." Bạn không tự viết wiki mà thay vào đó bạn đặt câu hỏi, khám phá, trong khi AI làm phần việc tẻ nhạt là duy trì và cập nhật cơ sở dữ liệu. Vòng lặp tự duy trì là điểm khác biệt thực sự Ba thao tác chạy liên tục không cần can thiệp Điều làm LLM Wiki khác với các công cụ ghi chú AI thông thường là vòng lặp hoạt động tích cực sau khi Wiki đã được xây dựng và AI không chỉ tóm tắt tài liệu một lần rồi thôi mà nó chạy ba thao tác liên tục: Ingest (thu thập): Khi bạn thả một tài liệu mới vào thư mục nguồn, AI đọc nó, trích xuất thông tin quan trọng và tích hợp vào wiki — cập nhật các trang đã có, tạo trang mới nếu cần, đồng thời ghi chú chỗ nào thông tin mới mâu thuẫn với cái cũ thay vì xóa đi một cách tùy tiện. Query (truy vấn): Bạn hỏi bằng ngôn ngữ tự nhiên và vì wiki đã được biên dịch và cấu trúc sẵn nên AI trả lời với độ chính xác cao và có thể trích dẫn đến từng trang cụ thể, thay vì ghép câu trả lời từ các đoạn rải rác như RAG thông thường. Lint (kiểm tra chất lượng): AI định kỳ quét toàn bộ wiki để phát hiện link bị hỏng, trang cô lập không được liên kết với phần còn lại, thông tin mâu thuẫn giữa các trang, và lỗ hổng kiến thức chưa được bao phủ. Karpathy gọi đây là "CI/CD cho knowledge base" — tức là hệ thống tự kiểm tra chất lượng của chính mình. Karpathy giải thích lý do hệ thống này bền vững hơn wiki truyền thống do con người duy trì bằng một nhận xét đơn giản nhưng rất chính xác: "Con người bỏ cuộc với wiki vì gánh nặng bảo trì tăng nhanh hơn giá trị nó mang lại. LLM không chán, không quên cập nhật tài liệu đối chiếu và có thể chỉnh 15 file trong một lần chạy." Tại sao không cần RAG ở quy mô cá nhân? Context window đã đủ lớn để thay thế vector database Lập luận gây tranh cãi nhất trong đề xuất của Karpathy là tuyên bố RAG không cần thiết ở quy mô cá nhân, và logic của anh ấy như sau: một bộ não thứ hai toàn diện — dù bao phủ toàn bộ lĩnh vực nghiên cứu của bạn — thường chỉ khoảng 500.000 đến 2 triệu token sau khi biên dịch thành markdown. Với các model có context window dài hiện tại, toàn bộ Wiki đó có thể đưa vào context trong một lần truy vấn mà không cần hệ thống tìm kiếm vector phức tạp nào. Karpathy báo cáo rằng ở quy mô khoảng 100 bài viết và 400.000 từ, hệ thống xử lý câu hỏi phức tạp tốt mà không cần vector database hay RAG infrastructure nào, vì AI tự xây và duy trì các file index và tóm tắt rồi điều hướng qua toàn bộ tập hợp văn bản hiệu quả nhờ cấu trúc tự xây đó. Tuy nhiên cần lưu ý một điểm quan trọng: giới hạn này có thực. Khi wiki vượt qua một ngưỡng nhất định có thể là vài triệu token thì context window bắt đầu trở thành nút thắt cổ chai thực sự, và lúc đó các công cụ tìm kiếm như qmd (hybrid BM25/vector search cho markdown) sẽ cần được tích hợp thêm để duy trì hiệu suất. Cách bắt đầu thực tế trong 15 phút Các bước đầu tiên để có wiki đầu tiên như thế nào Karpathy thiết kế hệ thống này để bất kỳ ai có Claude Code hoặc công cụ AI agent tương đương đều có thể triển khai ngay mà không cần kiến thức kỹ thuật chuyên sâu. Quy trình cơ bản gồm bốn bước: Tạo một vault Obsidian mới — đây chỉ là một thư mục trên máy tính, nơi toàn bộ file markdown sẽ được lưu và Obsidian chỉ là giao diện để bạn đọc và điều hướng. Tạo hai thư mục con: raw/ để chứa tài liệu nguồn và wiki/ để AI viết và duy trì — hai thư mục này là tất cả những gì bạn cần thiết lập thủ công. Copy GitHub Gist của Karpathy tại Github và paste vào Claude Code hoặc AI agent bạn đang dùng, vì Gist được viết như một bộ hướng dẫn cho agent và để agent tự xây phần chi tiết cùng bạn thay vì bạn phải làm tất cả. Thả vài tài liệu đầu tiên vào raw/ và để agent bắt đầu biên dịch wiki — từ đây mọi thứ sẽ tự chạy. Cả hệ thống chạy hoàn toàn trên máy local với chỉ hai phụ thuộc là Obsidian để xem và điều hướng, và một AI agent để viết và duy trì. Điều này có nghĩa là không có vendor lock-in, không có dữ liệu gửi lên cloud nếu bạn dùng model local, và không có phí thuê bao nào ngoài chi phí gọi API của model bạn chọn. LLM Wiki so với MemPalace, Mem0 và Zep Bốn triết lý khác nhau cho cùng một vấn đề Cùng thời điểm LLM Wiki của Karpathy được chú ý, cộng đồng AI cũng đang thảo luận về MemPalace là một hệ thống bộ nhớ mã nguồn mở do diễn viên Milla Jovovich và kỹ sư Ben Sigman xây dựng, đạt 96.6% trên benchmark LongMemEval. Cả bốn hệ thống LLM Wiki, MemPalace, Mem0 và Zep đều giải quyết vấn đề AI không nhớ ngữ cảnh giữa các session, nhưng theo bốn triết lý rất khác nhau và phù hợp với bốn nhu cầu khác nhau. Cách dễ nhất để hình dung sự khác biệt là qua một tình huống cụ thể: bạn đã có 6 tháng hội thoại với AI về một dự án nghiên cứu — mọi quyết định, mọi lý luận, mọi phương án bị loại bỏ. Mở session mới và hỏi lại "Tại sao lúc đó mình chọn hướng A thay vì B?" — mỗi hệ thống sẽ trả lời theo cách hoàn toàn khác nhau. Mem0 hoạt động như người thư ký ghi tóm tắt cuộc họp, nghĩa là nó dùng AI để đọc hội thoại, trích xuất các "facts" quan trọng như sở thích và quyết định đã đưa ra, rồi lưu vào vector database. Khi bạn hỏi lại, nó tìm fact gần nhất với câu hỏi và trả về — nhanh, dễ tích hợp và phù hợp với chatbot thương mại, nhưng lý do đằng sau quyết định cùng chuỗi lập luận dẫn đến kết quả thường đã biến mất vì AI đã tự quyết định thứ đó không quan trọng. Zep tinh vi hơn một bước với knowledge graph có yếu tố thời gian, tức là nó không chỉ nhớ "bạn thích X" mà nhớ "tháng 1 bạn nghĩ X, tháng 3 bạn đổi sang Y vì lý do Z". Điểm mạnh là hiểu được sự thay đổi theo thời gian và phù hợp cho ứng dụng cần track tiến trình người dùng, tuy nhiên Zep vẫn dùng AI để quyết định thông tin nào được đưa vào graph nên vẫn có nguy cơ mất context quan trọng — đặc biệt là những lý luận phức tạp mà AI đánh giá là không cần thiết. MemPalace theo triết lý ngược hoàn toàn: "lưu tất cả, rồi làm cho nó tìm được". Thay vì để AI quyết định cái gì đáng nhớ, MemPalace lưu nguyên văn toàn bộ hội thoại vào ChromaDB rồi tổ chức theo cấu trúc phân cấp lấy cảm hứng từ kỹ thuật ký ức cung điện của người Hy Lạp cổ: Wing → Hall → Room → Closet → Drawer. Không có gì bị lọc bỏ nhưng mọi thứ đều có địa chỉ rõ ràng để tìm lại, và hệ thống chạy hoàn toàn trên máy local mà không gửi dữ liệu ra ngoài. LLM Wiki của Karpathy giải quyết bài toán khác hẳn so với ba hệ thống trên. Thay vì nhớ hội thoại, nó biên dịch tài liệu thành kiến thức có cấu trúc — bạn không đưa vào lịch sử chat mà đưa vào bài báo, transcript, ghi chú nghiên cứu, rồi AI xây một wiki markdown có liên kết, tóm tắt và có thể truy vấn. Mỗi tài liệu mới không chỉ được lưu mà được tích hợp vào kiến thức đã có, tạo ra kết nối mới giữa các khái niệm và làm giàu thêm những gì đã biết. Bảng so sánh để chọn đúng công cụ cho đúng nhu cầu table { width: 100%; border-collapse: collapse; margin: 20px 0; font-family: Arial, sans-serif; } th, td { border: 1px solid #ddd; padding: 12px; text-align: left; } th { background-color: #f4f4f4; font-weight: bold; } tr:nth-child(even) { background-color: #fafafa; } tr:hover { background-color: #f1f1f1; } Tiêu chí LLM Wiki MemPalace Mem0 Zep Nguồn dữ liệu Tài liệu nghiên cứu, bài báo, transcript Lịch sử hội thoại với AI Lịch sử hội thoại Lịch sử hội thoại Cách lưu trữ Markdown có cấu trúc, AI biên dịch Nguyên văn toàn bộ, phân cấp không gian Facts được trích xuất bởi AI Knowledge graph có thời gian AI có lọc thông tin? Có — AI quyết định cách tổ chức Không — lưu tất cả Có — AI chọn facts quan trọng Có — AI chọn entities và relations Chạy local? Có — chỉ cần Obsidian + model Có — ChromaDB + SQLite trên máy Không — cloud service Không — cloud service Phù hợp nhất với Nghiên cứu, học tập, tổng hợp tài liệu Nhớ ngữ cảnh AI theo thời gian dài Chatbot, ứng dụng thương mại App cần track tiến trình người dùng Điểm yếu Không nhớ hội thoại, cần setup ban đầu Tốn dung lượng, chưa có UI trực quan Mất lý luận phức tạp Phụ thuộc cloud, vẫn có thể mất context Điểm quan trọng nhất cần nhớ khi chọn: LLM Wiki và MemPalace giải quyết hai vấn đề khác nhau và hoàn toàn có thể dùng song song thay vì phải chọn một. MemPalace nhớ lịch sử các cuộc trò chuyện của bạn với AI — tức là nó biết bạn đã nói gì, đã quyết định gì và đã thay đổi quan điểm như thế nào. LLM Wiki thì tổ chức kiến thức từ thế giới bên ngoài đó có thể là bài báo bạn đọc, video bạn xem, tài liệu bạn thu thập. Kết hợp cả hai cho phép AI vừa hiểu bạn là ai vừa hiểu lĩnh vực bạn đang nghiên cứu và cả 2 kết hợp mới thành bộ não thứ hai đầy đủ hơn. Insight đáng suy nghĩ nhất từ LLM Wiki Phần đông chúng ta đang dùng AI như một công cụ tạo ra câu trả lời nhất thời — mỗi session bắt đầu từ đầu và không có gì tích lũy. LLM Wiki của Karpathy gợi ý một hướng khác: dùng AI như một bộ biên dịch kiến thức, nơi mỗi tài liệu mới không chỉ được lưu trữ mà được tích hợp vào một cấu trúc đã có, tạo ra kết nối mới và làm giàu những gì đã biết. Nếu bạn đang nghiên cứu một lĩnh vực cụ thể — AI, công nghệ, tài chính hay bất kỳ thứ gì — đây là thứ đáng thử ngay hôm nay: tạo một thư mục, thả vào đó 5 bài viết bạn đã đọc gần đây, và để Claude Code bắt đầu xây wiki đầu tiên. Sau một tuần thêm tài liệu đều đặn, bạn sẽ thấy sự khác biệt giữa một kho lưu trữ và một cơ sở kiến thức thực sự. Nếu bạn đang nghiên cứu một lĩnh vực cụ thể — AI, công nghệ, tài chính, bất kỳ thứ gì — đây là thứ đáng thử ngay hôm nay: tạo một thư mục, thả vào đó 5 bài viết bạn đã đọc gần đây, và để Claude Code bắt đầu xây wiki đầu tiên. Sau một tuần thêm tài liệu đều đặn, bạn sẽ thấy sự khác biệt giữa một kho lưu trữ và một cơ sở kiến thức thực sự.

Nam•

11 Apr, 2026

DLSS 5 của Nvidia: AI render đẹp hơn thật, nhưng đây còn là game gốc không?

Đây là Van Dijk mà chúng ta biết hay sao. Nhìn vào hai tấm ảnh cùng chụp Van Dijk trong EA Sports FC: một tấm ghi "DLSS 5 Off", một tấm ghi "DLSS 5 On" với cùng một khung hình, cùng một pha bóng. Nhưng khuôn mặt trông khác, nó thể hiện sắc nét hơn và có chiều sâu hơn, cộng thêm ánh sáng đổ bóng tự nhiên hơn, tất nhiên cũng vì thế mà trở nên ít giống nhân vật gốc hơn. Đây chính là điều Nvidia vừa giới thiệu tại GTC 2026 và cũng chính là lý do khiến cộng đồng game thủ đang dậy sóng. DLSS là gì và hành trình từ phiên bản 1 đến 5 DLSS viết tắt của Deep Learning Super Sampling, công nghệ Nvidia sử dụng AI để giải quyết bài toán kinh điển của gaming đó là game thủ nào cũng muốn đồ họa đẹp thì phải có GPU mạnh, muốn FPS cao thì phải giảm chất lượng hình ảnh. DLSS ra đời để phá vỡ cái vòng luẩn quẩn đó bằng AI. Hành trình qua từng phiên bản cho thấy rõ tư duy của Nvidia đã thay đổi như thế nào: DLSS 1 (2018): Xuất hiện cùng dòng card RTX 20 series. Ý tưởng cơ bản là render game ở độ phân giải thấp hơn, rồi dùng AI upscale lên 4K. Kết quả trông mờ và thiếu chi tiết đến mức nhiều game thủ không thèm bật. DLSS 2 (2020): Bước nhảy vọt thực sự. Nvidia cải thiện mô hình AI đáng kể, đưa vào kỹ thuật temporal accumulation, tức AI học cách ghép thông tin từ nhiều frame liên tiếp để tái tạo chi tiết sắc nét hơn. Đây là lúc DLSS bắt đầu được game thủ dùng thật sự. DLSS 3 (2022): Bổ sung Frame Generation, khả năng AI tạo ra frame hoàn toàn mới xen giữa các frame thật để nhân đôi FPS. Bị chỉ trích vì gây input lag trên một số tựa game. DLSS 3.5 (2023): Thêm Ray Reconstruction, dùng AI để tái tạo các hiệu ứng ray tracing thay vì tính toán thủ công toàn bộ. DLSS 5 (2026): Bước đột phá hoàn toàn khác về bản chất. Từ đây, Nvidia không chỉ upscale hay tạo thêm frame nữa. AI bắt đầu vẽ lại toàn bộ ánh sáng, vật liệu và chi tiết bề mặt theo thời gian thực. Kỹ thuật AI nào đứng sau DLSS 5 Điểm khác biệt cốt lõi của DLSS 5 so với tất cả các phiên bản trước nằm ở chỗ: đây là lần đầu tiên AI không chỉ cải thiện ảnh có sẵn mà còn tạo ra nội dung hình ảnh mới hoàn toàn dựa trên dữ liệu 3D của scene. Cụ thể hơn, DLSS 5 nhận vào dữ liệu màu sắc và motion vectors của từng frame, rồi dùng mô hình neural rendering để tái tạo ánh sáng và vật liệu photoreal. Điều làm nó không bị "ảo giác" như các AI image generator thông thường là nó được neo chặt vào scene graph của game engine, tức là cấu trúc 3D gốc của từng vật thể trong game. AI biết đây là khuôn mặt người, đây là vải áo, đây là bóng đổ, nên nó tái tạo đúng vật lý chứ không tự phát minh chi tiết ngẫu nhiên. Jensen Huang gọi đây là "khoảnh khắc GPT của đồ họa", tức là thời điểm AI bắt đầu thay thế một phần công việc render truyền thống. Nvidia dự kiến ra mắt chính thức vào mùa thu 2026, với các tựa game đã xác nhận tích hợp gồm: Starfield (Bethesda) Resident Evil Requiem (CAPCOM) Hogwarts Legacy (Warner Bros. Games) Assassin's Creed Shadows (Ubisoft) Demo tại GTC cần đến 2 card RTX 5090, dù Nvidia khẳng định phiên bản thương mại sẽ chạy được trên một GPU duy nhất. Game thủ lo ngại điều gì: Khi AI bắt đầu "vẽ lại" nhân vật của bạn Nhìn lại so sánh ở đầu bài, bản DLSS 5 On trông sắc nét và photoreal hơn thật. Nhưng cộng đồng game thủ không vui vì điều đó. Vấn đề là khuôn mặt bị thay đổi. Không nhiều, nhưng đủ để nhận ra. Và đây chính xác là lo ngại mà hàng nghìn người đang bày tỏ trên các diễn đàn: khi AI có quyền can thiệp vào từng pixel của game, ai đảm bảo nhân vật trông đúng như ý đồ của game developer? Cộng đồng đang gọi đây là "AI slop", tức nội dung trông bề ngoài đẹp hơn nhưng lại mất đi sự chính xác và ý đồ gốc. Một số người so sánh kết quả với phong cách "Harry Potter Balenciaga", ám chỉ sự vô hồn và công nghiệp của các sản phẩm AI tạo ra hàng loạt. Đặc biệt với các game có bản quyền hình ảnh cầu thủ thật, khuôn mặt bị render khác đi dù chỉ một chút cũng là vấn đề nghiêm túc. Nvidia phản hồi như thế nào? Đối mặt với chỉ trích, Nvidia khẳng định các nhà phát triển có toàn quyền kiểm soát nghệ thuật thông qua SDK, bao gồm: Điều chỉnh cường độ hiệu ứng AI theo từng scene Chỉnh màu và tạo mặt nạ để bảo vệ vùng hình ảnh nhạy cảm Tắt hoàn toàn DLSS 5 trên từng nhân vật hoặc vật thể cụ thể Nvidia nhấn mạnh đây không phải bộ lọc đơn thuần mà là công cụ gắn kết chặt với nội dung 3D gốc. Nhưng câu hỏi thực tế vẫn còn đó: liệu tất cả các studio có đủ nguồn lực và sự cẩn thận để tinh chỉnh từng chi tiết đó không, hay phần lớn sẽ bật mặc định và để AI tự quyết? DLSS 5 là bước đi không thể quay đầu Câu hỏi không còn là DLSS 5 có tốt hơn không vì về mặt kỹ thuật câu trả lời rõ ràng là có. Câu hỏi thực sự là khi AI bắt đầu tham gia vào quá trình render từng frame, ranh giới giữa "game gốc" và "game được AI cải thiện" ở đâu? Với các studio AAA, đây là cơ hội cắt giảm chi phí render và đẩy chất lượng hình ảnh lên mức không tưởng. Với game thủ quan tâm đến tính trung thực của sản phẩm, đây là lần đầu tiên họ phải đặt câu hỏi? mình đang chơi game do developer tạo ra hay game do AI tạo ra dựa trên ý tưởng của developer?

Nam•

18 Mar, 2026

Quick Summary

Tại sao MemPalace gây bất ngờ?

Phân tích công nghệ AAK ngôn ngữ bí mật giúp nén bộ nhớ

AAK là gì và nó có dễ hiểu không?

Ưu điểm của AAK là gì

Nhược điểm hiện tại của AAK

So sánh Mem0 và Zep các ông lớn bộ nhớ AI hiện nay

Mem0 (như “người bạn cá nhân hóa”)

Zep hoạt động như nhà sử học chuyên nghiệp

Bảng so sánh nhanh

MemPalace mang lại điều gì cho cộng đồng AI

Discussion (0)

Related Articles

Tính năng lắc điện thoại để tóm tắt của Firefox đã có mặt trên Android

HTML sẽ thay thế Markdown khi làm việc với AI ?

Xây dựng bộ não thứ hai với LLM Wiki của Karpathy

DLSS 5 của Nvidia: AI render đẹp hơn thật, nhưng đây còn là game gốc không?