Hermes Agent là gì? AI agent tự học của Nous Research

Tóm tắt nhanh
Hermes Agent là nền tảng AI Agent mã nguồn mở đột phá do Nous Research phát triển, đánh dấu sự chuyển dịch từ chatbot hỗ trợ thông thường sang trợ lý AI chủ động hành động. Với khả năng lưu trữ ngữ cảnh liên tục qua cơ chế ghi nhớ dự án và tự tạo kỹ năng mới, công cụ này giải quyết triệt để hạn chế của các chatbot hoạt động theo từng phiên độc lập. Bên cạnh đó, hệ thống hỗ trợ tích hợp đa nền tảng từ Telegram đến Discord, lên lịch tự động hóa bằng ngôn ngữ tự nhiên và chia nhỏ công việc thông qua kiến trúc subagents cách ly. Môi trường sandbox đa tầng bảo mật tuyệt đối giúp người dùng yên tâm tự lưu trữ và kiểm soát hoàn toàn dữ liệu cá nhân.
Càng học nhiều thì càng giỏi hơn, nguyên tắc tưởng chỉ áp dụng cho con người này hóa ra cũng đúng với Hermes Agent, một AI agent mã nguồn mở của Nous Research. Mỗi lần làm việc cùng bạn, Hermes Agent không quên đi mà ghi nhớ lại, hiểu bạn sâu hơn và tự giỏi lên qua từng phiên sử dụng, nhờ một hệ thống bộ nhớ có thể nhớ mọi thứ về bạn ngay cả khi máy đã tắt cả tuần.
Hermes Agent là gì?
Hermes Agent là một AI agent mã nguồn mở do Nous Research, phòng nghiên cứu đứng sau các dòng model Hermes, Nomos và Psyche, phát triển và phát hành dưới giấy phép MIT. Khác với các Antigravity hay Codex phụ thuộc vào môi trường IDE hay các chatbot thông thường cuối cùng vẫn chỉ là lớp vỏ gọi một API duy nhất, Hermes Agent được thiết kế để chạy liên tục trên hạ tầng riêng của người dùng, từ một con VPS giá rẻ cho đến cụm GPU hay hạ tầng serverless và nó hoạt động gần giống như Open Claw .
Điểm khác biệt cốt lõi của Hermes Agent nằm ở khả năng quản trị trí nhớ lâu dài và tự chuyển hóa trải nghiệm thành skills thực tế. Thay vì chỉ lưu trữ thông tin thô hay ghi nhớ sở thích một cách thụ động như các AI như Gemini hay Claude, Hermes sở hữu một "vòng lặp học tập" khép kín tức là sau mỗi phiên làm việc, nó chủ động đúc kết quy trình thành các công cụ làm việc mới để sử dụng cho những lần sau. Hệ thống này được vận hành bởi một "Agent quản trị" (Curator) chạy ngầm để tự động chấm điểm, cắt tỉa và hợp nhất kiến thức, kết hợp cùng công nghệ tìm kiếm FTS5 giúp truy xuất ký ức cũ nhanh gấp 4.500 lần mà không tốn chi phí token. Nhờ đó, Hermes không chỉ phản hồi rồi quên đi mà thực sự trở thành một cộng sự ngày càng am hiểu và chuyên nghiệp hơn theo thời gian sử dụng.
Bốn tính năng tạo nên khác biệt của Hermes Agent
Nous Research không gọi Hermes Agent là chatbot hay copilot mà định vị nó như một agent có vòng lặp học tập được tích hợp sẵn. Bốn nhóm tính năng dưới đây giải thích vì sao cách gọi đó không chỉ là chiêu marketing.
Bộ nhớ xuyên phiên làm việc
Điểm yếu lớn nhất của hầu hết AI hiện nay là trạng thái trí nhớ đều lưu trữ thông tin thô của đoạn chat chứ chưa nhớ được cách làm việc. Hermes Agent đã đưa ra cách xử lý vấn đề này bằng ba cơ chế kết hợp:
- Truy xuất nhanh: Dùng cơ chế tìm kiếm toàn văn FTS5, giúp tìm lại ký ức cũ nhanh hơn khoảng 4.500 lần so với cách tìm kiếm thông thường, mà không tốn thêm token giống như Gemini hay Cowork.
- Thấu hiểu người dùng: Tích hợp phương pháp mô hình hóa người dùng theo hướng dialectic từ Honcho, giúp agent hiểu sâu sở thích, thói quen và bối cảnh cá nhân xuyên suốt hàng nghìn phiên làm việc.
- Liên tục: Agent tiếp nối công việc đúng tại nơi bạn đã dừng lại, kể cả khi đó là một dự án từ nhiều tuần trước.
Tự tạo và tự cải thiện kỹ năng
Đây là tính năng giúp Hermes Agent hoạt động như một cộng sự tích lũy kinh nghiệm, thay vì chỉ là một công cụ trả lời theo yêu cầu:
- Tự học từ thực tế: Sau khi hoàn thành các tác vụ phức tạp, Hermes Agent tự đúc kết quy trình thành kỹ năng mới (skills) và lưu vào thư viện để dùng tự động cho lần sau.
- Chuẩn mở agentskills.io: Các kỹ năng này tuân theo chuẩn mở, có thể đóng gói, chia sẻ và tái sử dụng giữa các hệ thống AI khác nhau mà không cần viết lại từ đầu.
- Cơ chế Curator: Một tác nhân quản trị sẽ chạy ngầm định kỳ chấm điểm, cắt tỉa và hợp nhất các kỹ năng (skills) trùng nhau, điều giúp thư viện kỹ năng không phình to và rối loạn theo thời gian.
Hiện diện trên hơn 23 nền tảng nhắn tin
Hermes Agent không bị giới hạn trong chỉ dùng trong máy tính mà tích hợp trực tiếp vào các kênh giao tiếp trên điện thoại mà người dùng đã quen dùng hằng ngày:
- Đa kênh, một bộ não: Có thể ra lệnh cho Hermes Agent qua Telegram, Discord, Slack, WhatsApp, Signal, email hoặc SMS.
- Duy trì ngữ cảnh: Dù nhắn tin qua Telegram vào buổi sáng và chuyển sang Discord vào buổi tối thì agent vẫn giữ một dòng ký ức duy nhất, không bị phân mảnh theo từng kênh.
- Tương tác đa phương thức: Hỗ trợ gửi tin nhắn thoại, hình ảnh và video, kèm khả năng phân tích nội dung đa phương thức.
Linh hoạt về hạ tầng chạy
Hermes Agent hỗ trợ sáu loại backend để thực thi lệnh: máy cục bộ, Docker, SSH, Daytona, Singularity và Modal. Với Daytona và Modal, môi trường có thể tạm ngủ khi không dùng đến và gần như không tốn chi phí lúc rảnh, chỉ thức dậy khi có việc cần xử lý. Đây là lý do Nous Research mô tả Hermes Agent là agent luôn trực tuyến mà không cần người dùng phải duy trì một máy chủ chạy 24/7 với chi phí cao quanh năm.

Bộ công cụ tích hợp sẵn và những giới hạn cần biết
Hơn 40 công cụ dựng sẵn, từ tìm kiếm web đến tự động hóa lịch
Hermes Agent đi kèm hơn 40 công cụ có sẵn, bao gồm tìm kiếm web, thao tác trình duyệt, xử lý file và thực thi script Python qua RPC để chạy các tác vụ con mà không tốn thêm ngữ cảnh của agent chính. Một hệ thống lập lịch bằng ngôn ngữ tự nhiên cho phép đặt các tác vụ định kỳ như báo cáo hằng ngày hay sao lưu dữ liệu, rồi để agent tự chạy mà không cần ai nhắc lại. Với những việc cần tách biệt hoàn toàn, Hermes Agent còn hỗ trợ các sub-agent có cuộc trò chuyện, terminal và script riêng giúp xử lý song song nhiều việc mà không làm loãng bộ nhớ chính.
Những thách thức và lưu ý về bảo mật
Dù đang cập nhật nhanh, Hermes Agent vẫn có một số điểm người dùng cần lưu ý trước khi triển khai:
- Độ ổn định của cơ chế tự học: Khả năng tự cải thiện kỹ năng giúp tăng tỷ lệ thành công theo báo cáo của Tencen Cloud ghi nhận mức tăng tới 52% và tiết kiệm tới 61% lượng token. Tuy nhiên đây là cơ chế tự tiến hóa (self-evolving), hiệu quả thực tế vẫn phụ thuộc vào model nền mà người dùng chọn và vẫn cần có sự giám sát của con người thay vì tin tưởng tuyệt đối.
- Rủi ro từ quyền hạn cao và trách nhiệm bảo mật thuộc về người dùng: Hermes Agent có thể can thiệp sâu vào hệ thống (excessive agency), nên việc kết nối trực tiếp với nhiều nền tảng nhắn tin đòi hỏi người dùng tự quản lý API key và thiết lập rào chắn (guardrails). Khác với các dịch vụ AI đóng, Hermes Agent trao toàn bộ quyền kiểm soát cho người dùng, đồng nghĩa người dùng cũng phải chịu trách nhiệm cao hơn trong việc cấu hình quyền truy cập để tránh rò rỉ thông tin.
Vì sao Hermes Agent tăng trưởng thần tốc?
Hermes Agent có thể bùng nổ nhờ cách làm marketing của Nous Research nhưng theo mình nó đến từ ba yếu tố chính.
Chính sách di cư không rào cản từ OpenClaw
Nhận thấy lượng người dùng lớn của OpenClaw, Nous Research xây dựng công cụ di chuyển cho phép mang nguyên persona, API key, toàn bộ kỹ năng và bộ nhớ sang Hermes Agent chỉ bằng một lệnh mà không bị mất dữ liệu cũ và tất nhiên là không cần cấu hình lại từ đầu.
Đặt cược vào vòng lặp học tập khép kín thay vì chạy đua tính năng
Trong khi nhiều agent khác cạnh tranh về số lượng công cụ, Hermes Agent định vị mình là một thực thể tự tiến hóa, biết đúc kết kinh nghiệm thành kỹ năng mới và giữ bộ nhớ dài hạn để hiểu người dùng sâu hơn theo thời gian. Hướng đi này tạo ra giá trị bền vững, từng được cộng đồng tận dụng cho những dự án như tự động hóa sản xuất nội dung quy mô lớn với độ nhất quán cao qua nhiều phiên làm việc.
Vai trò làm nền tảng sinh dữ liệu huấn luyện
Không chỉ là trợ lý cá nhân, Hermes Agent còn là một công cụ nghiên cứu mạnh mẽ. Nó có khả năng tạo ra hàng nghìn quỹ đạo gọi công cụ (tool-calling trajectories) song song và nén chúng lại để huấn luyện các mô hình AI khác. Việc biến trải nghiệm thực tế của agent thành dữ liệu huấn luyện giúp Hermes trở thành nền tảng không thể thiếu cho các nhà phát triển muốn xây dựng thế hệ AI tự chủ tiếp theo.
Hermes Agent khác gì một agent harness?
Nhiều người mới tìm hiểu dễ nhầm Hermes Agent với khái niệm agent harness vốn là bộ khung quyết định cách một model gọi công cụ, nó xử lý vòng lặp suy luận và điều phối các bước thực thi bên trong. Nếu coi harness là phần động cơ và khung gầm quyết định cách một chiếc xe vận hành, thì Hermes Agent giống một chiếc xe đã lắp sẵn động cơ đó rồi cộng thêm ghế ngồi, hệ thống định vị và cả bộ nhớ hành trình của riêng người lái.
Nói cách khác, harness là lớp kiến trúc kỹ thuật nằm bên dưới, còn Hermes Agent là sản phẩm hoàn chỉnh dành cho người dùng cuối, đã đóng gói sẵn bộ nhớ, hệ thống kỹ năng, kênh giao tiếp và lựa chọn hạ tầng chạy. Một nhà phát triển có thể tự xây harness riêng để kiểm soát từng chi tiết nhỏ, nhưng phần lớn người dùng không cần đi sâu đến mức đó, họ chỉ cần một agent chạy được ngay và ngày càng thông minh hơn qua quá trình sử dụng. Để hiểu rõ hơn về lớp kiến trúc bên dưới này, có thể đọc thêm Agent harness là gì? Bộ khung giúp AI làm việc hiệu quả, nơi giải thích chi tiết cách các framework dạng này hoạt động.
Hermes Agent có đáng thử ngay bây giờ?
Với việc toàn bộ mã nguồn mở, không thu thập dữ liệu người dùng và có thể tự host hoàn toàn, Hermes Agent là một trong số ít agent hiện nay cho phép người dùng kiểm soát trọn vẹn dữ liệu của chính mình, trong khi vẫn có được trải nghiệm trợ lý liên tục với trí nhớ thật, không phải trí nhớ giả lập chỉ tồn tại trong một cuộc chat đơn lẻ. Sau bản v0.16.0, rào cản kỹ thuật lớn nhất với người dùng không quen terminal cũng đã được dỡ bỏ phần lớn, khi ứng dụng desktop native cho Windows, macOS và Linux đã thay thế hoàn toàn cách dùng CLI thuần trước đây.
Điều còn lại để đánh giá Hermes Agent không phải là nó có chạy được hay không, mà là nó học được gì sau vài tuần sử dụng thật. Cách kiểm chứng nhanh nhất là cài bản desktop hoặc chạy CLI trên một VPS rẻ, kết nối với một kênh nhắn tin quen dùng như Telegram, rồi quan sát agent tự hình thành những kỹ năng nào từ chính cách bạn dùng nó mỗi ngày. Đó cũng là tiền đề để so sánh Hermes Agent với các lựa chọn khác trên thị trường, từ Agent Harness cho đến OpenClaw và Claude Cowork, trong phần tiếp theo của loạt bài này.



