Your harness, your memory
TL;DR
Agent harnesses là cách chính để xây dựng AI agent, và chúng gắn liền với bộ nhớ của agent. Nếu bạn xài harness đóng, bạn sẽ mất quyền kiểm soát bộ nhớ AI, dẫn đến bị phụ thuộc vào nhà cung cấp. Điều này ảnh hưởng trực tiếp đến khả năng tùy biến và giá trị lâu dài của agent bạn đó.
Nói đơn giản: Giống như bạn cho người khác giữ sổ tay ghi chú quan trọng nhất của mình vậy đó.
Tổng quan
Cách build các hệ thống agentic đã thay đổi rất nhiều trong ba năm qua. Từ những RAG chains đơn giản như LangChain, đến các flow phức tạp hơn với LangGraph, và giờ là sự trỗi dậy của một loại scaffolding mới: agent harnesses.
Agent harnesses là những framework hay cấu trúc bao quanh LLM, giúp nó tương tác với các công cụ (tools) và nguồn dữ liệu khác. Ví dụ điển hình có Claude Code, Deep Agents, Pi (nền tảng của OpenClaw), OpenCode…
Có ý kiến cho rằng model sẽ tự “nuốt chửng” hết các scaffolding này, nhưng điều đó hông đúng. Đúng là nhiều scaffolding của năm 2023 giờ hông cần nữa, nhưng chúng được thay thế bằng những loại scaffolding khác. Một agent, về bản chất, là một LLM tương tác với tool và data. Luôn cần một hệ thống xung quanh LLM để điều phối sự tương tác đó. Bằng chứng là Claude Code bị leak có tới 512k dòng code – đó chính là cái harness đó.
Cái hay là harnesses gắn liền với bộ nhớ (memory) của agent. Sarah Wooders từng nói “memory hông phải là một plugin, nó là cái harness”, và mình hoàn toàn đồng ý. Memory hông phải là một dịch vụ độc lập, mà là một phần cốt lõi của harness, chịu trách nhiệm quản lý context. Từ short-term memory (tin nhắn trong cuộc hội thoại, kết quả tool call) đến long-term memory (ghi nhớ giữa các phiên), tất cả đều được harness xử lý và cập nhật.
Hiện tại, khái niệm memory trong AI còn rất sơ khai, chưa có chuẩn chung. Vì vậy, cách harness quản lý context và state nói chung chính là nền tảng cho memory của agent.
Xài vào việc gì?
Đang xây AI agent nhưng lo ngại bị phụ thuộc vào một nền tảng Nếu bạn dùng harness đóng (proprietary harness), bạn sẽ hông sở hữu bộ nhớ của agent. Điều này có nghĩa là bạn bị khóa vào một nhà cung cấp, khó mà chuyển đổi model hay nền tảng khác mà hông mất đi dữ liệu đã học. → Giải pháp: Chọn harness mã nguồn mở (open harness) ngay từ đầu, ví dụ như Deep Agents. Nó giúp bạn toàn quyền kiểm soát bộ nhớ và data, đảm bảo agent của bạn linh hoạt và hông bị lock-in.
Muốn agent cá nhân hóa và học hỏi theo người dùng theo thời gian Một agent hông có memory thì dễ dàng bị sao chép. Với memory, agent có thể ghi nhớ tương tác, sở thích của người dùng, từ đó cá nhân hóa trải nghiệm và trở nên thông minh hơn. → Giải pháp: Xây dựng trên harness mở cho phép bạn sở hữu và quản lý dữ liệu tương tác. Agent của bạn sẽ tạo ra một dataset độc quyền, giúp nó cung cấp trải nghiệm độc đáo và khó sao chép, tạo lợi thế cạnh tranh.
Cần đảm bảo dữ liệu người dùng được bảo mật và tuân thủ quy định Khi xài harness đóng, đặc biệt là các API có trạng thái (stateful API) như OpenAI’s Responses API hay Anthropic’s server-side compaction, bạn đang lưu trữ dữ liệu trên server của họ. Điều này có thể gây lo ngại về bảo mật và quyền riêng tư. → Giải pháp: Với open harness, bạn tự host và quản lý memory, đảm bảo data nằm trong tầm kiểm soát của mình, tránh rủi ro khi lưu trữ trên server bên thứ ba và dễ dàng tuân thủ các quy định về dữ liệu.
Các điểm chính
-
Agent harnesses là xương sống của AI agent: Chúng hông phải là thứ tạm thời mà là kiến trúc nền tảng cho mọi agent tương tác với tool và data. → Đừng nghĩ model sẽ nuốt chửng hết scaffolding; hãy đầu tư vào việc chọn harness đúng để xây dựng nền tảng vững chắc cho agent của bạn.
-
Harness và bộ nhớ (memory) gắn liền với nhau: Memory hông phải là một plugin rời mà là chức năng cốt lõi của harness, quản lý mọi context và trạng thái của agent. → Bỏ tư tưởng memory là service độc lập; hãy xem nó là phần không thể tách rời của hệ thống agent để thiết kế kiến trúc phù hợp.
-
Harness đóng = mất quyền kiểm soát bộ nhớ: Khi xài harness độc quyền (đặc biệt là sau API), bạn giao quyền sở hữu và quản lý bộ nhớ agent cho bên thứ ba. → Quyết định này hông thể đảo ngược; nếu muốn chuyển đổi model hay nền tảng, bạn sẽ mất hết dữ liệu đã học, gây thiệt hại lớn về thời gian và công sức.
-
Bộ nhớ tạo ra giá trị độc quyền và sự gắn kết: Agent có memory sẽ học hỏi, cá nhân hóa theo người dùng, tạo ra trải nghiệm độc đáo và khó sao chép. → Đây là lợi thế cạnh tranh cốt lõi; hông có memory, agent của bạn dễ dàng bị đối thủ bắt chước, làm mất đi sự khác biệt.
-
Nhà cung cấp model đang cố gắng tạo lock-in qua memory: Họ có động lực lớn để đưa các chức năng memory vào sau API của họ, như Claude Managed Agents. → Hãy cảnh giác với các dịch vụ “managed agent” đóng, vì chúng có thể khóa bạn vào hệ sinh thái của họ, khiến việc di chuyển sau này cực kỳ khó khăn.
-
Cần harness mở để sở hữu bộ nhớ của mình: Để giữ quyền kiểm soát data, đảm bảo tính linh hoạt và khả năng chuyển đổi model, bạn phải xài harness mã nguồn mở. → Hãy ưu tiên các giải pháp open source, model agnostic như Deep Agents để bạn toàn quyền sở hữu và quản lý tài sản quý giá nhất của agent: bộ nhớ.
Quick Start
- Đánh giá các AI agent bạn đang dùng/xây dựng: Xác định xem chúng đang dùng harness nào, có phải là closed hay open. Nếu là closed, hãy hiểu rõ rủi ro về lock-in và khả năng mất quyền kiểm soát bộ nhớ.
- Ưu tiên giải pháp harness mở cho dự án mới: Ví dụ Deep Agents, để đảm bảo bạn sở hữu bộ nhớ và có toàn quyền kiểm soát data ngay từ đầu, tránh các vấn đề về sau.
- Lên kế hoạch di chuyển dữ liệu (nếu có): Nếu đang dùng harness đóng và muốn chuyển đổi, hãy tìm hiểu cách xuất và chuyển đổi dữ liệu memory sang hệ thống mở. Đây là một bước quan trọng để giành lại quyền kiểm soát.
FAQ
Agent harness là gì? Là một framework hay cấu trúc bao quanh LLM, giúp nó tương tác với tool và data để thực hiện các tác vụ phức tạp. Nó là phần mềm điều phối hoạt động của agent.
Tại sao tôi cần quan tâm đến việc sở hữu bộ nhớ agent? Vì bộ nhớ là yếu tố then chốt giúp agent học hỏi, cá nhân hóa, và tạo ra giá trị độc quyền. Mất quyền kiểm soát bộ nhớ đồng nghĩa với việc mất lợi thế cạnh tranh và bị lock-in vào một nền tảng duy nhất.
Làm sao để biết harness tôi đang dùng là “mở” hay “đóng”? Harness mở thường là mã nguồn mở (open source), cho phép bạn tự host và kết nối với các database memory tùy chọn. Harness đóng thường là dịch vụ API độc quyền từ nhà cung cấp model, bạn hông có quyền truy cập vào mã nguồn hay cách họ quản lý memory.
Deep Agents giải quyết vấn đề này như thế nào? Deep Agents là một open-source harness, model agnostic, dùng các chuẩn mở và cho phép bạn kết nối với nhiều database memory khác nhau (Mongo, Postgres, Redis…). Điều này đảm bảo bạn toàn quyền sở hữu và quản lý bộ nhớ của agent, hông bị phụ thuộc vào bất kỳ nhà cung cấp model nào.
Đang tải nội dung...