Template AI agent search tài liệu - không cần vector DB
TL;DR
Template open-source cho phép build AI agent tìm kiếm trong tài liệu (GitHub repos, YouTube transcripts, API…) bằng lệnh terminal (grep, find, cat) thay vì vector DB. Deploy được ngay thành web chat, GitHub bot, hoặc Discord bot.
Nói đơn giản: Mình có một cái template Vercel cho sẵn, fork về rồi config vô bao có ngay con AI bot có thể search mọi thứ trong tài liệu của mình mà không cần setup vector database phức tạp.
Bài này dành cho ai?
1. Người muốn AI trả lời dựa trên tài liệu nội bộ
Vấn đề: Dùng RAG/embeddings thì phải setup vector DB, chunking pipeline, embedding model - phức tạp, tốn infra Khi nào cần: Cần con bot trả lời câu hỏi về docs, codebase, nội dung YouTube Được gì: Không cần embeddings, kết quả deterministic (luôn đúng như grep), explainable (biết agent đọc file nào)
2. Dev muốn deploy AI bot lên nhiều nền tảng
Vấn đề: Phải viết bot riêng cho từng nền tảng (Discord, GitHub, Slack), code lặp lại Khi nào cần: Muốn một agent chạy everywhere - web chat, GitHub Issues, Discord Được gì: Viết agent một lần, deploy lên mọi nơi. Thêm platform mới chỉ cần một adapter file
3. Team cần internal knowledge assistant
Vấn đề: Không muốn dùng external AI service, cần tự host Khi nào cần: Build AI cho company knowledge base, internal docs Được gì: Template có sẵn auth (Better Auth), admin panel, user management
Các điểm chính
-
Tìm kiếm bằng terminal commands, không cần vector DB Agent dùng
grep,find,cattrong sandbox để search. Không embedding, không chunking, không vector database. Kết quả instant và deterministic. → Làm gì: Fork template, thêm source (GitHub repo, YouTube channel) qua admin UI là xong -
Một agent, deploy được nhiều nơi Web chat, GitHub Issues, Discord bot đều xài chung một agent. Thêm Slack hay Linear chỉ cần viết thêm adapter file. → Làm gì: Muốn thêm platform mới thì đọc phần Customization trong docs
-
Admin panel có AI hỏi được về app itself Hỏi “câu hỏi nào tốn nhiều token nhất?” hay “24h qua có lỗi gì?” - AI admin có tools
query_stats,query_errors,run_sqlsẵn. → Làm gì: Vô/adminhỏi bằng ngôn ngữ tự nhiên để lấy stats -
Smart complexity router tự chọn model Câu hỏi đơn giản (trivial) -> model rẻ, nhanh. Câu hỏi phức tạp -> model mạnh. Không cần viết rules, AI tự classify và route. → Làm gì: Không cần làm gì, nó tự optimize cost
-
Sandbox pool - startup dưới 100ms Sandbox được pool sẵn, khi chat bắt đầu thì connect tới sandbox đang chạy, không cần tạo mới. Nếu không có sẵn thì dùng pre-built snapshot, chỉ 1-3s. → Làm gì: Không cần quan tâm, infrastructure tự handle
-
Real-time visualization - thấy agent đang làm gì Chat UI hiển thị agent đang đọc file nào, chạy lệnh gì, mỗi bước tốn bao lâu. Không phải black box. → Làm gì: Debug dễ hơn, hiểu agent suy nghĩ gì
Quick Start
-
Deploy lên Vercel ngay Click button “Deploy with Vercel” trong README, config vài env variables là có app chạy. Xem docs/ENVIRONMENT.md để biết cần gì.
-
Thêm knowledge sources Vô admin panel
/admin, add GitHub repos hoặc YouTube channels, trigger sync. Không cần code. -
Muốn tự host?
git clone https://github.com/vercel-labs/knowledge-agent-template.git
cd knowledge-agent-template
bun install
cp apps/app/.env.example apps/app/.env
# Edit .env rồi chạy
bun run dev
Đang tải nội dung...