One Prompt to Save 90% Context for Any MCP Server
TL;DR
Cách fix vấn đề MCP đổ 50KB+ vào mỗi lần gọi tool — cho LLM viết script nhỏ chạy trong sandbox, chỉ kết quả nhỏ vào context thay vì toàn bộ API response.
Nói đơn giản: Thay vì đổ cả đống data vào AI, để AI tự viết code lọc lấy thứ cần.
Bài này dành cho ai?
1. Dev đang build MCP server
Vấn đề: Tool gọi API xong đổ cả đống JSON vào context, token bay nhanh quá Khi nào cần: Khi làm việc với API lớn như AWS, GitHub, Stripe Được gì: Giảm 65-99% token usage, context sạch hơn
2. Người dùng AI muốn tối ưu workflow
Vấn đề: AI xử lý data lớn chậm, tốn tiền Khi nào cần: Khi prompt AI đọc file JSON lớn hoặc gọi nhiều API Được gì: Nhanh hơn, rẻ hơn, AI tập trung vào việc cần làm
Các điểm chính
-
MCP giờ chỉ wrap CRUD thành tools Hầu hết MCP server lấy response từ API rồi đổ thẳng vào context. API trả về 50KB, AI nhận 50KB — không cần thiết. → Làm gì: Tìm các tool trả response lớn, thêm bước lọc trước khi vào context.
-
Code mode: LLM viết script, server chạy trong sandbox AI viết đoạn code nhỏ để xử lý data, server chạy trong môi trường cô lập, chỉ stdout được đưa vào context. Không network, không filesystem. → Làm gì: Tạo một tool “code mode” cho phép AI tự viết code xử lý data.
-
Chọn sandbox runtime theo ngôn ngữ dự án
- TypeScript/JS: dùng quickjs-emscripten
- Python: dùng RestrictedPython
- Go: dùng goja
- Rust: dùng boa_engine
→ Làm gì: Xem project viết bằng gì, chọn thư viện tương ứng.
-
Works best với well-known APIs Cloudflare, GitHub, Stripe, Slack, AWS — LLM đã biết schema, viết script trong một lần không cần hỏi. → Làm gì: Ưu tiên áp dụng code mode cho các API phổ biến trước.
-
Prompt để tự tạo code mode tool Tác giả cung cấp sẵn prompt copy-paste được, hướng dẫn từng bước tạo tool này trong MCP server. → Làm gì: Copy prompt trong bài, dán vào AI agent đang build MCP server.
Quick Start
- Mở project MCP server đang làm
- Tìm các tool trả response lớn (50KB+)
- Dùng prompt trong bài, hỏi AI: “Làm sao thêm code mode tool?”
- Test thử với một API quen thuộc như GitHub
Đang tải nội dung...