Tạo CLI từ MCP server và OpenAPI
TL;DR
mcp2cli là tool cho phép gọi MCP server hoặc OpenAPI spec như CLI thường, không cần code generation. Thay vì inject toàn bộ schema (mỗi tool tốn ~121 tokens mỗi turn), AI chỉ cần --list (16 tokens/tool) và --help (80-200 tokens/tool) khi cần. Kết quả: tiết kiệm 96-99% token cho conversation dài.
Nói đơn giản: Tool này giúp AI gọi API tốn ít token hơn bằng cách dùng CLI thay vì để AI nhớ toàn bộ schema từ đầu.
Bài này dành cho ai?
1. Người đang build AI workflow với nhiều tools
Vấn đề: Kết nối AI với vài MCP server là token chạy như nước. Mỗi turn AI phải nhớ toàn bộ schema dù có xài đâu! Khi nào cần: Khi bạn có >10 tools và thấy token usage cao mỗi conversation Được gì: Giảm 96-99% token cho tool schemas, giữ được context cho logic thật
2. Người muốn AI agent gọi API không phụ thuộc provider
Vấn đề: Anthropic Tool Search chỉ work với Claude. Bạn muốn xài GPT, Gemini, hay local models thì sao? Khi nào cần: Khi dùng multi-provider hoặc muốn flexibility Được gì: Tool provider-agnostic - xài được với bất kỳ LLM nào vì nó chỉ là CLI
3. Dev cần tối ưu chi phí API
Vấn đề: Token = tiền thật. MCP server 120 tools x 25 turns = 362,350 tokens chỉ để nhớ schema! Khi nào cần: Khi scale AI application, mỗi token đều quan trọng Được gì: Giảm 357,169 tokens → 5,181 tokens (99% saving) cho platform lớn
Các điểm chính
-
Native MCP tốn ~121 tokens/tool mỗi turn, dù có xài đâu Một MCP server 30 tools đã mất 3,619 tokens trước khi nói gì. Với 10 turns, đó là 36,310 tokens chỉ để nhớ tools! → Làm gì: Cài mcp2cli, thay vì feed schema trực tiếp, để AI gọi CLI để discover tools
-
mcp2cli chỉ tốn ~16 tokens/tool khi —list, ~80-200 khi —help LLM gọi
--listmột lần để xem có những tools nào, rồi--helpcho từng tool khi cần. Không phải nhớ tất cả từ đầu. → Làm gì: Thêm instruction cho AI: “Dùng mcp2cli —mcp <url> —list để xem tools, —help để xem cách dùng” -
Works với cả MCP và OpenAPI - một tool cho cả hai Không chỉ MCP, mà bất kỳ REST API nào có OpenAPI spec (JSON/YAML) đều xài được. Cache với TTL configurable. → Làm gì:
mcp2cli --spec ./api.yaml --base-url http://localhost:8000 --list -
Không codegen, không rebuild khi server thêm endpoint Chỉ cần trỏ tới spec URL hoặc MCP server, CLI có ngay. Server thêm endpoint mới thì lần sau chạy lại là thấy - không cần rebuild. → Làm gì: Không cần generated code trong repo, tool tự resolve lúc chạy
-
3 MCP servers (60 tools) = 97.7% token reduction 7,238 tokens/turn → 3,288 tokens/turn. Với 20-turn conversation: 145,060 tokens → 3,288 tokens. → Làm gì: Test thử với workflow của bạn, so sánh token usage trước/sau
Quick Start
# Cài đặt
pip install mcp2cli
# Thử với MCP server
mcp2cli --mcp https://mcp.example.com/sse --list
# Hoặc với OpenAPI spec
mcp2cli --spec https://petstore3.swagger.io/api/v3/openapi.json --list
# Kết nối AI agent - thêm skill
npx skills add knowsuchagency/mcp2cli --skill mcp2cli
- Tuần này: Cài mcp2cli, test với một MCP server hoặc API bạn đang xài
- Tuần sau: Đo lại token usage khi dùng mcp2cli so với direct MCP injection
- Nếu thấy ok: Thêm vào workflow, bỏ hardcoded tool schemas
Đang tải nội dung...