Khám phá Learn Stream About Jokes
Stream
Liên kết

The case for running AI agents on Markdown files instead of MCP servers

· website

TL;DR

Bài này nói về cách dev đang bỏ MCP server cồng kềnh, thay bằng file Markdown để dạy AI agent cách làm việc. Cách này giảm token tiêu từ 23.000 xuống còn 200 — giảm 100 lần.

Nói đơn giản: Thay vì dùng server phức tạp để nói cho AI biết “team mình dùng GitHub kiểu nào”, dev giờ viết vào file Markdown. AI vẫn làm được việc, nhưng rẻ hơn rất nhiều.


Bài này dành cho ai?

1. Người muốn AI làm việc thay mình

Vấn đề: AI agent ngốn quá nhiều token chỉ để hiểu cách dùng tool, lý do chính của việc hóa đơn API cao bất thường

Khi nào cần: Khi thấy mỗi lần hỏi AI mà token consumed lên đến vài chục nghìn, trong khi task thực tế chỉ cần vài trăm

Được gì: Giảm 90-99% token cho phần “dạy AI cách làm”, chỉ dùng token cho phần “AI làm thật”

2. Người build sản phẩm AI

Vấn đề: Đang build MCP server cho mọi thứ, nhưng nhiều cái chỉ cần là file text

Khi nào cần: Khi team phải maintain quá nhiều server, thay đổi behavior mất hours deploy

Được gì: Architecture rõ ràng: Markdown cho knowledge, MCP cho execution. Feedback loop từ hours xuống minutes

3. Platform Engineer

Vấn đề: Agent system ngốn quá nhiều context window, không còn capacity cho task thực sự

Khi nào cần: Khi enterprise agent kết nối 10+ MCP servers mà token consumption cho tool schemas đã chiếm nửa context window

Đured gì: Tách knowledge ra khỏi execution, reclaim 200-400K tokens cho actual reasoning


Các điểm chính

  1. AI task chia làm hai loại: “biết” và “làm” Một task hoặc cần kiến thức (coding standards, workflow, policy) hoặc cần thực thi (gọi API, query database, gửi email). Đa số dev hiện giờ dùng MCP cho cả hai → lãng phí. → Làm gì: Trước khi thêm MCP server mới, hỏi “Cái này là knowledge hay execution?”

  2. GitHub MCP ngốn 23K-50K tokens, skill file chỉ 200 tokens Tác giả so sánh: GitHub MCP server để dạy agent cách dùng GitHub tốn 23.000-50.000 tokens. File SKILL.md viết “dùng gh CLI, squash merge, conventional commits” chỉ tốn 200 tokens — giảm 100 lần. → Làm gì: Với mỗi MCP server đang xài, kiểm tra xem phần nào là knowledge, tách ra file riêng.

  3. Skill file hoạt động không cần MCP Feld’s CompanyOS mỗi skill đều có “standalone mode” — vẫn phân tích và draft response được kể cả khi ngắt kết nối MCP. Chỉ mất phần auto-send. → Làm gì: Test mỗi skill bằng cách ngắt MCP, xem output còn hữu ích không.

  4. Three-layer framework: Know → Do → Know-how-to-do-well Layer 1: Agent cần biết cái gì → Markdown skill. Layer 2: Agent cần làm cái gì → MCP. Layer 3: Agent cần biết làm tốt → Skill reference MCP tools. → Làm gì: Với task phức tạp, viết skill file định nghĩa workflow, để MCP handle execution bên dưới.

  5. CompanyOS chạy 12 files, 8 servers Brad Feld điều hành công ty bằng 12 Markdown files + 8 MCP servers. Skills handle business logic (email tone, triage workflow, root cause analysis), MCP chỉ để call API. → Làm gì: Không cần framework hay orchestration runtime — structured documents trong git cũng đủ.

  6. Git advantage: Thay đổi behavior trong vài phút Server thay đổi behavior = sửa code + redeploy + hope test coverage đủ. Skill file thay đổi = edit Markdown + commit → feedback loop minutes thay vì hours. → Làm gì: Treat skill files như first-class code artifacts, review trong PR như infrastructure config.

  7. MCP không thua, chỉ bị dùng sai chỗ MCP đã win protocol war — 30.000+ servers indexed. Vấn đề là dev dùng nó cho knowledge problems thay vì chỉ execution problems. → Làm gì: Giữ MCP cho tool execution, nhưng đừng dùng nó để encode workflow knowledge.


Quick Start

  1. Audit MCP servers trong tuần này List tất cả tool mà mỗi server expose. Với mỗi tool, hỏi: “Cái này để dạy agent hay để agent gọi?” — Nếu là dạy → trích ra SKILL.md.

  2. Bắt đầu với server có tool schema lớn nhất GitHub MCP, Slack MCP, Notion MCP — những cái này đang encode nhiều knowledge nhất. Extract knowledge ra file, giữ lại execution tools trong MCP.

  3. Thêm vào repo: skills/ folder Tạo folder chứa SKILL.md files, version trong git, review trong PR. Mỗi file mô tả workflow, guardrails, tone, decision logic — những thứ stable trong weeks/months.


#ai-agents #mcp #architecture #token-optimization #workflow #automation #developer-tools
0:00

Chia sẻ ảnh

Bắt đầu gõ để tìm kiếm...