Liên kết

Thực thi chính sách, bảo mật & giám sát AI Agent

17 tháng 3, 2026 · github

TL;DR

Bộ toolkit từ Microsoft giúp kiểm soát AI agent theo chính sách rõ ràng, xử lý 10 rủi ro bảo mật OWASP, tích hợp được với hơn 12 framework phổ biến. Thêm vào hệ thống chỉ tốn dưới 0.1ms mỗi action.

Nói đơn giản: Đây là “lớp bảo vệ” giúp bạn kiểm soát AI agent làm được gì, không làm được gì, ai được dùng, ai không.

Bài này dành cho ai?

1. Người đang build AI agent system

Vấn đề: Lo lắng agent làm lung tung, vượt quyền, hoặc làm sai mà không biết đường kiểm soát Khi nào cần: Khi deploy agent ra production, cần audit trail và kiểm soát chặt chẽ Được gì: Policy engine chặn action trước khi chạy, có log đầy đủ, có kill switch

2. DevOps / Security muốn thêm governance vào AI

Vấn đề: Chưa có tool chuẩn để kiểm soát AI agent, phải tự build lấy Khi nào cần: Khi cần comply OWASP Agentic Top 10, cần show auditor có controls rõ ràng Được gì: Toolkit có sẵn 6,100+ tests, map đủ 10 rủi ro OWASP, không cần viết lại từ đầu

3. Enterprise muốn dùng AI trong tổ chức

Vấn đề: Sợ AI làm việc không kiểm soát được, data leak, compliance violation Khi nào cần: Khi cần đưa AI vào business process thực sự, cần đảm bảo an toàn Được gì: Zero-trust identity, sandboxing, SLO monitoring — như bảo mật app thường nhưng cho AI

Các điểm chính

Kiểm soát action TRƯỚC KHI chạy, không phải sau Policy engine đánh giá mỗi action trước khi thực thi, latency chỉ 0.012ms cho 1 rule. Cấu hình capability model — agent chỉ được dùng tool nào, denied tool nào. → Làm gì: Define capability model ngay từ đầu, đừng để agent tự quyết định được gì
Zero-trust identity cho agent Mỗi agent có Ed25519 cryptographic credential, trust scoring từ 0-1000, hỗ trợ SPIFFE/SVID. Agent nào muốn giao tiếp phải chứng minh identity. → Làm gì: Bật AgentMesh cho inter-agent communication, đặc biệt quan trọng khi nhiều agent phối hợp
Sandboxing — giới hạn quyền agent như app bình thường 4-tier privilege rings, termination control, kill switch. Agent không thể vượt quyền, không thể chạy tiếp khi có vấn đề. → Làm gì: Enable Agent Runtime với mọi agent, nhất là agent có quyền modify data hoặc call API
SRE cho AI — reliability như software bình thường SLOs, error budgets, replay debugging, chaos engineering, circuit breakers, progressive delivery. Đo latency, throughput, error rate của agent như app thường. → Làm gì: Setup Agent SRE dashboard cho production agents, define SLO từ ngày đầu
Tích hợp 12+ framework mà không khóa nhà cung cấp LangChain, CrewAI, AutoGen, Semantic Kernel, LlamaIndex, Dify, OpenAI Agents, Google ADK đều có quickstart có sẵn. Xài pip install là chạy, không phải rewrite toàn bộ. → Làm gì: Pick framework đang dùng, copy quickstart trong examples/quickstart/, thêm middleware 3 dòng code
Cover đủ 10 rủi ro OWASP Agentic Top 10 ASI-01 đến ASI-10 đều có controls tương ứng — Goal Hijacking, Excessive Capabilities, Identity Abuse, Code Execution, Output Handling, Memory Poisoning, Inter-Agent Comm, Cascading Failures, Trust Deficit, Rogue Agents. → Làm gì: Đọc docs/OWASP-COMPLIANCE.md để biết map cụ thể, dùng cho compliance documentation

Quick Start

Cài đặt Python:

pip install agent-governance-toolkit[full]

Define capability model:

from agent_os import PolicyEngine, CapabilityModel

capabilities = CapabilityModel(
    allowed_tools=["web_search", "file_read"],
    denied_tools=["file_write", "shell_exec"],
    max_tokens_per_call=4096
)

engine = PolicyEngine(capabilities=capabilities)
decision = engine.evaluate(agent_id="researcher-1", action="tool_call", tool="web_search")