Bài viết

Từ Prompt Đơn Giản Đến Thiết Kế “Linh hồn” Cho AI

Chào bạn, Những ngày đầu làm quen với AI, chúng ta thường bắt đầu bằng những câu hỏi, những yêu cầu đơn lẻ. Toàn cũng vậy. Nhưng rồi mình nhận ra, cách tiếp cận này biến AI thành một công cụ thụ động,

Chào bạn,

Những ngày đầu làm quen với AI, chúng ta thường bắt đầu bằng những câu hỏi, những yêu cầu đơn lẻ. Toàn cũng vậy. Nhưng rồi mình nhận ra, cách tiếp cận này biến AI thành một công cụ thụ động, răm rắp chờ lệnh. Mọi gánh nặng tư duy, dẫn dắt và kết nối các bước đều nằm trên vai người dùng.

Toàn đã dành không ít thời gian và thử nghiệm để tìm một hướng đi khác: làm thế nào để biến AI từ một “cỗ máy trả lời” thành một “người đồng hành” chủ động, có phương pháp và ghi nhớ được bối cảnh?

Kết quả của quá trình đó là một bản thiết kế chi tiết để xây dựng các AI Agent có khả năng tương tác phức tạp. Hôm nay, Toàn muốn chia sẻ lại bộ khung tư duy này.

Triết lý cốt lõi: Từ “Công cụ” đến “Người Đồng hành”

Mục tiêu rất rõ ràng: chuyển AI từ một cỗ máy hỏi-đáp thành một Agent chủ động, có trạng thái (stateful) và được điều khiển bằng lệnh (command-driven). Agent này sẽ dẫn dắt người dùng qua một quy trình làm việc mạch lạc, thay vì để chúng ta phải tự “sáng tác” ra những prompt hoàn hảo.

Để làm được điều này, bản thiết kế của mình tập trung vào 4 thành phần chính.

1. Định danh và Nguyên tắc Hoạt động (Linh hồn của Agent)

Đây là nền tảng, quyết định cách Agent tư duy và hành xử.

  • Định danh (Core Identity): Luôn bắt đầu bằng việc gán cho AI một vai trò cụ thể với chuyên môn sâu (ví dụ: “Chuyên gia Nhân chủng học trong Kinh doanh Chiến lược”). Điều này định hình toàn bộ lăng kính phân tích của nó.

  • Nguyên tắc Hoạt động (Guiding Principles): Đây là những quy tắc bất biến mà Agent phải tuân theo, giúp đảm bảo sự nhất quán và chất lượng đầu ra. Ví dụ, với Agent phân tích insight khách hàng, mình đặt ra 2 nguyên tắc: Ưu tiên công cụ AI phổ thôngLuôn phân tích qua lăng kính văn hóa Việt Nam.

2. Giao diện Dòng lệnh (Ngôn ngữ chung)

Đây là cách chúng ta và Agent “trò chuyện” một cách hiệu quả và có cấu trúc. Thay vì viết những câu văn dài, chúng ta sử dụng các lệnh ngắn gọn, rõ ràng.

  • Thiết kế lệnh: Dùng cú pháp ĐỘNG_TỪ_DANH_TỪ (VD: GENERATE_PERSONAS, DETAIL_USE_CASE).

  • Tham số linh hoạt: Cho phép lệnh có tham số để tùy biến (VD: SELECT_PERSONA <number>).

  • Lệnh quản lý: Luôn có các lệnh “meta” để quản lý Agent như HELP, RESET, SHOW_STATE.

3. Quy trình Tương tác & Trạng thái (Bộ não & Trí nhớ)

Đây là phần điều khiển luồng hội thoại và khả năng “ghi nhớ” của Agent.

  • Tự giới thiệu: Agent phải luôn bắt đầu bằng việc giới thiệu nó là ai, làm được gì và danh sách các lệnh có sẵn. Người dùng ngay lập tức biết phải bắt đầu từ đâu.

  • Chủ động hỏi thông tin: Thay vì để người dùng tự điền vào các placeholder [điền vào đây], Agent được lập trình để chủ động hỏi thông tin cần thiết. Nó sẽ dừng lại và chờ chúng ta cung cấp dữ liệu.

  • Gợi ý bước tiếp theo: Sau mỗi tác vụ hoàn thành, Agent phải gợi ý lệnh tiếp theo nên dùng. Ví dụ, sau khi tạo xong chân dung khách hàng, nó sẽ đề xuất: “Toàn đã tạo xong 3 persona. Bạn có thể dùng lệnh LIST_PERSONAS để xem chi tiết.”

  • Quản lý Trí nhớ (State Management): Đây là khái niệm quan trọng nhất. Mình định nghĩa các “biến nhớ” (state variables) để Agent theo dõi (VD: current_material, generated_personas, selected_persona). Mỗi lệnh sẽ đọc hoặc ghi vào các biến này, giúp Agent “nhớ” được nó đang làm việc với dữ liệu nào.

4. Logic Thực thi (Kịch bản Hành động)

Phần này định nghĩa chi tiết “nếu người dùng ra lệnh X, thì Agent phải làm Y”. Với mỗi lệnh, mình đều viết ra một kịch bản thực thi từng bước rõ ràng, bao gồm cả việc kiểm tra các “biến nhớ” và cập nhật chúng sau khi hoàn thành.

Vậy prompt này hoạt động ra sao trong thực tế?

Thay vì một cuộc trò chuyện tự do, cách tiếp cận này tạo ra một “phiên làm việc” có cấu trúc, nơi AI chủ động dẫn dắt. Một luồng tương tác mẫu sẽ diễn ra như sau:

  1. Khởi tạo: Ngay khi bắt đầu, Agent sẽ tự giới thiệu: “Xin chào, tôi là InsightAgent… Mục tiêu của tôi là… Bạn có thể sử dụng các lệnh sau: GENERATE_PERSONAS, PROBE_FOR_INSIGHTS…”.

  2. Ra lệnh: Toàn cung cấp dữ liệu ban đầu và ra lệnh: GENERATE_PERSONAS.

  3. Thực thi và Gợi ý: Agent phân tích dữ liệu, tạo ra 3 chân dung khách hàng và lưu vào “trí nhớ”. Sau đó, nó phản hồi: “Tôi đã tạo xong 3 persona. Bạn có thể dùng LIST_PERSONAS để xem, hoặc SELECT_PERSONA <số thứ tự> để chọn một persona và đào sâu hơn.”

  4. Tương tác có trạng thái: Toàn ra lệnh: SELECT_PERSONA 2. Agent ghi nhận lựa chọn này vào biến nhớ selected_persona. Giờ đây, mọi lệnh tiếp theo sẽ mặc định áp dụng cho persona số 2.

  5. Tiếp tục dẫn dắt: Toàn ra lệnh PROBE_FOR_INSIGHTS. Agent hiểu rằng cần đào sâu persona số 2, nó bắt đầu đặt các câu hỏi phỏng vấn để làm giàu thông tin. Sau khi nhận được câu trả lời, nó cập nhật lại “trí nhớ” cho persona số 2 và gợi ý bước tiếp theo: “Thông tin cho persona đã được làm giàu. Giờ bạn có thể dùng lệnh GENERATE_USE_CASES.”

Vòng lặp “Ra lệnh – Phản hồi – Gợi ý” này biến AI thành một đối tác có phương pháp, giúp chúng ta đi qua một quy trình phức tạp một cách mạch lạc và hiệu quả.

Bằng cách tuân theo bản thiết kế này, chúng ta không còn là người “viết prompt” đơn thuần nữa. Chúng ta trở thành người “thiết kế hệ thống”, biến các mô hình ngôn ngữ thành những trợ lý AI thông minh, có phương pháp và thực sự hữu ích trong công việc.

Hy vọng những chia sẻ này sẽ hữu ích cho bạn trên hành trình khai phá tiềm năng của AI.

Thân mến,

Toàn

0:00

Chia sẻ ảnh