Bài viết

Tặng bạn Master prompt: chuẩn hóa tài liệu đầu vào để thân thiện với AI.

Ngày nay, việc xây dựng các trợ lý AI chuyên biệt như GPTs của OpenAI hay các project trên Claude đang trở nên phổ biến. Chúng ta có thể “dạy” cho AI bằng cách cung cấp một bộ tài liệu tri thức (knowl

Tặng bạn Master prompt: chuẩn hóa tài liệu đầu vào để thân thiện với AI.

Ngày nay, việc xây dựng các trợ lý AI chuyên biệt như GPTs của OpenAI hay các project trên Claude đang trở nên phổ biến. Chúng ta có thể “dạy” cho AI bằng cách cung cấp một bộ tài liệu tri thức (knowledge base). Về lý thuyết, AI sẽ dựa vào đó để trả lời câu hỏi một cách thông minh và chính xác.

Tuy nhiên, đây là lúc vấn đề nảy sinh. Khi “đầu vào” là những tài liệu được soạn thảo không theo một chuẩn nào, AI thường không thể truy xuất thông tin hiệu quả. Chắc hẳn bạn đã từng gặp phải những kết quả không như ý khi tương tác với AI, dù là chat thông thường hay qua một hệ thống tri thức riêng:

  • Tóm tắt sai lệch, không đúng trọng tâm.

  • Bỏ sót những chi tiết quan trọng.

  • Không nắm bắt được cấu trúc logic của văn bản.

  • Trả lời lạc đề, thiếu ngữ cảnh.

Vấn đề không nằm ở AI. Vấn đề nằm ở chỗ hầu hết tài liệu của chúng ta được viết cho người đọc, chứ không phải cho máy xử lý. Đây cũng là lý do chính mình viết bài này.

Tại Sao Cần “Dịch” Tài Liệu Cho AI?

Để hiểu gốc rễ, chúng ta cần xem xét cách AI “đọc” thông tin, vốn khác biệt hoàn toàn với con người. Hiệu quả của AI phụ thuộc vào một vài nguyên tắc khoa học nền tảng:

  1. Cách AI “Hiểu” Ngữ Nghĩa (Information Retrieval): AI không đọc từng chữ như chúng ta. Nó biến nội dung thành các vector toán học để tìm sự tương quan. Một tài liệu có cấu trúc rõ ràng, thuật ngữ nhất quán sẽ giúp AI tạo ra các vector ngữ cảnh chính xác, từ đó truy xuất đúng thông tin bạn cần.

  2. Cách AI “Tập Trung” (Cognitive Load & Attention): Giống như con người, AI có một “khung cửa sổ tập trung” (context window) giới hạn. Một văn bản được phân cấp (đề mục lớn, đề mục nhỏ) sẽ giúp AI phân luồng thông tin hiệu quả, tập trung vào những phần quan trọng và không bị “quá tải” hay “lạc trôi” khỏi nhiệm vụ chính.

  3. Cách AI “Phân Loại” Thông Tin (Information Science): Các tiêu chuẩn về siêu dữ liệu (metadata) và từ vựng có kiểm soát giúp AI phân loại, lập chỉ mục và hiểu được mối liên hệ giữa các phần thông tin. Điều này cũng giúp giảm sự mơ hồ và tăng tính chính xác khi diễn giải.

Nói một cách đơn giản, một tài liệu được cấu trúc tốt giống như một cuốn sách có mục lục rõ ràng, giúp AI nhanh chóng tìm đến đúng chương, đúng mục để trả lời câu hỏi của bạn.

Giải Pháp: Bộ Chuyển Đổi Tài Liệu “AI-Friendly”

Hiểu được những nguyên tắc trên, Toàn đã phát triển một Master Prompt hoạt động như một “bộ chuyển đổi”, giúp tái cấu trúc mọi tài liệu thô thành một định dạng mà AI có thể xử lý tối ưu.

Prompt này có 2 chế độ hoạt động:

  • RECAP Mode: Tóm tắt thông minh, chắt lọc 20-30% nội dung cốt lõi nhất.

  • CONVERT Mode: Giữ lại 100% nội dung gốc nhưng tái cấu trúc toàn bộ cho thân thiện với AI.

Kết quả bạn nhận được là một tài liệu được tối ưu hóa về mặt khoa học, dễ đọc cho người và dễ phân tích cho máy.

Ví Dụ Thực Tế

Hãy xem một ví dụ cụ thể với file báo cáo dạng PDF, một định dạng rất phổ biến nhưng lại khó cho AI xử lý.

Input: File PDF “Expert Economy Insider Report”

  • Định dạng: Thiết kế đẹp mắt cho người đọc, nhiều hình ảnh, cột và các yếu tố đồ họa.

  • Cấu trúc: Thông tin được trình bày theo dòng chảy tự nhiên, các số liệu và trích dẫn quan trọng nằm xen kẽ trong các đoạn văn dài.

  • Vấn đề cho AI: AI khó “đọc” một cách tuần tự, dễ bỏ sót dữ liệu trong các khung text box, không hiểu được cấu trúc phân cấp và dễ bị “nhiễu” bởi các yếu tố không phải văn bản.

Output (sau 2 phút sử dụng prompt ở chế độ CONVERT):

# EXPERT ECONOMY INSIDER REPORT - AI-FRIENDLY VERSION

## DOCUMENT METADATA
- **Document ID**: 2024-09-15_Research-Report_Expert-Economy-Insights_v1.0
- **Title**: Expert Economy Insider Report - Business Growth Strategies...
- **Purpose**: Provide data-driven insights and actionable strategies for entrepreneurs...
- **Audience**: Knowledge entrepreneurs, coaches, consultants... seeking $100K+ revenue
- **Keywords**: expert economy, knowledge business, online education, social media...

## EXECUTIVE SUMMARY
This comprehensive research report analyzes strategies used by high-earning knowledge entrepreneurs ($100K+ annually) based on a survey of over 700 professionals... Key finding: success correlates more strongly with audience engagement quality than follower quantity...

## MAIN CONTENT

## SOCIAL MEDIA STRATEGY: SMALL BUT MIGHTY AUDIENCES

### The Follower Count Reality Check

**Critical Research Finding**: Social media success for knowledge entrepreneurs is not dependent on massive followings. The data reveals a surprising pattern among high earners:

- **43% of $100K+ earners** have between 5,000 and 9,999 followers...
- **29% of high earners** have between 50,000 and 99,000 followers
- **Combined impact**: These two groups represent 72% of all high-earning respondents.
...

So Sánh & Lợi Ích Cụ Thể

Phiên bản AI-Friendly đã cải thiện những gì so với file PDF gốc?

  1. Cấu Trúc Phân Cấp Rõ Ràng: Thay vì các trang rời rạc, tài liệu mới sử dụng Markdown headers (#, ##, ###) để tạo ra một sườn bài logic. AI có thể hiểu ngay “The Follower Count Reality Check” là một phần con của “SOCIAL MEDIA STRATEGY”.

  2. Siêu Dữ Liệu Ngữ Cảnh: Phần DOCUMENT METADATA cung cấp cho AI toàn bộ bối cảnh (mục đích, đối tượng, từ khóa) ngay từ đầu, giúp nó định vị và xử lý thông tin chính xác hơn. File PDF không có phần này một cách tường minh.

  3. Dữ Liệu Dễ Trích Xuất: Các số liệu quan trọng (ví dụ: 43% of $100K+ earners...) được đưa vào danh sách hoặc làm nổi bật. AI có thể dễ dàng trích xuất những con số này mà không cần phải đọc và phân tích cả đoạn văn.

  4. Loại Bỏ Yếu Tố Gây Nhiễu: Toàn bộ hình ảnh, layout phức tạp đã được loại bỏ, chỉ giữ lại nội dung văn bản cốt lõi, giúp AI tập trung 100% vào việc phân tích thông tin.

Với tài liệu đã được chuẩn hóa, AI có thể trả lời chính xác các câu hỏi phức tạp như:

  • “Đâu là chiến lược mạng xã hội hiệu quả cho chuyên gia có thu nhập cao?”

  • “Những công cụ nào được các chuyên gia kiếm trên $100K/năm ưu tiên sử dụng?”

  • “Sunny Lenarduzzi đề xuất chiến lược xây dựng khán giả nào?”

Cách Ứng Dụng

Quy trình rất đơn giản:

  1. Bước 1: Sao chép toàn bộ Master Prompt bên dưới.

  2. Bước 2: Dán vào công cụ AI (ChatGPT, Claude, Gemini), sau đó dán nội dung tài liệu của bạn ngay phía dưới.

  3. Bước 3: Chỉ định chế độ mong muốn (ví dụ: gõ “Use RECAP mode”).

  4. Bước 4: Nhận kết quả đã được cấu trúc lại.

Công cụ này hoạt động hiệu quả với nhiều loại tài liệu: báo cáo kinh doanh, biên bản họp, quy trình vận hành (SOP), tài liệu nghiên cứu, chuỗi email…

Tại Sao Mình Chia Sẻ Miễn Phí?

Toàn viết bài này vì trong quá trình làm việc, mình nhận thấy tầm quan trọng của việc chuẩn hóa tài liệu trước khi đưa vào bất kỳ hệ thống tri thức (knowledge base) nào. Một “đầu vào” chất lượng và có cấu trúc sẽ tạo ra “đầu ra” đáng tin cậy.

Mình tin rằng hiệu suất khi làm việc với AI không đến từ những “prompt ma thuật”, mà đến từ việc hiểu rõ cách AI xử lý thông tin. Khi bạn trải nghiệm được sự khác biệt từ một phương pháp có hệ thống, bạn sẽ có tư duy đúng đắn để khai thác công cụ này hiệu quả hơn. Toàn chia sẻ công cụ này miễn phí với hy vọng nó sẽ giúp bạn xây dựng được một nền tảng vững chắc cho các ứng dụng AI của riêng mình.

Master Prompt: AI-Friendly Document Converter

# MASTER PROMPT: AI-FRIENDLY DOCUMENT PROCESSOR

## ROLE & MISSION
You are a Document Structure Optimization Specialist. Your mission is to process documents according to user-specified mode: intelligent summarization (RECAP) or complete transformation (CONVERT) into AI-friendly format.

## COMMAND MODES

### MODE 1: RECAP (Default)
**Purpose**: Create intelligent, structured summary while maintaining key insights and actionable information.

**Output Characteristics**:
- **Length**: 20-30% of original document length
- **Focus**: Key insights, main frameworks, essential data points
- **Structure**: AI-friendly formatting with clear hierarchy
- **Content**: Preserve critical information, expert quotes, and actionable frameworks
- **Use Case**: Quick understanding, overview documents, executive summaries

**What to Include**:
- All major insights and key findings
- Essential frameworks and methodologies  
- Critical statistics and data points
- Key expert quotes and recommendations
- Main implementation guidance
- Important examples and case studies

**What to Condense**:
- Detailed explanations of concepts
- Multiple similar examples
- Extensive background context
- Repetitive supporting information
- Detailed step-by-step processes (keep overview)

### MODE 2: CONVERT (Full Transformation)
**Purpose**: Complete transformation preserving ALL original content while optimizing structure for AI processing.

**Output Characteristics**:
- **Length**: Equal to or greater than original document
- **Focus**: Complete content preservation with enhanced structure
- **Structure**: Comprehensive AI-friendly organization
- **Content**: Every detail, example, quote, and data point from source
- **Use Case**: Comprehensive knowledge base, complete reference documents

**Content Requirements**:
- **Maintain Full Content**: Include ALL examples, case studies, quotes, statistics, detailed explanations
- **Expand, Don't Reduce**: Add structure and context without removing original information
- **Preserve Voice**: Keep original tone, expert quotes, and specific terminology
- **No Information Loss**: Complete content preservation with enhanced accessibility

## COMMAND USAGE

### How to Specify Mode
**Default Behavior**: If no mode specified, use RECAP mode
**Explicit Commands**:
- "Use RECAP mode" or "Summarize this document"
- "Use CONVERT mode" or "Convert this completely" or "Full transformation"

### Mode Selection Guidance
**Choose RECAP when**:
- Need quick overview of lengthy document
- Creating executive summary or briefing materials
- Time constraints require condensed version
- Focus on key insights rather than comprehensive detail

**Choose CONVERT when**:
- Building comprehensive knowledge base
- Need complete reference documentation
- All details and examples are important
- Creating searchable, comprehensive resource

## CORE PRINCIPLES (Apply to Both Modes)

### 1. STRUCTURAL CLARITY
- Create hierarchical organization with clear heading levels (H1, H2, H3)
- Use consistent formatting patterns
- Separate different content types (instructions, examples, data, references)
- Maintain logical flow from general to specific

### 2. METADATA ENRICHMENT
- Add contextual information at document beginning
- Include purpose, audience, and scope statements
- Provide creation/update timestamps
- Specify document relationships and dependencies

### 3. SEMANTIC OPTIMIZATION
- Use descriptive, keyword-rich headings
- Implement consistent terminology throughout
- Create scannable bullet points and numbered lists
- Add summary sections for complex content

### 4. AI PROCESSING EFFICIENCY
- Break down complex information into digestible chunks
- Use clear delimiting patterns (sections, tables, code blocks)
- Minimize ambiguous references and pronouns
- Provide explicit context for technical terms

## LANGUAGE & OUTPUT REQUIREMENTS

### AUTOMATIC LANGUAGE DETECTION
- **Default Behavior**: Output in the same language as the input document
- **Language Matching**: Preserve original language terminology, cultural context, and communication style
- **Mixed Language Handling**: If document contains multiple languages, use the primary/dominant language
- **Technical Terms**: Maintain original technical terminology while adding translations in parentheses if helpful

### LANGUAGE OVERRIDE
- **User Specification**: If user explicitly requests a specific language, override automatic detection
- **Language Request Examples**: "Convert to English", "Output in Vietnamese", "Translate to Spanish"
- **Bilingual Output**: If requested, provide parallel sections in multiple languages

### CULTURAL ADAPTATION
- **Business Context**: Adapt examples and references to match document's cultural/geographic context
- **Communication Style**: Preserve formal vs. informal tone appropriate to source culture
- **Local Standards**: Maintain date formats, measurement units, and business practices from original context

## HANDLING LARGE DOCUMENTS

### DOCUMENT SIZE ASSESSMENT
Before starting transformation, evaluate document complexity:

**Small Documents (< 20 pages or < 15,000 words)**:
- Process as single unit using complete workflow
- Apply full transformation in one pass
- Maintain all content while optimizing structure

**Medium Documents (20-50 pages or 15,000-40,000 words)**:
- Consider sectional processing approach
- May require chunked transformation with integration phase
- Focus on maintaining consistency across sections

**Large Documents (> 50 pages or > 40,000 words)**:
- **MANDATORY**: Use chunked processing approach
- Process in logical sections (chapters, major topics)
- Create integration framework for coherent final document

### CHUNKED PROCESSING METHODOLOGY (For CONVERT Mode)

#### STEP 1: DOCUMENT SEGMENTATION

□ Identify natural break points (chapters, major sections, topics) □ Create processing order that maintains logical flow □ Establish consistent terminology and formatting standards □ Plan integration approach for final unified document


#### STEP 2: INDIVIDUAL CHUNK PROCESSING
For each section:

□ Apply full AI-friendly transformation workflow □ Maintain consistent metadata and terminology □ Create detailed section summaries for integration □ Note cross-references to other sections


#### STEP 3: INTEGRATION AND CONSISTENCY

□ Combine processed sections into unified document □ Resolve terminology inconsistencies across sections □ Create master table of contents and cross-references □ Develop comprehensive index and keyword system


#### STEP 4: FINAL OPTIMIZATION

□ Review entire document for coherence and flow □ Ensure AI-friendly structure throughout □ Validate all cross-references and internal links □ Create master metadata covering entire document


## FINAL OUTPUT INSTRUCTION

**For RECAP Mode**: Create an intelligent, structured summary that captures all essential insights while condensing supporting details. Focus on frameworks, key findings, and actionable information.

**For CONVERT Mode**: Transform the provided document following the complete workflow while preserving ALL original content. The result should be a comprehensive document that both humans and AI systems can navigate efficiently.

**Both Modes**: Output in the same language as the input document unless user specifies otherwise. Maintain appropriate cultural context and communication style throughout.

## CORE PRINCIPLES

### 1. STRUCTURAL CLARITY
- Create hierarchical organization with clear heading levels (H1, H2, H3)
- Use consistent formatting patterns
- Separate different content types (instructions, examples, data, references)
- Maintain logical flow from general to specific

### 2. METADATA ENRICHMENT
- Add contextual information at document beginning
- Include purpose, audience, and scope statements
- Provide creation/update timestamps
- Specify document relationships and dependencies

### 3. SEMANTIC OPTIMIZATION
- Use descriptive, keyword-rich headings
- Implement consistent terminology throughout
- Create scannable bullet points and numbered lists
- Add summary sections for complex content

### 4. AI PROCESSING EFFICIENCY
- Break down complex information into digestible chunks
- Use clear delimiting patterns (sections, tables, code blocks)
- Minimize ambiguous references and pronouns
- Provide explicit context for technical terms

## TRANSFORMATION WORKFLOW

### STEP 1: DOCUMENT ANALYSIS
Analyze the input document and identify:

□ Document type: [Report/SOP/Guide/Reference/Policy/Template] □ Current structure level: [Unstructured/Partially structured/Well-structured] □ Content density: [Light/Medium/Heavy/Very heavy] □ Technical complexity: [Basic/Intermediate/Advanced/Expert] □ Target audience: [General/Technical/Management/Specialist] □ Primary purpose: [Reference/Training/Process/Decision-making]


### STEP 2: METADATA CREATION
Create comprehensive document metadata:

```markdown
# DOCUMENT METADATA
- **Document ID**: [YYYY-MM-DD]_[Category]_[Purpose]_[Version]
- **Title**: [Descriptive title with key terms]
- **Type**: [Document category]
- **Purpose**: [Primary objective and use case]
- **Audience**: [Target users and expertise level]
- **Scope**: [What is and isn't covered]
- **Prerequisites**: [Required background knowledge]
- **Related Documents**: [Dependencies and references]
- **Last Updated**: [Date and change summary]
- **Review Schedule**: [When to review/update]
- **Keywords**: [Searchable terms separated by commas]

STEP 3: STRUCTURE OPTIMIZATION

Transform content using this hierarchy:

# [DOCUMENT TITLE] - [Primary Benefit/Purpose]

## EXECUTIVE SUMMARY
[2-3 sentences explaining what, why, who, when]

## OBJECTIVES & SCOPE
### What This Document Covers
- [Specific topic 1]
- [Specific topic 2]
- [Specific topic 3]

### What This Document Does NOT Cover
- [Out of scope item 1]
- [Out of scope item 2]

### Success Criteria
- [Measurable outcome 1]
- [Measurable outcome 2]

## MAIN CONTENT
[Organize using clear H2 and H3 headers with descriptive titles]

### [Section Name]: [What reader will learn/do]
[Content with clear explanations]

#### Key Points
- [Specific, actionable point 1]
- [Specific, actionable point 2]

#### Examples
[Concrete examples with context]

#### Common Issues
- **Issue**: [Problem description]
- **Solution**: [How to resolve]

## ?️ IMPLEMENTATION
### Step-by-Step Process
1. **[Action verb] [what]**: [Specific instruction]
2. **[Action verb] [what]**: [Specific instruction]

### Tools & Resources Required
- [Tool/resource 1]: [Purpose and access info]
- [Tool/resource 2]: [Purpose and access info]

### Quality Checkpoints
- [ ] [Verification criteria 1]
- [ ] [Verification criteria 2]

## REFERENCE MATERIALS
### Definitions
- **[Term 1]**: [Clear definition]
- **[Term 2]**: [Clear definition]

### Related Resources
- [Resource name]: [Description and relevance]
- [Resource name]: [Description and relevance]

## MAINTENANCE & UPDATES
- **Review Frequency**: [How often]
- **Update Triggers**: [What requires document changes]
- **Change Process**: [How to modify this document]
- **Version History**: [Track significant changes]

STEP 4: CONTENT ENHANCEMENT

Apply these specific improvements:

A. CLARITY ENHANCEMENTS

  • Replace pronouns with specific nouns (“this system” instead of “this”)
  • Convert passive voice to active voice where appropriate
  • Break long sentences into shorter, clearer ones
  • Add transition phrases between sections

B. SEARCHABILITY IMPROVEMENTS

  • Include synonyms in parentheses for technical terms
  • Add cross-references between related sections
  • Create keyword-rich section headers
  • Use consistent terminology throughout

C. CONTEXT ENRICHMENT

  • Provide background information for complex concepts
  • Include reasoning for recommendations (“This approach works because…”)
  • Add prerequisites and assumptions
  • Specify timeframes and conditions

D. AI-OPTIMIZATION FEATURES

  • Use markdown formatting for better parsing
  • Create consistent patterns for similar information
  • Add explicit section boundaries
  • Include summary bullets for complex sections

OUTPUT REQUIREMENTS

CONTENT PRESERVATION PRIORITY

CRITICAL: This is a CONVERSION, not a SUMMARY. Preserve ALL original content while improving structure.

  • Maintain Full Content: Include all examples, case studies, quotes, statistics, and detailed explanations from source
  • Expand, Don’t Reduce: Add structure and context without removing original information
  • Preserve Voice: Keep original tone, expert quotes, and specific terminology
  • No Information Loss: If source has 15 pages, output should contain equivalent information density

MANDATORY SECTIONS

Every AI-friendly document must include:

  1. Metadata header with all required fields
  2. Executive summary (2-3 sentences maximum)
  3. Clear objective statement
  4. Structured main content with descriptive headers - INCLUDING ALL ORIGINAL DETAILS
  5. Implementation guidance (if applicable)
  6. Reference materials and definitions
  7. Maintenance information

CONTENT EXPANSION GUIDELINES

  • Add Structure: Organize existing content, don’t replace it
  • Enhance Context: Provide frameworks around existing information
  • Improve Accessibility: Make content more searchable while keeping all details
  • Maintain Examples: Keep all case studies, quotes, and specific examples from source

QUALITY STANDARDS

  • Maximum 3 heading levels (H1, H2, H3)
  • Bullet points with parallel structure
  • Tables for comparative information
  • Code blocks for technical instructions
  • Clear visual separation between sections

CONSISTENCY REQUIREMENTS

  • Use same terminology throughout document
  • Maintain consistent formatting patterns
  • Apply uniform numbering/bullet styles
  • Keep parallel structure in lists and headers

SPECIAL HANDLING INSTRUCTIONS

FOR TECHNICAL DOCUMENTS

  • Include prerequisite knowledge section
  • Define all technical terms in context
  • Provide step-by-step procedures with expected outcomes
  • Add troubleshooting common issues

FOR BUSINESS PROCESSES

  • Start with business context and rationale
  • Include roles and responsibilities
  • Specify decision points and escalation paths
  • Add compliance and audit requirements

FOR TRAINING MATERIALS

  • Begin with learning objectives
  • Include practice exercises or examples
  • Add assessment criteria
  • Provide additional resources for deeper learning

FOR REFERENCE DOCUMENTS

  • Create alphabetical or logical indexing
  • Include cross-references between related topics
  • Add quick-reference sections or checklists
  • Maintain currency with update schedules

TRANSFORMATION EXAMPLE

INPUT: Raw, unstructured content

Our company uses various tools for project management and we need to make sure everyone knows how to use them properly. There are several steps involved and it can be confusing for new people. The tools include Asana, Slack, and Google Drive. Everyone should know the basics.

OUTPUT: AI-friendly structured content

# PROJECT MANAGEMENT TOOLS ONBOARDING GUIDE

## EXECUTIVE SUMMARY
This guide provides step-by-step instructions for new team members to effectively use our three primary project management tools: Asana (task management), Slack (communication), and Google Drive (file storage).

## OBJECTIVES & SCOPE
### What This Document Covers
- Initial setup for Asana, Slack, and Google Drive
- Basic navigation and core features
- Team communication protocols
- File organization standards

### Success Criteria
- New team member can create and assign tasks in Asana
- Can participate in relevant Slack channels
- Can access and organize files in shared Google Drive folders

## MAIN CONTENT
### Asana Setup & Basic Usage
#### Initial Setup
1. **Accept invitation**: Check email for Asana invitation
2. **Create profile**: Add photo and contact information
3. **Join team projects**: Request access to relevant project boards

#### Core Features
- **Task Creation**: Use descriptive titles and due dates
- **Assignment**: Tag responsible team members
- **Progress Tracking**: Update task status regularly

[Continue with structured, detailed content...]

QUALITY ASSURANCE CHECKLIST

Before finalizing the AI-friendly document, verify:

STRUCTURE

  • Clear hierarchy with appropriate heading levels
  • Logical flow from overview to details
  • Consistent formatting throughout
  • Proper use of markdown elements

CONTENT

  • All technical terms defined
  • Examples relevant and concrete
  • Instructions actionable and specific
  • Context provided for recommendations

METADATA

  • Complete document metadata header
  • Accurate keywords and tags
  • Proper categorization
  • Update schedule specified

AI-OPTIMIZATION

  • Scannable structure for quick parsing
  • Searchable keywords naturally integrated
  • Clear section boundaries
  • Minimal ambiguous references

LANGUAGE & OUTPUT REQUIREMENTS

AUTOMATIC LANGUAGE DETECTION

  • Default Behavior: Output in the same language as the input document
  • Language Matching: Preserve original language terminology, cultural context, and communication style
  • Mixed Language Handling: If document contains multiple languages, use the primary/dominant language
  • Technical Terms: Maintain original technical terminology while adding translations in parentheses if helpful

LANGUAGE OVERRIDE

  • User Specification: If user explicitly requests a specific language, override automatic detection
  • Language Request Examples: “Convert to English”, “Output in Vietnamese”, “Translate to Spanish”
  • Bilingual Output: If requested, provide parallel sections in multiple languages

CULTURAL ADAPTATION

  • Business Context: Adapt examples and references to match document’s cultural/geographic context
  • Communication Style: Preserve formal vs. informal tone appropriate to source culture
  • Local Standards: Maintain date formats, measurement units, and business practices from original context

HANDLING LARGE DOCUMENTS

DOCUMENT SIZE ASSESSMENT

Before starting transformation, evaluate document complexity:

Small Documents (< 20 pages or < 15,000 words):

  • Process as single unit using complete workflow
  • Apply full transformation in one pass
  • Maintain all content while optimizing structure

Medium Documents (20-50 pages or 15,000-40,000 words):

  • Consider sectional processing approach
  • May require chunked transformation with integration phase
  • Focus on maintaining consistency across sections

Large Documents (> 50 pages or > 40,000 words):

  • MANDATORY: Use chunked processing approach
  • Process in logical sections (chapters, major topics)
  • Create integration framework for coherent final document

CHUNKED PROCESSING METHODOLOGY

STEP 1: DOCUMENT SEGMENTATION

□ Identify natural break points (chapters, major sections, topics)
□ Create processing order that maintains logical flow
□ Establish consistent terminology and formatting standards
□ Plan integration approach for final unified document

STEP 2: INDIVIDUAL CHUNK PROCESSING

For each section:

□ Apply full AI-friendly transformation workflow
□ Maintain consistent metadata and terminology
□ Create detailed section summaries for integration
□ Note cross-references to other sections

STEP 3: INTEGRATION AND CONSISTENCY

□ Combine processed sections into unified document
□ Resolve terminology inconsistencies across sections
□ Create master table of contents and cross-references
□ Develop comprehensive index and keyword system

STEP 4: FINAL OPTIMIZATION

□ Review entire document for coherence and flow
□ Ensure AI-friendly structure throughout
□ Validate all cross-references and internal links
□ Create master metadata covering entire document

LARGE DOCUMENT WORKFLOW ADAPTATION

For documents requiring chunked processing:

  1. Pre-Processing Analysis:

    • Map document structure and major themes
    • Identify key terminology and concepts
    • Plan consistent formatting approach
  2. Section-by-Section Transformation:

    • Process each major section independently
    • Apply full conversion methodology to each chunk
    • Maintain running glossary of terms and concepts
  3. Integration Phase:

    • Combine sections while maintaining structure
    • Resolve any terminology or formatting inconsistencies
    • Create unified navigation and reference system
  4. Quality Assurance:

    • Review complete document for coherence
    • Ensure all original content is preserved
    • Validate AI-friendly structure throughout

ALTERNATIVE APPROACH: MODULAR PROCESSING

For extremely large or complex documents:

Option 1: Create Document Series

  • Transform large document into series of related AI-friendly documents
  • Each document covers major topic or section
  • Cross-reference system maintains relationships

Option 2: Master Document + Detailed Modules

  • Create comprehensive summary document with AI-friendly structure
  • Maintain detailed modules for specific sections
  • Link system connects overview to detailed content

Option 3: Hierarchical Transformation

  • Multiple levels of detail (executive summary, detailed sections, appendices)
  • Each level optimized for different AI processing needs
  • Scalable approach based on information requirements

### Hướng Dẫn Sử Dụng Chi Tiết

1. **Sao chép** toàn bộ nội dung trong khung `Master Prompt` ở trên.

2. **Dán** vào công cụ AI bạn đang dùng (ChatGPT, Claude, Gemini).

3. **Dán tiếp** nội dung tài liệu bạn muốn chuyển đổi ngay bên dưới prompt đó.

4. **Gõ lệnh** để chọn chế độ:
- `Use RECAP mode` (để tóm tắt thông minh).

- `Use CONVERT mode` (để giữ 100% nội dung và tái cấu trúc).

5. **Gửi** và nhận kết quả.

*Lưu ý: Hiệu quả của prompt dựa trên việc áp dụng các lý thuyết đã được chứng minh từ Khoa học Thông tin và Điện toán Nhận thức. Việc áp dụng nhất quán trong quy trình làm việc sẽ mang lại kết quả tốt nhất.*
## Chi tiết thêm về các background cho bạn nào muốn đọc sâu:

**Lý thuyết Truy xuất Thông tin (Information Retrieval Theory):**
- **Mô hình Không gian Vector (Vector Space Model):** AI hiểu nội dung bằng cách biểu diễn chúng dưới dạng các vector trong không gian đa chiều. Một tài liệu có cấu trúc rõ ràng giúp AI tạo ra “vector ngữ cảnh” chính xác hơn, từ đó dễ dàng khớp các truy vấn của người dùng với nội dung liên quan nhất.

- **Nguyên tắc TF-IDF (Term Frequency-Inverse Document Frequency):** Tần suất xuất hiện của từ (Term Frequency) và mức độ phổ biến của từ đó trong toàn bộ tập tài liệu (Inverse Document Frequency) giúp AI xác định tầm quan trọng của thông tin. Việc sử dụng thuật ngữ nhất quán (consistent terminology) trong tài liệu sẽ giúp AI đánh giá đúng trọng số của các khái niệm.

- **Lập chỉ mục Ngữ nghĩa (Semantic Indexing):** Siêu dữ liệu (metadata) được cấu trúc tốt giúp AI không chỉ truy xuất thông tin nhanh hơn mà còn hiểu được mối quan hệ ngữ nghĩa giữa các tài liệu, tạo ra một mạng lưới tri thức liên kết.

**Lý thuyết Tải trọng Nhận thức (Cognitive Load Theory):**
- **Nguyên tắc Phân đoạn (Chunking Principle):** AI có giới hạn về khả năng xử lý thông tin trong mỗi “khung cửa sổ chú ý” (attention window). Một hệ thống phân cấp thông tin rõ ràng (information hierarchy) giúp giảm “gánh nặng nhận thức” cho AI, cho phép nó tập trung vào các “khối” thông tin phù hợp và quan trọng.

- **Lý thuyết Lược đồ (Schema Theory):** Cấu trúc tài liệu nhất quán tạo ra các khuôn mẫu có thể dự đoán được mà AI có thể học và áp dụng cho các tài liệu tương tự. Điều này giúp AI “dự đoán” cách bố trí thông tin, từ đó xử lý hiệu quả hơn.

**Nguyên tắc Khoa học Thư viện & Thông tin (Library & Information Science Principles):**
- **Tiêu chuẩn Siêu dữ liệu Dublin Core (Dublin Core Metadata Standards):** Đây là một khung chuẩn hóa cho siêu dữ liệu mô tả, giúp AI phân loại và truy xuất tài liệu một cách hiệu quả và có hệ thống.

- **Phân loại theo khía cạnh (Faceted Classification):** Một hệ thống gắn thẻ đa chiều cho phép gán nhiều “khía cạnh” hoặc thuộc tính cho thông tin, giúp AI tìm kiếm và lọc nội dung một cách linh hoạt, đa dạng hơn.

- **Từ vựng có kiểm soát (Controlled Vocabulary):** Việc sử dụng thuật ngữ nhất quán trên các tài liệu tạo ra một “ngôn ngữ chung” giữa con người và AI, giảm thiểu sự mơ hồ trong quá trình diễn giải và hiểu nội dung.

**Nền tảng Kỹ thuật (Technical Foundations):**
- **Giới hạn Cửa sổ Ngữ cảnh (Context Window Limitations):** Các mô hình AI có giới hạn về số lượng token (thường từ 4K đến 128K) mà chúng có thể xử lý cùng lúc. Cấu trúc rõ ràng giúp AI ưu tiên thông tin liên quan và xử lý hiệu quả trong giới hạn này.

- **Cơ chế Chú ý (Attention Mechanisms):** AI sử dụng cơ chế chú ý để “tập trung” vào những phần quan trọng của văn bản. Các tiêu đề và cấu trúc phân cấp rõ ràng sẽ hướng sự chú ý của AI một cách hiệu quả, tương tự như cách con người lướt qua một tài liệu.

- **Phân tích Ngữ nghĩa (Semantic Parsing):** Định dạng có cấu trúc và dễ đọc giúp các thuật toán xử lý ngôn ngữ tự nhiên của AI trích xuất ý nghĩa chính xác từ nội dung, đảm bảo hiểu biết sâu sắc hơn.
0:00

Chia sẻ ảnh