Khám phá Learn Stream About Jokes
INSIDER Tony's Friends — Insider — ~2 playbook/tuần, Discord riêng, tài nguyên dựng sẵn Tham gia →
Stream
Liên kết

How to stop hitting Claude usage limits. - by Ruben Hassid

· website

TL;DR

Ruben Hassid chia sẻ 23 thói quen giúp bạn tối ưu việc xài Claude, từ những mẹo ít ai biết đến các nguyên tắc cơ bản. Mục tiêu là tránh “đốt” tokens vô tội vạ, giúp bạn dùng Claude hiệu quả hơn mà hông lo đụng giới hạn hay tốn tiền.

Nói đơn giản: Như có một cuốn sổ tay bí kíp để Claude làm việc hết công suất mà hông bị “hụt hơi” giữa chừng.

Tổng quan

Ruben Hassid, một người dùng Claude thường xuyên, từng gặp vấn đề “đốt” hết credits trước 2 giờ chiều. Dù đã chuyển sang gói $100, Ruben vẫn liên tục nhận được câu hỏi từ team về việc Claude bị giới hạn. Từ đó, anh ấy tổng hợp 23 thói quen, xếp từ ít biết đến cơ bản, để giúp team và mọi người tiết kiệm tokens.

Cốt lõi của vấn đề là Claude tính tokens bằng cách đọc lại TOÀN BỘ lịch sử chat mỗi khi bạn gửi tin nhắn mới. Tin nhắn thứ 30 sẽ tốn hơn rất nhiều so với tin nhắn đầu tiên vì nó phải đọc lại 29 lượt trao đổi trước đó. Đó là lý do credits của bạn cứ “bay” nhanh chóng.

Áp dụng các mẹo này giúp Ruben chỉ bị giới hạn khoảng 1 lần/tháng, thay vì mỗi ngày. Đây hông phải là các mẹo học thuật, mà là kinh nghiệm thực chiến từ người đang “ăn dog food” mỗi ngày.

Xài vào việc gì?

Bạn đang upload file PDF, DOCX, PPTX trực tiếp lên Claude? Trước khi upload, hãy trích xuất text ra file plain text hoặc markdown. Crop ảnh thật sát phần cần thiết. File PDF 15 trang có thể tốn 180,000+ tokens, nhưng chuyển thành text chỉ còn 2,000 tokens. Kết quả: Bạn tiết kiệm hàng chục nghìn tokens mỗi lần upload, giúp Claude tập trung vào nội dung chính thay vì “đọc” metadata thừa.

Bạn muốn Claude tạo file (spreadsheet, doc) nhưng sợ tốn tokens? Thay vì yêu cầu Claude tạo file ngay trong Cowork, hãy dùng Chat để lên cấu trúc, thống nhất các phần, chốt giả định. Khi đã có plan rõ ràng, mới chuyển sang Cowork để “Build this exact file.” Kết quả: Bạn tư duy ở “sản phẩm” giá rẻ (Chat), rồi mới xây dựng ở “sản phẩm” đắt tiền (Cowork), tối ưu chi phí.

Bạn hay viết prompt dài dòng để cung cấp ngữ cảnh? Thay vì viết prompt 500 từ, hãy dùng prompt ngắn (dưới 30 từ) và yêu cầu Claude “ask me questions” (dùng AskUserQuestion tool). Claude sẽ tự hỏi các câu hỏi làm rõ, và việc bạn click chọn hoặc trả lời ngắn gọn tốn rất ít tokens. Kết quả: Giảm đáng kể số tokens Claude phải đọc lại mỗi lần, vì các câu hỏi làm rõ chỉ được tạo ra một lần.

Bạn thường yêu cầu Claude “làm lại toàn bộ” khi có một phần sai? Khi chỉ có Section 3 của báo cáo sai, đừng nói “redo the report.” Hãy nói “only redo section 3. Keep everything else to save tokens.” Thêm “No commentary. No explanations. Just the output.” nếu bạn biết chính xác mình muốn gì. Kết quả: Tránh việc Claude tạo lại toàn bộ output (ví dụ 2,000 tokens), chỉ tốn tokens cho phần cần sửa.

Bạn đang dùng một chat cho nhiều chủ đề khác nhau (LinkedIn post, client proposal, recipe)? Mỗi khi đổi chủ đề, hãy bắt đầu một chat mới. Claude vẫn sẽ đọc lại toàn bộ lịch sử chat cũ (LinkedIn, proposal) khi nó nghĩ về “dinner” của bạn, đó là “dead weight” tokens. Kết quả: Đảm bảo Claude chỉ tập trung vào ngữ cảnh liên quan, tránh lãng phí tokens cho thông tin không cần thiết.

Các điểm chính

  • Tokens = Words, và Claude đọc lại toàn bộ lịch sử chat: Đây là nguyên nhân chính gây tốn tokens. Mỗi tin nhắn mới là một lần Claude “ôn bài” từ đầu.
    • Hành động: Luôn ý thức về độ dài cuộc trò chuyện và tìm cách rút gọn ngữ cảnh hoặc bắt đầu chat mới.
  • Tối ưu file đầu vào: Hông phải cứ upload là xong. Metadata và ảnh lớn là “kẻ thù” thầm lặng, làm Claude phải đọc nhiều thứ hông cần thiết.
    • Hành động: Chuyển đổi file sang plain text/markdown, crop ảnh thật sát trước khi upload.
  • Tư duy trước khi xây dựng: Dùng công cụ “rẻ” để lên kế hoạch, công cụ “đắt” để thực thi.
    • Hành động: Dùng Claude Chat để phác thảo ý tưởng, sau đó mới dùng Cowork/Opus để tạo file.
  • Để Claude hỏi bạn, đừng cố gắng nhồi nhét thông tin: Prompt ngắn, để Claude chủ động hỏi làm rõ sẽ hiệu quả hơn và tiết kiệm tokens hơn việc bạn viết prompt dài.
    • Hành động: Dùng “AskUserQuestion” tool, thay vì viết prompt dài dòng.
  • Chỉnh sửa tin nhắn thay vì gửi tin nhắn mới (trong Chat): Đây là một “hack” cực kỳ hiệu quả mà nhiều người bỏ qua.
    • Hành động: Dùng nút “Edit” trên tin nhắn cũ để sửa prompt và regenerate. Tránh tạo thêm lịch sử chat.
  • Mỗi chủ đề mới = một chat mới: Đừng biến một chat thành “bãi rác” của đủ thứ thông tin.
    • Hành động: Luôn bắt đầu chat mới khi chuyển sang một chủ đề hoàn toàn khác.
  • Sử dụng Project cho tài liệu dùng lặp lại: Upload một lần, Claude sẽ cache (lưu trữ) nó.
    • Hành động: Dùng tính năng Projects để lưu trữ các tài liệu tham chiếu thường xuyên (hợp đồng, brand guide) để Claude hông phải đọc lại mỗi lần.
  • Tắt các tính năng hông dùng: Web search, connectors, và “Explore” mode đều tốn tokens, ngay cả khi bạn hông cần.
    • Hành động: Mặc định tắt hết, chỉ bật khi thật sự cần cho tác vụ đó.

Quick Start

  1. Làm ngay tuần này: Khi upload file, hãy convert sang markdown hoặc plain text trước. Dùng nút “Edit” trên tin nhắn cũ thay vì gửi tin nhắn mới (trong Chat).
  2. Bước tiếp: Khi bắt đầu một chủ đề mới, hãy tạo một chat mới. Nếu dùng Cowork, hãy plan cấu trúc trong Chat trước khi yêu cầu tạo file.
  3. Thói quen duy trì: Định kỳ tóm tắt cuộc trò chuyện dài và bắt đầu chat mới với bản tóm tắt đó. Tắt các tính năng hông dùng (search, connectors) mặc định, chỉ bật khi cần.

FAQ

Tại sao Claude lại tốn nhiều tokens đến vậy? Vì Claude đọc lại toàn bộ lịch sử cuộc trò chuyện từ đầu mỗi khi bạn gửi tin nhắn mới. Cuộc trò chuyện càng dài, mỗi tin nhắn càng tốn kém hơn.

Làm sao để biết mình đang tốn tokens ở đâu? Mỗi tin nhắn, mỗi lần Claude tạo output, mỗi lần đọc file đều tốn tokens. Các tính năng như Web search, Connectors, Extended Thinking cũng “đốt” tokens ngay cả khi bạn hông để ý.

Có nên dùng gói Claude $100/tháng hông? Nếu bạn dùng Claude thường xuyên và hông muốn lo lắng về giới hạn, gói $100 giúp bạn hông phải “căn ke” quá nhiều. Nhưng các mẹo này vẫn giúp bạn dùng gói $20 hiệu quả hơn rất nhiều.

Claude có phải là công cụ tốt nhất cho mọi thứ hông? Hông. Claude hông mạnh về tạo ảnh hay tìm kiếm thời gian thực. Nên dùng các công cụ chuyên biệt như Gemini (ảnh) hay Grok/ChatGPT (search) cho những tác vụ đó để tránh lãng phí tokens.

#claude #aiautomation #tiuchiph #tokenmanagement #hiusutai #workflowai #tipstricks
0:00

Chia sẻ ảnh

Bắt đầu gõ để tìm kiếm...