⚡ Tóm tắt nhanh
Thread của 0xJeff đáng đọc không chỉ vì anh liệt kê ra 3 use case Hermes khá hay, mà vì nó nói rất thật về phần đau đầu nhất khi dùng agent lâu dài: quyền quá rộng, memory quá nhiều, skill/cron phình nhanh, và bill token có thể đốt cháy ví chỉ trong vài ngày. Đây là một trong những thread hiếm hoi vừa có “cách dùng hay”, vừa có “cách chết ngu” đi kèm.
Nếu đọc mấy thread khoe agent trên X thời gian gần đây, bạn sẽ thấy một pattern khá mệt: ai cũng show automation bóng bẩy, ai cũng nói agent càng ngày càng hiểu mình hơn, rồi ai cũng vẽ ra tương lai “AI lo việc vặt, mình đi làm việc giá trị cao”.
Thread của 0xJeff cũng đi theo hướng đó — nhưng may là không dừng ở đó. Cái hay là anh này kể luôn những cú ngã rất thật: Bird CLI có thể post nhầm lên timeline, Browser Harness quá nhạy, Hindsight nối sai model có thể đốt $50 token trong một ngày, và tổng cộng anh đã mất $150–200 chỉ trong hai tuần để debug đống setup này.
Nói ngắn gọn: đây không phải thread “Hermes thần kỳ thế nào”. Đây là thread “Hermes hữu ích thật, nhưng nếu không khóa permissions và cost thì rất dễ biến thành cái máy đốt tiền”.
1. Skill số 1: Fetch và phân tích insight từ X
Use case đầu tiên nghe rất hợp lý: để Hermes tự theo dõi các tài khoản X về macro, geopolitics, tech và AI rồi gửi report buổi sáng. Đây là kiểu workflow tiết kiệm thời gian cực mạnh nếu làm đúng, vì nó biến việc “scroll feed 30 phút” thành một báo cáo gọn đã qua lọc.
Ban đầu, Jeff dùng Bird CLI vì đây là một công cụ miễn phí, khá mạnh để tương tác với X. Nhưng chính ở đây anh gặp cú vấp đầu tiên: Bird không chỉ có quyền đọc mà còn có quyền tweet.
Kết quả là Hermes bị hallucinate vài lần khi fetch nội dung và… post bậy lên timeline. Jeff có thử làm wrapper an toàn chỉ cho đọc, nhưng không khóa hẳn được quyền ghi. Cuối cùng anh xóa Bird CLI luôn và chuyển sang X API chính thức.
🚨 Bài học số 1
Nếu tool vừa đọc vừa viết được lên tài khoản thật, đừng tin rằng agent sẽ luôn “hiểu ý bạn”. Quyền quá rộng + hallucination = content rác lên timeline. Rẻ hơn chưa chắc đã tốt hơn.
Jeff chấp nhận trả khoảng $0.5/ngày cho credit X API chỉ để đổi lấy một thứ rất đáng tiền: permission rõ ràng. Đấy là trade-off rất đúng chất production: tốn ít tiền hơn để ngủ ngon hơn.
2. Skill số 2: Bóc tách X bookmarks thành report có ưu tiên
Đây là một use case rất đời thường nhưng cực ngon. Jeff bookmark khoảng 10–20 post mỗi ngày, nhưng trước đây chỉ quay lại được 1–2 cái thật sự nổi bật. Phần còn lại thì nằm đó rồi mốc.
Giờ Hermes sẽ:
- đọc bookmarks,
- chọn ra khoảng 15 cái quan trọng nhất theo preference/investments/interests của Jeff,
- tóm tắt chúng,
- và đề xuất next steps.
Nghe rất hợp lý. Nhưng blocker lại nằm ở chỗ khác: X API v2 không đọc tốt X articles, chỉ lấy được `t.co` links. Vì thế Jeff phải dùng thêm Browser Harness để điều khiển trình duyệt, click vào bài viết và trích full text.
Nói cách khác, workflow “đọc bookmark thông minh” này thực ra là một pipeline nhiều lớp:
- X API lấy danh sách bookmark,
- Browser mở từng URL để lấy full text,
- LLM tóm tắt,
- rồi report được lưu vào wiki/memory.
🧠 Đây là chỗ Hermes bắt đầu giống một hệ thật
Thread của Jeff cho thấy value thật của agent không nằm ở một lệnh đơn. Nó nằm ở chỗ agent biết ghép API, browser, memory và reporting thành một pipeline liền mạch phục vụ đúng workflow cá nhân của bạn.
Nhưng mặt trái cũng đi kèm ngay: Browser Harness là loại công cụ cực mạnh và cực nhạy. Jeff nhấn rất rõ phải dùng browser tách biệt, không chia sẻ credential nhạy cảm và tuyệt đối không thả cho nó browse lung tung.
3. Skill số 3: Reflect
Use case thứ ba là thứ nghe “agentic” nhất: Reflect.
Jeff mô tả nó như khả năng để Hermes tổng hợp thông tin cũ, hiểu preference, nối các mối quan hệ, phát hiện pattern và trả lại các phân tích có thể hành động được. Muốn làm kiểu này, anh dùng thêm external memory provider là Hindsight, vì nó mạnh ở recall dài hạn và multi-session memory.
Kết quả mà Jeff muốn là một kiểu Top 5 Daily Insights — không chỉ tóm tắt xem hôm nay có gì, mà chỉ ra tín hiệu nào thực sự đáng chú ý đối với chính anh và vì sao.
Đây là điểm rất đáng chú ý, vì nó cho thấy agent không chỉ đang làm việc “tìm và tóm”. Nó đang bắt đầu được dùng như một lớp personal synthesis engine — thứ nối dữ liệu cũ và mới để tạo ra insight có ngữ cảnh cá nhân.
4. Nhưng phần đáng tiền nhất của thread lại là lỗi và cost
Nói thật, ba skill trên đều hay. Nhưng phần giá trị nhất trong thread này lại nằm ở những cú đau rất thực tế.
- Bird CLI quá mạnh, agent post nhầm lên X.
- Skill và cron job tăng nhanh khiến config/debug trở thành mớ bòng bong.
- Hindsight nối nhầm qua OpenRouter với Claude Sonnet 4.6 làm cháy $50+ token trong một ngày.
- Tổng chi phí debug / test / setup trong hai tuần đã lên cỡ $150–200.
Đây là phần rất nhiều thread khoe agent không nói đến: agent mạnh không đồng nghĩa agent rẻ. Và đôi khi cái đắt nhất không phải inference lúc chạy ngon, mà là đống tiền bị đốt trong quá trình bạn cấu hình sai, khóa quyền không kỹ, hoặc để memory/tool loop chạy lạc.
💸 Bài học số 2
Trong giai đoạn này của AI agents, token management gần như là một kỹ năng cốt lõi. Không kiểm soát model, permission, memory provider và cron scope thì productivity boost có thể rất nhanh biến thành productivity tax.
5. Vậy takeaway lớn nhất từ thread này là gì?
Theo mình, có ba takeaway rõ nhất.
Thứ nhất, use case tốt nhất của agent hiện tại là tăng tốc học và lọc thông tin. Jeff dùng Hermes chủ yếu để tiêu hóa insight nhanh hơn, từ đó dành thời gian cho việc giá trị cao hơn.
Thứ hai, permission design quan trọng ngang capability. Tool càng mạnh càng phải khóa đúng quyền, nếu không thì chỉ cần một hallucination nhỏ là đủ tạo ra hậu quả thật.
Thứ ba, cost control là câu chuyện sống còn. Khi agent bắt đầu nối với browser, memory provider, cron jobs và nhiều model khác nhau, chuyện “burn bao nhiêu mỗi ngày” không còn là câu hỏi phụ nữa.
6. Kết luận
Thread của 0xJeff đáng đọc vì nó vừa có phần “đây là cách dùng Hermes hữu ích thật”, vừa có phần “đây là cách bạn có thể tự giết budget của mình nếu không cẩn thận”.
Nó cho thấy agent đang tiến tới chỗ hữu ích thật sự — nhất là với các workflow kiểu tổng hợp thông tin, memory-based reflection và automation cá nhân. Nhưng nó cũng nhắc một điều rất quan trọng: AI agent không phải cái hộp thần kỳ. Nó là một hệ thống. Và hệ thống thì luôn đi kèm setup cost, permission risk và maintenance pain.
🎯 Chốt một câu
Điều đáng học từ 0xJeff không chỉ là 3 skill Hermes. Điều đáng học hơn là: muốn agent hữu ích lâu dài, bạn phải thiết kế quyền và cost cẩn thận như thiết kế chính workflow của mình.
Source: 0xJeff thread