🧠 Tóm tắt nhanh
GBrain là dự án mã nguồn mở của Garry Tan để xây dựng một personal brain cho AI agent. Thay vì để agent trả lởi từ context window ngắn, GBrain cho phép agent đọc trước mỗi câu trả lởi và viết lại sau mỗi cuộc trò chuyện vào một knowledge base kết hợp markdown repo + Postgres + pgvector. Nói cách khác, đây là nỗ lực biến AI agent từ "ngườì mới mỗi ngày" thành một thực thể có trí nhớ dài hạn thực sự.
Garry Tan — CEO của Y Combinator và một trong những ngườì có tiếng trong giới startup — vừa open-source một dự án cá nhân mang tên GBrain. Không phải một app note-taking đơn giản. Cũng không phải một vector database generic. Đây là một bộ não ý kiến cho AI agent, được thiết kế để agent tự cài đặt, tự vận hành, và tự làm giàu kiến thức qua thờii gian.
Ý tưởng cốt lõi nghe rất dễ hiểu: "Your AI agent is smart but it doesn't know anything about your life. GBrain fixes that." Nhưng để thực hiện ý tưởng đó, Garry đã xây dựng một kiến trúc khá nghiêm túc.
Vấn đề GBrain giải quyết là gì?
Hầu hết AI agent hiện nại hoạt động trong một context window hạn chế. Bạn chat xong, đóng tab, mở lại — agent như gặp bạn lần đầu. Kể cả khi có memory file hay daily notes, việc triệu hồi thông tin đó thường phụ thuộc vào prompt engineering hoặc ngườì dùng phải chủ động nhắc nhở.
GBrain thay đổi mô hình này bằng cách tạo ra một vòng lặp read-write liên tục:
- Signal arrives: meeting, email, tweet, link, voice call...
- Agent detects entities: ngườì, công ty, ý tưởng...
- READ: agent kiểm tra brain trước khi trả lởi.
- Respond with full context.
- WRITE: cập nhật brain pages với thông tin mới.
- SYNC: GBrain index các thay đổi cho lần query sau.
Kiến trúc GBrain: Markdown Repo + Postgres + pgvector
GBrain không ép bạn dùng một database server phức tạp ngay từ đầu. Mặc định, nó dùng PGLite — một embedded Postgres chạy qua WASM, không cần server, không cần Docker, không cần tài khoản cloud. Một lệnh gbrain init và bạn có Postgres 17.5 với pgvector trong ~2 giây.
Khi brain lớn hơn — Garry đề cập ngưỡng ~1000+ files hoặc cần multi-device access — bạn có thể migrate sang Supabase bằng một lệnh gbrain migrate --to supabase.
Source of truth thì nằm ở một git repo chứa markdown files. Con ngườ̀i có thể đọc và sửa trực tiếp bất kỳ file nào. GBrain chỉ đóng vai trò là lớp retrieval phía trên. Đây là một lựa chọn thiết kế rất "developer-first": bạn không bị lock-in vào một định dạng proprietary.
📌 Cấu trúc tìm kiếm
GBrain dùng hybrid search kết hợp ba lớp: keyword search (tsvector), vector search (HNSW cosine), và RRF fusion (Reciprocal Rank Fusion). Ngoài ra còn có multi-query expansion để bắt các cách diễn đạt khác nhau mà ngườ̀i dùng không nghĩ tới. Điều này giải quyết đúng điểm yếu của cả keyword search (bỏ sót conceptual match) lẫn vector search (bỏ sót exact phrase).
Compiled Truth + Timeline: mô hình ghi nhớ thông minh
Mỗi page trong GBrain tuân theo một pattern rất đẹp: compiled truth + timeline.
- Compiled truth (trên dấu
---): là hiểu biết tốt nhất hiện tại của bạn về chủ đề đó. Nội dung này được viết lại khi có bằng chứng mới. - Timeline (dưới dấu
---): là dòng sự kiện append-only. Không bao giờ bị sửa, chỉ được thêm vào.
Mô hình này giải quyết một bài toán khó của knowledge management: làm sao vừa giữ được "câu trả lởi hiện tại đúng nhất", vừa không mất dấu vết lịch sử. Compiled truth là câu trả lởi. Timeline là bằng chứng.
Các integration: từ voice call đến Twitter
GBrain không chỉ ngồi chờ bạn copy-paste note vào. Nó có một hệ thống recipe-based integrations mà agent có thể tự đọc và tự cài:
- Voice-to-Brain: gọi điện thoại, AI nghe máy, tra context từ brain, trả lởi như một ngườ̀i thực sự biết bạn. Khi cuộc gọi kết thúc, transcript và entity detection được ghi vào brain.
- Email-to-Brain: Gmail → entity pages.
- X-to-Brain: Twitter timeline + mentions + deletions → brain pages.
- Calendar-to-Brain: Google Calendar → searchable daily pages.
- Meeting Sync: Circleback transcripts → brain pages với attendees.
Đây không phải là "kết nối API cho vui". Đây là cách biến toàn bộ dòng chảy thông tin cá nhân thành một knowledge graph mà agent có thể query.
Ba lớp trí nhớ: gbrain, agent memory, session context
Một điểm sâu sắc trong docs của GBrain là sự phân biệt ba lớp trí nhớ:
- gbrain: world knowledge — ngườ̀i, công ty, deal, meeting, ý tưởng.
- agent memory: operational state — preference, decision, cách agent nên cư xử.
- session context: cuộc trò chuyện hiện tại.
Garry nhấn mạnh rằng cả ba lớp nên được kiểm tra. GBrain cho facts về thế giớii. Memory cho agent config. Session cho ngữ cảnh tức thởi. Đây là một framework trí nhớ đầy đủ hơn hẳn so với việc chỉ dựa vào context window.
Con số từ deployment thực tế
Garry không chỉ nói lý thuyết. Anh đang chạy GBrain cho chính mình với quy mô ấn tượng:
- 10,000+ markdown files
- 3,000+ people pages với compiled dossiers
- 13 năm dữ liệu calendar
- 280+ meeting transcripts
- 300+ captured original ideas
Agent chạy cron khi anh ngủ — quét mọi cuộc trò chuyện, bổ sung entity còn thiếu, sửa citation bị hỏng, và consolidate memory. Sáng ra, brain đã "thông minh hơn so với lúc đi ngủ".
Ý nghĩa lớn hơn: agent đang cần một infrastructure memory riêng
GBrain là một tín hiệu rõ rệt cho xu hướng đang nổi: AI agent không thể chỉ thông minh ở tầng model. Nó cần một tầng memory đủ mạnh, đủ structured, và đủ persistent.
Nếu nhìn rộng ra, chúng ta đang thấy nhiều dự án cùng hướng:
- OpenClaw với Active Memory và REM backfill.
- Anthropic với Managed Agents và separated brain/hands architecture.
- Shopify AI Toolkit cho agent commerce operations.
GBrain đứng ở một vị trí đặc biệt vì nó không phụ thuộc vào một agent framework duy nhất. Nó hỗ trợ OpenClaw, Hermes Agent, Claude Desktop, Cursor, Perplexity, và bất kỳ MCP client nào. Đó là một lớp memory infrastructure độc lập.
⚠️ Điểm cần cân nhắc
- Chi phí embedding: ~$4-5 cho 7,500 pages qua OpenAI API. Scale lớn hơn sẽ tốn hơn.
- Supabase Pro: $25/tháng cho brain lớn (8GB). Không phải miễn phí hoàn toàn ở quy mô production.
- Độ phức tạp: dù setup chỉ ~30 phút, việc maintain một brain có 10,000+ files đòi hỏi discipline. Nếu không có cron và enrichment pipeline, brain nhanh chóng bị stale.
- Privacy: khi bạn đổ toàn bộ email, calendar, meeting transcript vào một system, dù local hay cloud, surface attack tăng lên đáng kể.
Kết luận
GBrain không phải là một app hoàn hảo cho mọi ngườ̀i. Nó rõ ràng được thiết kế cho power user, founder, investor, hoặc bất kỳ ai cần một agent thực sự "biết" về thế giớii của họ. Điều quan trọng không phải là codebase hoàn hảo, mà là framework mà Garry đang định nghĩa: agent cần một brain, brain cần một vòng lặp read-write liên tục, và mọi thứ nên bắt đầu từ markdown để con ngườ̀i luôn kiểm soát được.
Nếu xu hướng này tiếp tục, chúng ta sẽ sớm thấy một lớp infrastructure mới xuất hiện: memory-as-a-service for agents. GBrain có thể chỉ là một trong những dự án đầu tiên, nhưng chắc chắn không phải dự án cuối cùng.
Source: github.com/garrytan/gbrain
Docs: GBRAIN_SKILLPACK.md