⚡ Tóm tắt nhanh
Google vừa đưa Deep Research và Deep Research Max lên Gemini API, chạy trên Gemini 3.1 Pro, với các capability rất đúng kiểu “agent hạ tầng”: MCP tùy ý, chart/infographic native, collaborative planning, multimodal grounding, streaming và báo cáo có citation. Điểm đáng chú ý không chỉ là agent làm research tốt hơn, mà là Google đang tách research thành hai tầng workflow rõ ràng: một cho tương tác nhanh, một cho job nền dài hơi.
Google mô tả đây là “the next evolution of our autonomous research agent”. Câu này nghe hơi marketing, nhưng lần này họ có một điểm khá chắc tay: thay vì chỉ nâng một mode research cũ, họ tách hẳn sản phẩm thành hai cấu hình với hai mục đích dùng khác nhau.
Video launch gốc từ tweet của Google. Mình nhúng thẳng video thật vào bài.
1. Deep Research và Deep Research Max khác nhau ở đâu?
Google chia rất rõ:
- Deep Research ưu tiên tốc độ, latency thấp hơn, cost thấp hơn và phù hợp cho interactive user surfaces.
- Deep Research Max ưu tiên độ sâu, dùng nhiều test-time compute hơn để reasoning, search và refine report, hợp cho các job chạy nền kiểu overnight.
Nghe đơn giản, nhưng đây là thay đổi framing rất đáng chú ý. Trước giờ nhiều công cụ AI research cố làm một mode “vừa nhanh vừa sâu”. Thực tế thì hai mục tiêu này thường cắn nhau. Google thôi không giả vờ cân bằng hoàn hảo nữa, mà tách nó thành hai engine riêng cho hai bối cảnh dùng khác nhau.
Ảnh từ thread cho thấy Google chia rõ hai cấu hình: một cho speed, một cho quality và overnight synthesis.
2. Một API call, nhưng phía sau là cả một research stack
Điểm Google đẩy rất mạnh là: chỉ một API call có thể kích hoạt cả workflow nghiên cứu đầy đủ. Nhưng cái đáng giá không nằm ở “one call”. Nó nằm ở những thứ call đó có thể kéo vào:
- open web,
- file uploads và file stores kết nối sẵn,
- remote MCP servers,
- URL context, code execution, file search,
- và có thể tắt web để chỉ search trong dữ liệu riêng.
Nói thẳng ra, đây không còn là một “chat with search”. Nó là một research orchestration layer.
Và đây là chỗ MCP support đáng tiền thật. Không phải vì chữ MCP đang hot, mà vì nó cho phép Deep Research đi từ vai trò web researcher sang vai trò agent truy cập các nguồn dữ liệu chuyên biệt, kể cả nguồn riêng của doanh nghiệp.
🧠 Insight lớn nhất
Khi research agent chạm được cả web lẫn dữ liệu riêng qua MCP, nó đổi category. Nó không còn là công cụ “giúp tìm hiểu thêm”, mà bắt đầu thành một lớp thu thập-ngữ cảnh và tổng hợp cho workflow chuyên nghiệp thật.
3. Google đang nhấn rất mạnh vào control và transparency
Đây là phần mình đánh giá cao nhất. Google không chỉ khoe output đẹp hơn, mà còn thêm mấy lớp kiểm soát khá đúng bệnh của research agents:
- Collaborative planning: xem và chỉnh plan trước khi agent chạy,
- real-time streaming: theo dõi thought summaries và output khi đang sinh,
- multimodal inputs: dùng PDF, CSV, audio, video, image làm grounding,
- native charts & infographics: output không chỉ là text report.
Những thứ này nghe như checklist feature, nhưng thật ra nó giải quyết ba nỗi đau rất thật:
- đốt compute ngu vì agent hiểu sai scope,
- khó debug khi nó đi lệch hướng,
- và cuối cùng vẫn phải lôi dữ liệu sang tool khác để vẽ chart cho tử tế.
Đặc biệt collaborative planning là nước đi cực khôn. Nó cho user một lớp “bẻ lái trước khi tốn tiền”, thay vì chỉ ngồi cầu trời sau khi submit task.
4. Native charts và infographic là chi tiết không nên xem nhẹ
Nhiều người sẽ nhìn tính năng này rồi bảo “ồ, thêm chart thôi mà”. Thực ra không đơn giản vậy.
Trong workflow research thực tế, report text chỉ là nửa đầu câu chuyện. Nửa còn lại là chuyển đống findings đó thành thứ stakeholder đọc được, trình được, hoặc ném vào deck được. Nếu agent tự sinh ra chart và infographic inline trong report, nó cắt bớt hẳn một bước hậu kỳ rất tốn thời gian.
Đây là chỗ Google đang đẩy research agent từ “trợ lý phân tích” sang “máy tạo output có thể tiêu thụ được”. Nó cùng hướng với những gì nhiều hệ agent mới đang làm: output phải là artifact usable, không chỉ là câu chữ.
5. Deep Research Max thực chất là một loại background job engine
Bài blog của Google dùng ví dụ rất rõ: chạy một task trước khi đi ngủ, sáng dậy có báo cáo due diligence hoàn chỉnh cho team analyst. Mình nghĩ đây mới là mấu chốt của launch này.
Deep Research Max không chỉ là “mode chậm hơn nhưng giỏi hơn”. Nó là cách Google nói rằng có những loại tri thức không phù hợp để được sinh ra trong một phiên chat chờ 30 giây. Chúng nên chạy như một background job, có thời gian để search thêm, cân nhắc nguồn, refine report, và sinh artifact đủ đẹp để mang đi dùng tiếp.
6. Nhưng cost, hallucination và product split vẫn là chỗ sẽ bị soi
Replies dưới thread cũng chọc đúng mấy điểm cần chọc:
- Max mode có thể đốt ngân sách API khá đau,
- hallucination trong research vẫn là vấn đề sống còn,
- nhiều người thắc mắc vì sao tính năng này không vào Gemini app hay AI Studio ngay,
- và việc product nằm ở API trước nghĩa là nhóm dev/enterprise được ưu tiên hơn user phổ thông.
Những điểm này đều hợp lý. Một research agent càng mạnh thì kỳ vọng về factuality càng khắt khe. Citation không tự động đồng nghĩa với đúng, và report dài hơn không tự động đồng nghĩa với hữu ích hơn. Google có vẻ hiểu chuyện đó nên mới nhấn nhiều vào source diversity, conflicting evidence và chuyên ngành ít margin for error như finance hay life sciences.
7. Chốt lại
Deep Research và Deep Research Max trên Gemini API là một bước đi đáng chú ý không phải vì Google có thêm một tính năng AI mới, mà vì họ đang đóng research agent thành một lớp hạ tầng workflow rõ ràng hơn nhiều.
Một mode cho interactive surfaces. Một mode cho background jobs. Một lớp kiểm soát trước khi chạy. Một lớp quan sát trong lúc chạy. Và output không chỉ là text, mà là report có citation kèm chart/infographic. Đó là dấu hiệu rất rõ rằng research AI đang rời khỏi ô chat để bước vào vùng “infrastructure for knowledge work”.
🎯 Chốt một câu
Google không chỉ nâng cấp Deep Research. Họ đang biến research agent thành một job engine có thể cắm vào pipeline thật của doanh nghiệp — và đó mới là phần đáng tiền.
Source: thread của Google và bài blog Google.