Top AI Papers Của Tuần (19-26/4): DeepSeek V4, Autogenesis, Skill-RAG, Stateless Memory

TL;DR

DAIR.AI vừa đăng round-up Top AI Papers of the Week với 10 paper nổi bật, từ DeepSeek V4, Autogenesis, Attention to Mamba, Skill-RAG cho tới Stateless Decision Memory và Diversity Collapse in Multi-Agent LLMs. Điểm đáng chú ý không chỉ là từng paper riêng lẻ, mà là cả list này đang vẽ ra khá rõ 3 hướng lớn của AI hiện tại: long-context open models đang tiến rất nhanh, agent đang chuyển từ “dùng tool” sang “tự sửa chính mình”, và lớp hạ tầng memory/RAG/deployment mới là thứ quyết định hệ agent có sống được ngoài đời thật hay không.

Minh hoạ bài Top AI Papers of the Week từ thread của DAIR.AI

Ảnh minh hoạ được thêm lại vào đầu bài để bám đúng thread của DAIR.AI, thay vì để bài chỉ toàn chữ như lúc đầu.

Đây không phải chỉ là một danh sách paper hay

Round-up kiểu này rất dễ bị đọc lướt như newsletter tổng hợp: 10 paper, mỗi paper vài ý, đọc xong thấy “nhiều thứ ghê”. Nhưng list tuần này của DAIR.AI thật ra có cấu trúc khá rõ nếu nhìn kỹ. Nó không chỉ gom những thứ hot, mà vô tình phác ra bản đồ ưu tiên hiện tại của field.

Có ít nhất 3 trục nổi bật chạy xuyên suốt cả list:

1. Long-context & open models

DeepSeek V4, Attention to Mamba cho thấy cuộc đua hiệu quả dài context vẫn đang nóng.

2. Self-improving agents

Autogenesis, Self-Generated World Knowledge, Self-Evolving Logic Synthesis đều xoay quanh agent tự sửa và tự tiến hóa.

3. Deployment plumbing

Skill-RAG, Stateless Decision Memory, MASS-RAG và Diversity Collapse đụng thẳng vào chuyện build agent thật sao cho đỡ vỡ.

1) Paper số 1: DeepSeek V4 vẫn là cái tên lớn nhất của tuần

Việc DAIR.AI đặt DeepSeek V4 lên đầu không có gì bất ngờ. Đây vẫn là release gây tiếng vang lớn nhất trong tuần, không chỉ vì benchmark mà vì cách nó được thiết kế ngay từ đầu cho million-token context thay vì gắn thêm như một tính năng phụ. Paper tại đây.

Bài roundup nhấn vào 4 điểm chính:

Hybrid attention với CSA và HCA để giữ mô hình khả thi ở 1M context.
Training stability ở quy mô trillion-parameter với Anticipatory Routing và SwiGLU Clamping.
Domain-specialist post-training thay vì một pha RL trộn hết vào nhau.
Frontier-adjacent performance với chi phí open-source dễ chạm hơn nhiều so với closed frontier.

Ý lớn ở đây rất rõ: open-weight models đang không còn chỉ là “bản rẻ hơn, yếu hơn”. Chúng bắt đầu tiến tới vùng mà closed frontier buộc phải coi là cạnh tranh nghiêm túc, đặc biệt ở những workload dài context và nhạy về economics.

2) Trục thứ hai của cả list: agent không chỉ dùng tool nữa, mà bắt đầu tự sửa chính mình

Phần giữa của roundup có một motif lặp đi lặp lại: self-improvement. Đây mới là thứ đáng để ý nhất nếu nhìn cả cụm paper thay vì từng cái lẻ.

Autogenesis

Autogenesis mô tả một protocol nơi agent tự tìm ra capability gap, tự đề xuất cải tiến, tự test, rồi commit thứ gì hoạt động ngược trở lại framework của chính nó. Không retrain, không cần người vá tay liên tục. Paper tại đây.

Điểm đáng tiền ở paper này không phải chuyện “agent tự tiến hóa” nghe sci-fi, mà là việc nó cố dựng lineage, audit và rollback cho mỗi lần tự sửa. Tức là biến self-modification thành thứ đủ có kỷ luật để deploy.

Self-Generated World Knowledge

Paper này đẩy xa hơn ở chỗ dùng reward dựa trên task success để đánh giá liệu world knowledge do agent tự sinh ra có thực sự hữu ích hay không. Đó là một cách rất khác với kiểu nhồi thêm knowledge rồi tin rằng model sẽ tự biết dùng. Paper tại đây.

Nếu hướng này thắng, bottleneck của agent systems sẽ chuyển từ “gắn thêm dữ liệu” sang “thiết kế environment đủ tốt để agent học ra cái đáng giữ”.

Self-Evolving Logic Synthesis

Đây là case thú vị nhất vì nó không chỉ chỉnh prompt. NVIDIA dùng multi-agent LLM system để đọc, sửa và tối ưu trực tiếp codebase của ABC, một tool logic synthesis đã được hand-tune hàng chục năm trong EDA. Nếu đúng như paper nói, đây là bước tiến từ “agent tự sửa workflow” sang “agent tự sửa hạ tầng code thật”. Paper tại đây.

💡 Ý nghĩa lớn hơn

Ba paper này ghép lại cho thấy field đang chuyển từ agents that use tools sang agents that edit their own tooling, routines và knowledge. Đó là bước chuyển rất lớn, và cũng là chỗ rủi ro bắt đầu tăng vọt nếu không có audit/rollback đủ tốt.

3) Hạ tầng deployment mới là phần ít sexy nhưng có thể sống lâu nhất

Nếu chỉ đuổi theo capability paper, người ta rất dễ bỏ qua nhóm paper “plumbing”. Nhưng chính DAIR.AI cũng gài vào list tuần này vài cái rất đáng chú ý ở tầng hạ tầng.

Skill-RAG

Paper này đánh đúng điểm đau lớn của RAG hiện tại: nhiều hệ thống retrieve gần như mọi query, dù model có thể biết sẵn câu trả lời hoặc dù loại retrieval đang dùng không hợp với failure mode gặp phải. Skill-RAG biến retrieval thành thứ có điều kiện và có chuyên môn hóa theo từng kiểu failure. Paper tại đây.

Điểm hay nằm ở chỗ nó hỏi hai câu thay vì một: có cần retrieve không? và nếu có thì retrieve theo kiểu nào?. Đây mới là hướng RAG đáng để theo lâu dài.

Stateless Decision Memory

Đây là sleeper pick của list, và phản hồi dưới tweet cũng chỉ thẳng vào chỗ đó. Paper đề xuất bỏ active memory kiểu stateful agent, thay bằng immutable decision logs theo tinh thần event-sourcing. Mỗi quyết định, tool call, observation đều append vào log; bất kỳ instance nào cũng có thể replay để dựng context khi cần. Paper tại đây.

Nghe hơi khô, nhưng đây là kiểu ý tưởng rất enterprise: audit trail, replay, provenance, multi-tenant isolation, horizontal scaling. Nếu bạn cần hàng nghìn agent instances chạy qua container thật, đây là thứ quan trọng hơn cả việc model biết lý luận thêm 2 điểm benchmark.

MASS-RAG & Diversity Collapse

MASS-RAG tiếp tục nhắc lại cùng một lesson: retrieval ngoài đời không chỉ là tìm tài liệu “liên quan kỹ thuật”, mà là phải tìm thứ thực sự đóng góp vào câu trả lời. Paper MASS-RAG. Còn Diversity Collapse in Multi-Agent LLMs thì là cú tạt nước lạnh: đừng mặc định nhiều agent sẽ sinh ra nhiều góc nhìn khác nhau. Nếu context, feedback và task framing bị ghép quá chặt, chúng sẽ hội tụ về cùng một attractor.

Đây là paper rất đáng giữ lại vì nó chọc đúng chỗ hype của multi-agent systems: nhiều agent không tự động đồng nghĩa với nhiều ý tưởng độc lập.

⚠️ Bài học quan trọng

List tuần này cho thấy một điều hơi phũ: AI agent muốn ra đời thật thì không chỉ cần model giỏi hơn. Nó cần retrieval biết chọn lúc, memory audit được, agent đủ tách biệt để không collapse về một ý, và infrastructure đủ kỷ luật để replay / rollback / scale.

4) Những paper còn lại đang lấp đầy phần “quiet infrastructure”

Bên cạnh các cái tên nổi bật hơn, list còn có vài paper đáng chú ý vì vai trò nền:

Attention to Mamba: chỉ ra một con đường rẻ hơn để chuyển từ Transformer sang SSM mà không phải train lại từ đầu. Paper.
There Will Be a Scientific Theory of Deep Learning: một paper vị thế, cố hợp thức hóa “learning mechanics” như phần của lý thuyết khoa học về deep learning. Paper.

Đây là loại paper không chắc gây bão trên mạng xã hội, nhưng thường để lại ảnh hưởng dài hạn hơn vì chúng thay đổi cách người ta nghĩ về lớp nền của hệ thống, chứ không chỉ thêm một trick benchmark.

Nếu phải rút 3 tín hiệu lớn từ cả roundup này

Open models đang tiến rất sát closed frontier ở vài mặt trận quan trọng, đặc biệt long context và serving economics.
Agent research đang dịch trọng tâm từ task solving sang self-improvement + operational discipline.
Lớp hệ thống quanh model mới là nơi nhiều vấn đề thực tế đang nằm: RAG routing, memory architecture, deployment scaling, auditability, diversity giữa nhiều agent.

Vì vậy, roundup này đáng đọc không chỉ để bookmark vài arXiv link. Nó đáng đọc vì nó cho thấy nơi field đang dồn lực: không chỉ đua capability, mà đua cả kiến trúc để capability đó sống nổi ngoài đời.

🚨 Chốt một câu

Top AI Papers tuần này của DAIR.AI không chỉ là một list paper hay. Nó là snapshot rất rõ của AI năm 2026: open models đuổi frontier, agents học cách tự sửa mình, và hệ thống memory/RAG/deployment đang trở thành chiến trường thật. Nếu chỉ nhìn benchmark mà bỏ qua lớp plumbing, rất dễ hiểu sai nơi giá trị dài hạn đang tích tụ.

Nguồn & tham khảo

Đọc tiếp 12 Prompt NotebookLM Để Đọc Sách Xong Không Quên Sạch: Từ Tóm Ý Tới Action Plan

Xem tất cả bài viết

AI Papers DeepSeek V4 Autogenesis RAG AI Agents