TL;DR
Ant Group ra mắt Ring-2.6-1T — model 1 nghìn tỷ tham số mở nguồn với 3 chế độ suy nghĩ điều chỉnh, tối ưu cho agent workflow, và benchmark vượt GPT-5.4 trên PinchBench. Miễn phí thử đến 15/5 trên OpenRouter. Nhưng cộng đồng tranh cãi: đây có thực sự là "đầu tiên" không?
Ant Group vừa ra mắt Ring-2.6-1T — model suy nghĩ flagship 1 nghìn tỷ tham số, mở nguồn, thiết kế cho tác vụ phức tạp thực tế và môi trường sản xuất. Điểm gây chú ý nhất: 3 chế độ suy nghĩ điều chỉnh cho phép người dùng cân bằng độ sâu nhận thức, chi phí token, và tốc độ thực thi.
🧠 3 Chế Độ Suy Nghĩ: Điểm Khác Biệt Thực Sự
Không phải 1 nghìn tỷ tham số — điều đã có từ Deepseek v4 Pro (1.6T) và Kimi K2.6 (1T). Điểm Ring-2.6-1T tạo ra sự khác biệt là cơ chế suy nghĩ điều chỉnh động:
🎯 "High" — Tối Ưu Agent
Thiết kế cho workflow tần suất cao: điều phối công cụ nhanh, thực thi đa bước, và ổn định cho agent. Benchmark trên PinchBench: 87.60 — vượt GPT-5.4 xHigh và Gemini-3.1-Pro high. ClawEval: 63.82. Tau2-Bench Telecom: 95.32.
🧮 "xHigh" — Suy Nghĩ Sâu
Mở khóa khả năng tối đa cho logic toán học nghiêm ngặt và nghiên cứu khoa học. AIME 26: 95.83. GPQA Diamond: 88.27. ARC-AGI-V2: 77.78.
⚡ Điều Chỉnh Động
Chuyển đổi giữa các chế độ linh hoạt theo tác vụ: chuyển đổi định dạng cần ít tài nguyên hơn olympiad toán. Điều này biến chi phí suy luận từ "lựa chọn model" thành "cờ cấu hình" — bạn dùng cùng một model, chỉ điều chỉnh mức độ suy nghĩ.
📊 So Sánh Benchmark
Ring-2.6-1T khoe số liệu ấn tượng:
- PinchBench: 87.60 (vượt GPT-5.4 xHigh & Gemini-3.1-Pro high)
- AIME 26: 95.83
- GPQA Diamond: 88.27
- ARC-AGI-V2: 77.78
Nhưng benchmark chỉ là benchmark. @GodsBoy7777 lưu ý: "Tôi thấy nó so sánh với GPT 5.4 xHigh chứ không phải GPT 5.5." Điểm nhỏ nhưng quan trọng khi đọc số liệu.
💬 Tranh Cãi: "Đầu Tiên" Hay Không?
Khi @TeksEdge gọi đây là "world's first 1T parameter open source model", cộng đồng phản ứng ngay:
@n_hispanophile làm rõ: "Ant Ling thực sự là công ty đầu tiên làm model mở nguồn 1 nghìn tỷ tham số. Model này không phải vậy. Ling-1T và Ring-1T đã có."
Vậy sự thật: Ant Group đã có model 1T mở nguồn trước đó (Ling-1T, Ring-1T). Ring-2.6-1T là phiên bản mới, không phải "đầu tiên".
⚠️ Chỗ Cần Tỉnh Táo
🧪 Test Thực Tế Khác Benchmark
@nest_elf test và phát hiện: "ở chế độ high nó vượt qua bài kiểm tra rửa xe nhưng ở medium thì không. Nghĩa là nó không được benchmaxed." Đây là dấu hiệu model có thể được tối ưu quá mức cho benchmark cụ thể thay vì khả năng tổng quát.
@FarRider thử nghiệm thực tế: "Tôi hỏi một câu đơn giản: API thay đổi giữa phiên bản X và Y như thế nào? Nó hallucinate mọi thứ dù có quyền truy cập công cụ cần thiết. Có lẽ nó cần harness để hoạt động."
🎯 Tham Số Là "Flex", Nhưng Giá Trị Thực Ở Đâu?
🚀 Cơ Hội Dùng Thử
Ring-2.6-1T đang miễn phí thử đến 15/5 trên OpenRouter thông qua Novita. Trọng số mở nguồn sắp phát hành. Đây là cơ hội test trực tiếp trước khi đánh giá.
🎯 Chốt Một Câu
Ring-2.6-1T không phải "đầu tiên" 1 nghìn tỷ tham số mở nguồn — nhưng nó có thể là model 1 nghìn tỷ tham số đầu tiên cho phép bạn điều chỉnh chi phí suy luận như điều chỉnh độ sáng màn hình: cùng một model, cùng một API, chỉ thay đổi mức độ suy nghĩ. Điểm đó — nếu hoạt động đúng như lời giới thiệu — mới là điểm đáng chú ý thực sự.