⚡ Tóm tắt nhanh
Alibaba Qwen vừa open source Qwen3.6-35B-A3B dưới giấy phép Apache 2.0. Điểm đáng chú ý không chỉ là kiến trúc sparse MoE 35B total, 3B active, mà là benchmark trên blog của họ cho thấy nó được đặt cạnh Qwen3.5-27B, Gemma 4 31B, Qwen3.5-35B-A3B, Gemma 4 26B-A4B ở phần coding/language, còn ở vision-language thì Qwen tự tin đem nó so trực tiếp với Claude Sonnet 4.5.
Post trên X của @Alibaba_Qwen khá ngắn, nhưng bài blog của họ thì nói rõ hơn nhiều: đây không phải một model open source kiểu “thêm cho đủ lineup”. Họ đang cố chứng minh rằng 3B active vẫn có thể đánh nhau sòng phẳng với các model to hơn ở những benchmark coding và multimodal thật sự.
Nói kiểu đời thường: Qwen vừa ném ra một con model bảo rằng “tôi không cần bật cả khối tham số khổng lồ, nhưng vẫn đủ sức đấu với Qwen3.5-27B, Gemma 4 31B và ở vision-language còn dám đứng cùng mâm với Claude Sonnet 4.5”. Nếu benchmark của họ đứng được, đây là cú chọc khá đau vào cả thị trường open model lẫn lớp model API thương mại đắt tiền hơn.
35B total nhưng chỉ 3B active mới là phần đáng tiền
Qwen3.6-35B-A3B là một model sparse MoE. Nghĩa là tổng hệ thống có 35B parameters, nhưng mỗi lượt suy luận chỉ kích hoạt khoảng 3B.
Đây mới là chỗ đáng nói. Vì trong thực chiến, người dùng không sống bằng “tổng tham số nghe oách”, mà sống bằng:
- độ nhanh,
- chi phí chạy,
- khả năng deploy,
- và hiệu năng trên task thật.
Nói ngắn gọn: Qwen đang cố đẩy narrative từ model càng to càng ngon sang model dùng ít hơn nhưng làm được việc hơn.
Ở phần coding, blog gốc benchmark nó với ai?
Trong phần Language, bài blog của họ đặt Qwen3.6-35B-A3B cạnh:
- Qwen3.5-27B
- Gemma 4 31B
- Qwen3.5-35B-A3B
- Gemma 4 26B-A4B
Và lời claim của họ cũng rất cụ thể: model mới vượt xa Qwen3.5-35B-A3B, đồng thời đủ sức cạnh tranh với các dense model lớn hơn như Qwen3.5-27B và Gemma 4 31B trên nhiều benchmark coding và reasoning.
Nhìn vào bảng điểm trong blog, Qwen3.6-35B-A3B đặc biệt nổi bật ở các benchmark như Terminal-Bench 2.0, Claw-Eval Avg, SkillsBench Avg5, NL2Repo và QwenWebBench. Không phải chỗ nào nó cũng thắng tuyệt đối, nhưng narrative tổng thể của blog là rất rõ: nó vượt bản cũ rất mạnh và đủ sức đánh nhau với mấy con dense model to hơn.
✅ Vì sao bài này đáng chú ý
- Hiệu quả tính toán: 3B active là con số nghe rất khác so với những model cứ phải lôi cả khối lớn ra chạy.
- Benchmark rõ ràng hơn post X: blog gốc chỉ đích danh đối thủ so sánh, chứ không nói mơ hồ.
- Apache 2.0: giấy phép này khiến model dễ được nhét vào sản phẩm và workflow thương mại hơn nhiều.
Phần vision-language mới là chỗ Qwen chơi to hơn mình tưởng
Post X chỉ nói model có multimodal perception and reasoning ability. Nhưng bài blog của họ đi xa hơn nhiều: ở phần Vision Language, Qwen so model này trực tiếp với:
- Qwen3.5-27B
- Claude Sonnet 4.5
- Gemma 4 31B
- Gemma 4 26B-A4B
- Qwen3.5-35B-A3B
Và chính bài blog này viết khá thẳng: trên đa số benchmark vision-language, hiệu năng của Qwen3.6-35B-A3B match Claude Sonnet 4.5, thậm chí có vài task còn vượt. Đây mới là phần khiến model này bớt bị nhìn như một con chỉ biết code.
Nói ngắn gọn: Qwen không chỉ cố chứng minh rằng model này rẻ hơn khi chạy coding agent. Họ còn muốn nó được nhìn như một multimodal open model đủ toàn diện để bước vào nhiều workflow thật.
Điểm mạnh thật sự có thể nằm ở licensing chứ không chỉ benchmark
Apache 2.0 nghe không sexy bằng benchmark, nhưng lại là phần rất đáng tiền.
Vì khi một model open source đi kèm license đủ rộng, nó mở ra mấy chuyện rất thực tế:
- công ty dễ đem vào sản phẩm nội bộ hơn,
- đội kỹ thuật dễ thử fine-tune / serve / tối ưu hơn,
- và cộng đồng dễ build tooling quanh nó hơn.
Nói thẳng: nhiều model mạnh nhưng license lằng nhằng thì cuối cùng vẫn bị loại khỏi bàn làm việc thật. Apache 2.0 giúp Qwen tự mở thêm cửa cho chính mình.
⚠️ Nhưng vẫn đừng nuốt claim nguyên cục
Giờ câu hỏi đúng không còn là “Qwen có nói hay không”, mà là: các benchmark này phản ánh use case ngoài đời tới đâu, harness có công bằng không, và độ ổn định khi nhét model vào workflow agent dài hơi ra sao. Open source model hay chết ở chỗ bảng điểm đẹp nhưng production mệt.
Kết luận
Cách nhìn đúng về Qwen3.6-35B-A3B không phải là “lại thêm một model open source nữa”. Cách nhìn đúng hơn là:
Qwen đang thử chứng minh rằng một model chỉ 3B active vẫn có thể vượt mạnh bản cũ, đấu với Qwen3.5-27B và Gemma 4 31B ở coding, rồi còn bám sát Claude Sonnet 4.5 ở vision-language.
Nếu benchmark của họ đứng vững trong thực chiến, đây sẽ là kiểu model rất đáng gờm: không cần to nhất, không cần marketing ồn ào nhất, nhưng lại rất dễ trở thành lựa chọn cực khó chịu trong thế giới agent và AI app thực dụng.
Source: Blog từ Qwen · Post trên X