HÀNG CHÂU, TRUNG QUỐC – Media OutReach Newswire – Ngày 29 tháng 4 năm 2025 – Alibaba đã ra mắt Qwen3 – thế hệ mới nhất của dòng mô hình ngôn ngữ lớn (large language model – LLM) nguồn mở, thiết lập chuẩn mực mới cho đổi mới trí tuệ nhân tạo (AI).

Dòng Qwen3 có 6 mô hình dày đặc và 2 mô hình Hỗn hợp chuyên gia (Mixture-of-Experts: MoE), mang đến cho các nhà phát triển sự linh hoạt để xây dựng các ứng dụng thế hệ tiếp theo trên các thiết bị di động, kính thông minh, xe tự hành, robot…

Tất cả các mô hình Qwen3 – bao gồm các mô hình dày đặc (tham số 0,6B; 1,7B; 4;, 8B; 14B và 32B) và các mô hình MoE (30B với 3B hoạt động và 235B với 22B hoạt động) – hiện đều là mã nguồn mở và có sẵn trên toàn cầu.

Lý luận lai (Hybrid Reasoning) ghép kết hợp chế độ suy nghĩ và không suy nghĩ

Qwen3 đánh dấu sự ra mắt của Alibaba về các mô hình lý luận lai, kết hợp các khả năng LLM truyền thống với lý luận động tiên tiến. Các mô hình Qwen3 có thể chuyển đổi liền mạch giữa chế độ suy nghĩ cho các tác vụ phức tạp, nhiều bước như toán học, mã hóa và suy luận logic và chế độ không suy nghĩ cho các phản hồi nhanh, có mục đích chung.

Đối với các nhà phát triển truy cập Qwen3 thông qua giao diện lập trình ứng dụng (Application Programming Interface – API), mô hình cung cấp khả năng kiểm soát chi tiết đối với thời lượng suy nghĩ (lên đến 38K mã thông báo – token), cho phép cân bằng tối ưu giữa hiệu suất thông minh và hiệu quả tính toán. Đáng chú ý là, mô hình Qwen3-235B-A22B MoE giúp giảm đáng kể chi phí triển khai so với các mô hình tiên tiến khác, củng cố cam kết của Alibaba đối với AI có hiệu suất cao và dễ tiếp cận.

Những đột phá trong Kỹ năng đa ngôn ngữ, Khả năng của tác nhân, Lý luận và Sự liên kết của con người

Được đào tạo trên bộ dữ liệu khổng lồ gồm 36.000 tỷ token – gấp đôi so với phiên bản tiền nhiệm Qwen2.5, Qwen3 mang đến những tiến bộ đáng kể về lý luận, hướng dẫn làm theo, sử dụng công cụ và các tác vụ đa ngôn ngữ.

Các khả năng chính bao gồm:

Thành thạo đa ngôn ngữ: Hỗ trợ 119 ngôn ngữ và phương ngữ, với hiệu suất hàng đầu trong việc biên dịch và hướng dẫn đa ngôn ngữ.

Tích hợp tác nhân nâng cao: Hỗ trợ Giao thức ngữ cảnh mô hình (Model Context Protocol – MCP) và chức năng gọi hàm mạnh mẽ, dẫn đầu các mô hình nguồn mở trong các tác vụ phức tạp dựa trên tác nhân.

Lý luận vượt trội: Vượt trội hơn các mô hình Qwen trước đây (QwQ ở chế độ suy nghĩ và Qwen2.5 ở chế độ không suy nghĩ) về toán học, mã hóa và các chuẩn mực lý luận logic.

Cải thiện sự liên kết của con người: Mang lại trải nghiệm viết sáng tạo, nhập vai và đối thoại nhiều chiều tự nhiên hơn để có những cuộc trò chuyện tự nhiên và hấp dẫn hơn.

Qwen3 models achieve top-tier results across industry benchmarks

Nhờ những tiến bộ trong kiến ​​trúc mô hình, tăng dữ liệu đào tạo và các phương pháp đào tạo hiệu quả hơn, các mô hình Qwen3 đạt được kết quả hàng đầu trên các chuẩn mực của ngành như AIME25 (lập luận toán học), LiveCodeBench (trình độ lập trình), BFCL (khả năng gọi công cụ và hàm) và Arena-Hard (chuẩn mực cho LLM được điều chỉnh theo hướng dẫn). Ngoài ra, để phát triển mô hình lập luận lai, một quy trình đào tạo 4 giai đoạn đã được triển khai, bao gồm khởi động lạnh chuỗi suy nghĩ dài (chain-of-thought: CoT), học tăng cường (reinforcement learning – RL) dựa trên lập luận, hợp nhất chế độ tư duy và học tăng cường (RL) chung.

Truy cập mở để thúc đẩy đổi mới

Các mô hình Qwen3 hiện có sẵn miễn phí để tải xuống trên Hugging FaceGitHub và ModelScope và có thể được khám phá trên chat.qwen.ai. Quyền truy cập giao diện lập trình ứng dụng (API) sẽ sớm khả dụng thông qua Model Studio – nền tảng phát triển mô hình AI của Alibaba. Qwen3 cũng hỗ trợ Quark – ứng dụng trợ lý siêu AI hàng đầu của Alibaba.

Kể từ khi ra mắt đến nay, gia đình mô hình Qwen đã thu hút hơn 300 triệu lượt tải xuống trên toàn thế giới. Các nhà phát triển đã tạo ra hơn 100.000 mô hình phái sinh dựa trên Qwen trên Hugging Face, biến Qwen trở thành một trong những chuỗi mô hình AI nguồn mở được áp dụng rộng rãi nhất trên thế giới.

Hashtag: #AlibabaCloud

Nguồn phát hành hoàn toàn chịu trách nhiệm về nội dung của thông báo này.

Thông tin về Alibaba Group

Sứ mệnh của Alibaba Group là giúp việc kinh doanh trở nên dễ dàng ở bất cứ đâu. Công ty hướng đến mục tiêu xây dựng cơ sở hạ tầng thương mại trong tương lai. Công ty hình dung rằng, khách hàng của mình sẽ gặp gỡ, làm việc và sinh sống tại Alibaba, và rằng đây sẽ là một công ty tốt tồn tại trong 102 năm. www.alibabagroup.com