HÀNG CHÂU, TRUNG QUỐC – Media OutReach Newswire – Ngày 20 tháng 5 năm 2025 – Alibaba vừa công bố nâng cấp toàn diện hệ sinh thái trí tuệ nhân tạo (AI) của mình, bao gồm cơ sở hạ tầng đám mây và dịch vụ mô hình, chip AI và các mô hình nền tảng – nhằm giúp khách hàng xây dựng, triển khai và mở rộng quy mô các tác nhân AI với hiệu quả, độ tin cậy và hiệu suất cao hơn.
Được giới thiệu tại Hội nghị Thượng đỉnh (Summit) Alibaba Cloud, Qwen3.7-Max là mô hình ngôn ngữ lớn mới nhất của Alibaba, được thiết kế cho lập trình tác nhân tiên tiến, suy luận phức tạp và thực thi tác vụ dài hạn. Qwen3.7-Max sẽ sớm có mặt cho các nhà phát triển và doanh nghiệp trên toàn thế giới.
Để đáp ứng nhu cầu ngày càng tăng về khối lượng công việc tính toán và AI trong kỷ nguyên tác nhân, Alibaba Cloud cũng đã nâng cấp cơ sở hạ tầng và dịch vụ mô hình của mình. Các sản phẩm ra mắt quan trọng bao gồm Máy chủ Siêu nút (Supernode Server) Panjiu AL128, được thiết kế để tăng cường khả năng suy luận tác nhân có thể mở rộng và huấn luyện mô hình quy mô lớn, cùng với bản cập nhật tối ưu hóa trong nền tảng dịch vụ mô hình của Alibaba, liên tục cải thiện hiệu suất mô hình.
Ngoài ra, T-Head, công ty con thiết kế bán dẫn của Alibaba, đã giới thiệu Zhenwu M890, bộ xử lý huấn luyện và suy luận AI mới nhất của mình, với bộ nhớ dung lượng cao, băng thông liên chip mạnh mẽ và hỗ trợ độ chính xác FP4 gốc.
Qwen 3.7-Max: Mô hình Nền tảng Đa năng cho kỷ nguyên tác nhân
Được thiết kế như một nền tảng mạnh mẽ cho các tác nhân AI, Qwen 3.7-Max xử lý liền mạch việc tạo và gỡ lỗi mã, tự động hóa quy trình làm việc văn phòng và các tác vụ đa bước phức tạp yêu cầu hàng trăm hoặc hàng nghìn thao tác.
Mô hình này cung cấp khả năng tác nhân vượt trội trên nhiều lĩnh vực khác nhau. Là một trợ lý lập trình cấp cao, nó hỗ trợ các tác vụ lập trình từ tạo mẫu giao diện người dùng nhanh chóng đến kỹ thuật phần mềm đa tệp phức tạp. Để nâng cao năng suất làm việc văn phòng, hệ thống này điều phối đáng tin cậy các quy trình làm việc đa tác nhân để xử lý các thao tác phức tạp. Đặc biệt, Qwen 3.7-Max có thể tự động thực hiện các tác vụ tác nhân dài hạn – duy trì hoạt động liên tục lên đến 35 giờ và quản lý hơn 1.000 lệnh gọi công cụ mà không làm giảm hiệu suất.
Được tối ưu hóa sâu cho các khung tác nhân hàng đầu bao gồm OpenClaw, Hermes Agent, Claude Code, Qwen Paw và Qoder, Qwen 3.7-Max đóng vai trò là xương sống đáng tin cậy cho các hệ thống tác nhân khác nhau. Mô hình đạt được kết quả hàng đầu trên các tiêu chuẩn chính về lập trình, tác nhân đa năng, khả năng tổng quát và đa ngôn ngữ, giúp nó cạnh tranh với các mô hình tiên tiến hàng đầu. Qwen 3.7-Max sẽ sớm được cung cấp thông qua nền tảng dịch vụ mô hình Model Studio của Alibaba dành cho các nhà phát triển trên toàn cầu.
Điện toán thông minh thế hệ tiếp theo và dịch vụ mô hình nâng cao
Để tăng cường khả năng suy luận tác nhân AI có thể mở rộng và đào tạo mô hình quy mô lớn, Alibaba Cloud đã ra mắt Máy chủ Siêu nút Panjiu AL128, được trang bị bộ xử lý AI Zhenwu M890 và chip mạng ICN Switch 1.0. Bằng cách tích hợp chặt chẽ 128 bộ tăng tốc AI trong một giá đỡ duy nhất, hệ thống cung cấp băng thông trên một giá đỡ duy nhất ở quy mô petabyte mỗi giây (PB/s), cải thiện đáng kể khả năng xử lý các yêu cầu đồng thời quy mô lớn từ các tác nhân.
Panjiu AL128 hiện đã có mặt trên Model Studio dành cho thị trường Trung Quốc (hay “Bailian”), cho phép các doanh nghiệp Trung Quốc giải quyết hiệu quả nhu cầu đào tạo và suy luận trên nhiều lĩnh vực.
Để tối ưu hóa hiệu suất, Bailian đã giới thiệu Agentic RL, một cơ chế học tăng cường được hỗ trợ bởi phản hồi thực thi của tác nhân, để thúc đẩy sự lặp lại mô hình liên tục. Bailian cũng có các khả năng quản trị an toàn tích hợp, đảm bảo rằng các tác nhân hoạt động tự động luôn nằm trong các giới hạn đã được xác định.
Chip và bộ phần mềm mới nhất của T-Head dành cho đào tạo và suy luận AI
Bộ tăng tốc AI mới nhất của T-Head, Zhenwu M890, mang lại hiệu suất gấp 3 lần so với Zhenwu 810E. Zhenwu M890 có 144 gigabyte (GB) bộ nhớ GPU và 800 GB mỗi giây. Chip này hỗ trợ nhiều định dạng độ chính xác dữ liệu, từ FP32 (số thực 32 bit) đến FP4 (số thực 4 bit), hỗ trợ cả huấn luyện mô hình độ chính xác cao và suy luận mô hình độ chính xác cực thấp.
Những khả năng này làm cho nó đặc biệt phù hợp với các khối lượng công việc AI phức tạp dựa trên tác nhân, đòi hỏi bộ nhớ làm việc lớn để lưu giữ ngữ cảnh, giao tiếp tốc độ cao để phối hợp đa tác nhân và tính toán độ chính xác thấp nhằm duy trì tốc độ thực thi nhanh chóng trong khi giảm chi phí. Chip được xây dựng trên kiến trúc điện toán song song độc quyền của T-Head và sử dụng giao thức kết nối ICN (Inter-Chip Network) tùy chỉnh của hãng.
Cùng với bộ tăng tốc, T-Head đã ra mắt ICN Switch 1.0, chip chuyển mạch chuyên dụng được thiết kế để tạo ra các mạng mở rộng băng thông cao, độ trễ thấp cho các cụm điện toán. Nó cung cấp băng thông tổng hợp lên đến 25,6 Tbps và đạt được độ trễ cực thấp và giao tiếp không bị tắc nghẽn.
Bằng cách kết hợp Zhenwu M890 với chip ICN Switch 1.0, T-Head cho phép kết nối băng thông đầy đủ giữa 64 bộ tăng tốc, giúp tăng đáng kể hiệu quả tính toán và độ ổn định của điện toán thông minh quy mô lớn. T-Head cũng ra mắt bộ phần mềm độc quyền của mình, T-Head SAIL™, để khai thác tối đa tiềm năng tính toán của các chip này.
T-Head đã đạt được sự chấp nhận rộng rãi trong công nghiệp đối với các chip AI độc quyền của mình, với hơn 560.000 đơn vị Zhenwu đã được giao đến nay. Hơn 400 khách hàng bên ngoài thuộc 20 ngành, lĩnh vực, bao gồm các nhà sản xuất ô tô và các công ty dịch vụ tài chính hàng đầu, đã triển khai các chip này để hỗ trợ các hoạt động thông minh.
Hashtag: #Alibaba
Nguồn phát hành hoàn toàn chịu trách nhiệm về nội dung của thông báo này
Thông tin về Alibaba Group
Là tập đoàn công nghệ tầm cỡ toàn cầu tập trung vào thương mại điện tử và điện toán đám mây, Alibaba Group hỗ trợ các nhà bán lẻ, thương hiệu và nhà cung cấp tiếp thị, bán hàng và tương tác với người tiêu dùng bằng cách cung cấp cơ sở hạ tầng kỹ thuật số và logistics, các công cụ hiệu quả và phạm vi tiếp thị rộng lớn. Alibaba Group trao quyền cho các doanh nghiệp với cơ sở hạ tầng đám mây hàng đầu, các dịch vụ và khả năng cộng tác để thúc đẩy quá trình chuyển đổi số và phát triển kinh doanh của họ.
Recent Comments