Alibaba Qianwen ra mắt mô hình đa phương thức toàn diện Qwen3.5-Omni, hỗ trợ nhận dạng giọng nói 113 loại

Tin tức Gate News, ngày 30 tháng 3, Alibaba Qianwen thông báo ra mắt mô hình đa phương thức toàn năng Qwen3.5-Omni. Dòng sản phẩm này bao gồm các phiên bản Instruct với ba kích thước Plus, Flash và Light, hỗ trợ ngữ cảnh dài 256k. Mô hình hỗ trợ đầu vào âm thanh hơn 10 giờ và đầu vào âm video/video 720P (1FPS) dài hơn 400 giây. Mô hình được huấn luyện đa phương thức nguyên sinh trên khối lượng lớn dữ liệu văn bản, hình ảnh và dữ liệu âm video hơn 100 triệu giờ, thể hiện năng lực cảm nhận và tạo đa phương thức xuất sắc. So với thế hệ trước Qwen3-Omni, Qwen3.5-Omni có khả năng đa ngôn ngữ được nâng cao rõ rệt, có thể hỗ trợ nhận dạng giọng nói của 113 ngôn ngữ và phương ngữ, cũng như tạo giọng nói của 36 ngôn ngữ và phương ngữ.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận