
[CNMO科技新闻]随着农历除夕的到来,阿里巴巴旗下的通义千问团队即将发布新一代开源大模型Qwen3.5。目前该模型系列的相关代码已提交至HuggingFace与GitHub仓库,标志着这一备受期待的AI技术即将正式面向全球开发者开放。

Qwen3.5在架构设计上实现了显著进化。它采用了全新的混合注意力机制(HybridAttention),将线性注意力与标准注意力相结合,从而在保持强大推理能力的同时,大幅提升了长文本和复杂任务的处理效率。
与前代模型相比,Qwen3.5是一款原生多模态模型。它能够直接理解并处理文本、图像、音频以及视频数据,无需依赖外部插件或子模型进行转换。初步透露的模型规格包括9B(90亿参数)指令微调版以及35B-A3B(基于MoE架构)的中型版本,后者在数学推理与编程能力上表现尤为出色。
当前的中国AI市场竞争已进入白热化阶段。除阿里外,DeepSeek计划推出其V4模型,字节跳动也在升级其豆包系列。行业分析人士认为,阿里选择在除夕夜这一关键节点开源Qwen3.5,旨在通过技术领先地位获取春节期间的流量峰值,并巩固其在全球开源社区的影响力。
广升网提示:文章来自网络,不代表本站观点。