
分类:
开发运营: 阿里巴巴集团旗下
收录时间: 2026-01-26
本站浏览: 256709 次
功能简介: 大规模语言模型

扫码体验
通义千问(Qwen)是由中国科技企业阿里巴巴集团旗下的通义实验室自主研发的大规模语言模型。自2023年首次发布以来,该模型已持续迭代多个版本,并逐步构建起覆盖不同应用场景的模型体系,在学术界与产业界均获得广泛关注。
- 多版本演进:通义千问已推出包括 Qwen、Qwen1.5、Qwen2、Qwen2.5、Qwen3 等多个主干版本,并衍生出针对特定任务优化的子模型,如专注于代码生成的 Qwen-Coder、支持图文理解的 Qwen-VL,以及适用于不同推理成本需求的 Qwen-Max、Qwen-Plus 和 Qwen-Turbo。
- 性能表现:在多项国际主流评测基准中(如 MMLU、GSM8K、HumanEval、BBH 等),通义千问在中文任务上表现优异,部分版本在综合能力上接近或达到国际领先水平。
- 多语言支持:除中文外,模型支持英语、法语、西班牙语、俄语、阿拉伯语、日语、韩语等数十种语言,具备一定的跨语言交互能力。
通义千问采取较为开放的策略。多个版本(如 Qwen、Qwen2、Qwen3)已在 ModelScope(魔搭)和 Hugging Face 平台以 Apache 2.0 等宽松开源许可证发布模型权重与推理代码,允许学术研究和商业应用。此举显著促进了中文大模型社区的发展,并被广泛用于教育、科研及企业创新项目中。
该模型已被深度集成至阿里巴巴集团的多个核心产品和服务中,包括:
- 智能客服系统
- 办公协同平台“钉钉”的AI助手
- 阿里云“百炼”大模型开发平台
- 电商、金融、物流等内部业务的自动化与智能化模块
同时,阿里云面向外部开发者和企业客户提供 Qwen 系列模型的 API 接口与定制化部署方案,支持私有化落地。
通义千问的设计强调符合中国法律法规,内置内容安全过滤机制,对涉及政治、暴力、色情、虚假信息等敏感话题通常采取回避、拒绝生成或提供中性回应的策略。这一特性使其更适用于对合规性要求较高的政企场景。
作为中国自主研发的大模型代表之一,通义千问在技术能力、工程落地、开源生态和合规适配等方面展现出较强的综合实力。其持续迭代与广泛应用,不仅反映了阿里巴巴在通用人工智能领域的长期投入,也体现了中国在大模型技术竞争中的重要进展。
川公网安备51172402000187号 蜀ICP备2026003041号-1