«12 3 »Pages: 1/3 Go

复制链接 | 浏览器收藏 | 打印

yangzheng

级别: 九级会员

作者资料发送短消息

UID: 1018996
精华: 0
发帖: 2594
威望: 1000 点
金钱: 201900 RMB
贡献值: 296 点
注册时间: 2019-10-01
最后登录: 2025-07-08

0楼发表于: 9小时前

只看楼主 | 小中大

华为盘古团队否认AI模型抄袭阿里通义千问

华为人工智能研究部门驳斥了网络上有关其盘古大语言模型抄袭阿里巴巴模型的指控，
称其为自主研发并独立训练的模型。

综合快科技和澎湃新闻报道，
开源平台GitHub一项研究称，
华为盘古大模型与阿里通义千问Qwen-2.5 14B模型在注意力参数分布上有相关性，超正常范围。

这项研究称，
这种相似性表明华为的模型可能是“再加工”（upcycling）而来，
而非从头训练而成。
该指控在人工智能圈子和中文科技媒体中引发广泛讨论。

针对质疑，
华为诺亚方舟实验室星期六（7月5日）发布声明称，
盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型，
并非基于其他厂商模型增量训练而来。

盘古团队在声明中称，
盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践，
涉及其他开源大模型的部分开源代码。
盘古团队严格遵循开源许可证的要求，
在开源代码文件中清晰标注开源代码的版权声明。

路透社报道指出，
华为早在2021年就推出初代盘古模型，
较早进入大模型领域，
但其后一直被外界视为在这一赛道上落后于竞争对手。
今年6月底，华为将“盘古Pro Moe”模型开源，
发布在中国开发者平台GitCode上，
意在通过免费开放加快AI技术的推广与应用。

相较而言，阿里的“通义千问”更偏向面向消费者市场，
具有类似ChatGPT的聊天功能；
而华为的盘古系列则更多应用于政务、金融、制造等行业场景。