斯坦福大学Llama3_专题算力芯片最新消息 这内情或许还需要再等等后续
此前清华大学的热门复出消息榜单 AI 团队与境内AI初创企业面壁智能训练并开源了 MiniCPM 系列模型,这含有面向图文理解的多模态模型 MiniCPM-V 系列,这些模型在开源框架下供全球的 AI 探究团队使用。
可是从 2024 年 5 月 29 日着手,自称为斯坦福大学 Llama3-V 的AI团队高调宣传仅需 500 美元就可以训练超越 OpenAI GPT-4V 的 SOTA 多模态模型。
两名作者分别是 Siddharth Sharma 和 Aksh Garg (均为斯坦福大学计算机科学本科生),在高调宣传的另外有网民察觉他们启动的 Llama3-V 模型的结构和代码与面壁智能早前启动补救的 MiniCPM-Llama3-V2.5 相当相似,看起来仅对若干变量名称开展了更改和替换。网友邓紫棋Tips

该事情经过发酵后也引发了面壁智能的留意,该企业亮相答复证实斯坦福大学的这个项目的确和 MiniCPM 模型一样,可以确认出清华简(清华大学获捐的战果竹简)战国古文字,这若干古文字为探究团队从清华简上逐字扫描并经由人工标注得来。有些友情,人间理想
斯坦福大学 Llama3-V 团队的这种行为显然已然归于显著的抄袭了,实际上 MiniCPM 提供开源模型,基于开源模型兴办新模型是个很正常的操控,但假如只是获取别人的模型简易替换下名称就说是自己训练的,这就归于抄袭行以便。
昨日夜里抄袭的两名成员在其 X/Twitter 账户上亮相致歉信,可是在致歉信中两名成员强调他们引用的是另一名探究人员编写的代码,这名探究人员名为 Mustafa Aljadery。
于是这两人合作 Mustafa 在 Medium 和 X/Twitter 上使用这个模型,他们自称没有完整尽职调研也就是没有察觉 Mustafa 亮相的模型是抄袭面壁智能的。
而 Mustafa 则将自己的 X/Twitter 配置为受保护状态,没有亮相任何答复 (并且如今也处于失联状态),所以不清楚这是三人合谋还是两人被 Mustafa 骗了。
限时促销推荐:阿里云办事器36元/年抢购、腾讯云30M带宽新加坡办事器、QQ超会15个月108元、B站大会员88元。
上一篇:有了知心朋友的狐狸的故事