正文内容 评论(0)
微软紧急撤回最先进的AI大模型:居然忘了测试了
快科技4月21日消息,Meta发布超级彪悍的大语言模型Llama 3之后,微软也很快推出了自己的新一代WizardLM2 8x22B,号称迄今最强大,完全超越Claude 3 Opus&Sonnet、GPT-4等竞品,而且开源,但是马上又把它撤回去了。
没有任何征兆,微软就删除了WizardLM2大模型的相关文件、代码,而且一直没有任何公开解释。
微软的一位工程师单独给出了原因,令人啼笑皆非。
原来,微软已经几个月没有发布新的大模型,对上新流程有些陌生,居然忘了必需的幻觉测试(toxicity test),目前正在抓紧补测,很快就会重新上线。
大语言模型的“幻觉”分为两种,一是事实性幻觉,指模型生成的内容与可验证的现实世界事实不一致,二是忠实性幻觉,指模型生成的内容与用户的指令或上下文不一致。
大模型幻觉产生的原因有很多,训练数据、预训练和对齐阶段、推理阶段都会出现缺陷。
这么重要的测试都能忘掉,微软真是……
- 热门文章
- 换一波
- 127元追加9倍投注彩票中1.11亿 中奖者:我下班顺路买的
- 2弹丸小国贡献NV 28%收入 但只收到1%芯片!美国怀疑中国
- 3超频狂飙3.3GHz!RTX 5070 Ti首发评测:提升30% 追平4080
- 4一图看懂iPhone 16e和iPhone 16该买谁:差价1500差在哪了
- 5真的干掉了桌面RTX 4060!AMD史上最强集显首测
- 6地球将变回终极盘古大陆!超级计算机算出人类灭绝时间
- 7NV平替!国产游戏第一卡性能暴增120%:和西方还有多大差距
- 8信号烂有救!iPhone基带、Wi-Fi芯片都要换了
- 94499元起 iPhone 16e内存尘埃落定
- 10AMD又发布中国特供新U!但只是改个名而已
- 好物推荐
- 换一波
-
-
21金维他钙铁锌咀嚼片30粒*2瓶到手17.9元(大差价速囤)
2025-02-21 2 -
GB/T 19266标准:五稻田五常大米10斤39.9元(70元大额券)
2025-02-17 3
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...