微软又把openai的机密泄露了??在论文中明晃晃写着:
英伟达2024年初发布b200时,就摊牌了 gpt-4 是1.8t moe也就是1800b,这里微软的数字更精确,为 1.76t 。
除此之外,论文中给openai的mini系列,claude3.5 sonnet也都附上了参数,总结如下:
虽然论文中后面也有免责声明:
但还是有不少人觉得事情没这么简单。
比如为什么唯独没有放谷歌gemini模型的参数估计?或许他们对放出来的数字还是有信心的。
也有人认为,大多数模型都是在英伟达gpu上运行的,所以可以通过token生成速度来估计。
只有谷歌模型是在tpu上运行的,所以不好估计。
而且微软也不是第一次干这事了。
23年10月,微软就在一篇论文里“意外”曝出gpt-3.5-turbo模型的20b参数,在后续论文版本中又删除了这一信息。
就说你是故意的还是不小心的?
微软这篇论文说了什么
实际上,原论文介绍了一项 与医学相关 的benchmark——medec。
12月26日就已经发布,不过是比较垂直领域的论文,可能非相关方向的人都不会看,年后才被列文虎克网友们发现。
研究起因是,据美国医疗机构调查显示,有1/5的患者在阅读临床笔记时报告发现了错误,而40%的患者认为这些错误可能影响他们的治疗。
而且另一方面,llms(大语言模型)被越来越多的用于医学文档任务(如生成诊疗方法)。
因此,medec此番有两个任务。一是识别并发现临床笔记中的错误;二是还能予以改正。
为了进行研究,medec数据集包含3848份临床文本,其中包括来自三个美国医院系统的488份临床笔记,这些笔记之前未被任何llm见过。
它涵盖五种类型的错误(诊断、管理、治疗、药物治疗和致病因子),这些错误类型是通过分析医学委员会考试中最常见的问题类型选择的,并由8位医疗人员参与错误标注。
而参数泄露即发生在 实验环节 。
按照实验设计,研究者将选取近期主流的大模型和小模型来参与笔记识别和纠错。
而就在介绍最终选定的模型时,模型参数、发布时间一下子都被公开了。
对了,省去中间过程,这项研究得出的结论是:claude 3.5 sonnet在错误标志检测方面优于其他llm方法,得分为70.16,第二名是o1-mini。
网友:按价格算合理
每一次,chatgpt相关模型架构和参数泄露,都会引起轩然大波,这次也不例外。
23年10月,微软论文声称gpt-3.5-turbo只有20b参数的时候,就有人感叹:难怪openai对开源模型这么紧张。
24年3月,英伟达确认gpt-4是1.8t moe,而2000张b200可以在90天内完成训练的时候,大家觉得moe已经且仍将是大模型架构趋势。
这一次,基于微软估计的数据,网友们主要有几个关注点:
如果claude 3.5 sonnet真的比gpt-4o还小, 那anthropic团队就拥有技术优势。
以及不相信gpt-4o-mini只有8b这么小。
不过此前也有人根据推理成本来算,4o-mini的价格是3.5-turbo的40%,如果3.5-turbo的20b数字准确,那么4o-mini刚好是8b左右。
不过这里的8b也是指moe模型的激活参数。
总之,openai大概是不会公布确切数字了。
此前奥特曼征集2024年新年愿望,最后公布的清单中还有“开源”。2025年的最新版本里,开源已经被去掉了。
论文地址: https://arxiv.org/pdf/2412.19260
好粗好大好想要操死我们 | 1天前 |
多毛复古 |
大美女?100%露出奶头 | 4天前 |
日韩高清不卡在线翻放视频 |
欧美性爱黄网站 | 5天前 |
凸轮美女射精 |
动漫美女被羞羞得到内射黄 | 4天前 |
黑人美女3d屁眼 |
美眉的禁处 | 8天前 |
体育生翘臀公0被猛攻gαy片 |
裸乳玛丽 | 9天前 |
欧美肥老太牲交 |
男生把小鸡鸡插进美女屁股里的视频 | 5天前 |
国产一线a无码免费 |
黑人巨根潮喷射 | 9天前 |
wwx乂曾交太 |
大山雀射精少妇性爱 | 7天前 |
jizz中国jizz中文版 |
jk美女自慰theporn91 | 0天前 |
社长秘书电影在线免费播放 |