IT之家 9 月 11 日音书,科技媒体 The Decoder 昨日(9 月 10 日)报说念,对比平台 Artificial Analysis 相关数据标明母子淫荡网,Reflection 70B AI 模子在基准测试中的发达,本色上不足 Meta 的 LLaMA-3.1-70B。
针对 AI 模子基准测试效果欠安,Reflection 公司首席实施官马特・舒默(Matt Shumer)示意,上传模子权重至 Hugging Face 时碰到问题,所使用的权重是多个不同模子的羼杂体,而他们里面托管的模子则显泄露更佳的效果。
舒默随后向部分用户提供了独家看望里面模子的权限,Artificial Analysis 重作念了测试,并评释效果优于公开 API,仅仅他们无法证实所看望的具体是哪个模子。
推特 拳交Reflection 在 Hugging Face 已上传了新的模子母子淫荡网,不外这些模子在测试中的发达彰着逊于之前通过独到 API 提供的模子。
IT之家查询公开辛苦,有效户还发现了笔据,标明 Reflection API 未必会调用 Anthropic Claude 3.5 Sonnet 以及 OpenAI。
舒默旗下公司 OthersideAI 此前已晓喻忖度打算于本周发布一款基于 LLaMA 3.1 450B 的更大、更远大的模子。
舒默对这一行将发布的版块作念出了果敢声明,称其不仅将成为最好的开源模子,还将是有史以来最优秀的话语模子。
官方恢复:
相关阅读:
《开源大模子新王 Reflection 70B 卓绝 GPT-4o:新时刻可更正我方幻觉,数学 99.2 分刷爆测试集》
告白声明:文内含有的对外跳转贯穿(包括不限于超贯穿、二维码、口令等神志),用于传递更多信息母子淫荡网,省俭甄选时间,效果仅供参考,IT之家悉数著述均包含本声明。