母子淫荡网 Reflection 70B AI 模子“塌房”：第三方基准测试效果欠安，不如 LLaMA-3.1-70B

发布日期：2024-09-25 22:18 点击次数：161

母子淫荡网 Reflection 70B AI 模子“塌房”：第三方基准测试效果欠安，不如 LLaMA-3.1-70B

IT之家 9 月 11 日音书，科技媒体 The Decoder 昨日（9 月 10 日）报说念，对比平台 Artificial Analysis 相关数据标明母子淫荡网，Reflection 70B AI 模子在基准测试中的发达，本色上不足 Meta 的 LLaMA-3.1-70B。

Reflection 70B AI 模子“塌房”：第三方基准测试效果欠安，不如 LLaMA-3.1-70B

针对 AI 模子基准测试效果欠安，Reflection 公司首席实施官马特・舒默（Matt Shumer）示意，上传模子权重至 Hugging Face 时碰到问题，所使用的权重是多个不同模子的羼杂体，而他们里面托管的模子则显泄露更佳的效果。

舒默随后向部分用户提供了独家看望里面模子的权限，Artificial Analysis 重作念了测试，并评释效果优于公开 API，仅仅他们无法证实所看望的具体是哪个模子。

Reflection 70B AI 模子“塌房”：第三方基准测试效果欠安，不如 LLaMA-3.1-70B

Reflection 在 Hugging Face 已上传了新的模子母子淫荡网，不外这些模子在测试中的发达彰着逊于之前通过独到 API 提供的模子。

IT之家查询公开辛苦，有效户还发现了笔据，标明 Reflection API 未必会调用 Anthropic Claude 3.5 Sonnet 以及 OpenAI。

Reflection 70B AI 模子“塌房”：第三方基准测试效果欠安，不如 LLaMA-3.1-70B

舒默旗下公司 OthersideAI 此前已晓喻忖度打算于本周发布一款基于 LLaMA 3.1 450B 的更大、更远大的模子。

舒默对这一行将发布的版块作念出了果敢声明，称其不仅将成为最好的开源模子，还将是有史以来最优秀的话语模子。

官方恢复：

Reflection 70B AI 模子“塌房”：第三方基准测试效果欠安，不如 LLaMA-3.1-70B