SuperCLUE中文大模型评测基准最新排名发布

来源:界面新闻 时间:2023-08-29 20:32:52


【资料图】

8月28日,国内发起的大模型榜单SuperCLUE发布中文大模型8月榜单。8月榜单由5部分组成:总排行榜、OPEN多轮开放问题排行榜、OPT三大能力客观题排行榜、十大基础能力排行榜、开源排行榜。

据悉,本次8月评测选取了目前国内外最具代表性的16个通用大语言模型,评测数据集为全新的3337道测试题。评测结果发现:

1. 国内大模型在中文任务上的表现与GPT3.5仍有一定距离,但差距在持续缩小。

2. 开源模型竞争力有进一步提升

SuperCLUE发布的8月总排行榜结果如下,Baichuan-13B在本次评测中位列国内大模型榜首。

关键词:

  
  • 未满19岁的人贩子惊呆网友 拐卖团体年轻化值得社会深思

    未满19岁的人贩子惊呆网友 拐卖团体年轻化值得社会深思
  • 315曝光现榨果汁引发关注 食品行业卫生漏洞还须及时补上

    315曝光现榨果汁引发关注 食品行业卫生漏洞还须及时补上
  • 达达去年增收不增利受关注 净亏损额为24.711亿

    达达去年增收不增利受关注 净亏损额为24.711亿