1234.chat

1234.chat 1234.chat 1234.chat 1234.chat
  • 精品推荐
  • AI写作工具
  • AI图像工具
    • 常用AI图像工具
    • AI图片插画生成
    • AI图片背景移除
    • AI图片无损放大
    • AI图片优化修复
    • AI图片物体抹除
  • AI视频工具
  • AI办公工具
    • AI幻灯片和演示
    • AI表格数据处理
    • AI文档工具
    • AI思维导图
    • AI会议工具
    • AI效率提升
  • AI对话聊天
  • AI音频工具
  • AI编程工具
  • AI设计工具
  • AI内容检测
  • AI学习网站
  • AI开发框架
  • AI提示指令
  • AI训练模型
  • AI模型评测
1234.chat 1234.chat
  • 首页
    • AI写作工具
    • AI图像工具
    • AI视频工具
    • AI办公工具
    • AI对话聊天
    • AI音频工具
    • AI编程工具
    • AI设计工具
    • AI内容检测
    • AI学习网站
    • AI开发框架
    • AI提示指令
    • AI训练模型
    • AI模型评测
1234.chat 1234.chat
🔍

AI模型评测

Open LLM Leaderboard
Open LLM Leaderboard

Hugging Face推出的开源大模型排行榜单

MMLU
MMLU

大规模多任务语言理解基准

SuperCLUE
SuperCLUE

中文通用大模型综合性测评基准

H2O EvalGPT
H2O EvalGPT

H2O.ai推出的基于Elo评级方法的大模型评估系统

PubMedQA
PubMedQA

生物医学研究问答数据集和模型得分排行榜

FlagEval
FlagEval

智源研究院推出的FlagEval(天秤)大模型评测平台

LLMEval3
LLMEval3

由复旦大学NLP实验室推出的大模型评测基准

C-Eval
C-Eval

一个全面的中文基础模型评估套件

CMMLU
CMMLU

一个综合性的大模型中文评估基准

OpenCompass
OpenCompass

上海人工智能实验室推出的大模型开放评测体系

HELM
HELM

斯坦福大学推出的大模型评测体系

MMBench
MMBench

全方位的多模态大模型能力评测体系

Chatbot Arena
Chatbot Arena

以众包方式进行匿名随机对战的LLM基准平台

1
热门搜索 AI 工具 ChatGPT Midjourney AI 绘画 AI 写作
Copyright © 1234.chat. All Rights Reserved.
鄂ICP备2020019637号-2
1234.chat
汇聚全球 AI 工具,激发无限创意。