首页
排行榜
在线智能工具
个人书签工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
AI模型评测
共 14 篇网址
排序
发布
更新
浏览
点赞
收藏
随机
AGI-Eval
AGI-Eval是什么 AGI-Eval是上海交通大学、同济...
0
2.4K
0
AI模型评测
# AI模型评测
MMLU
MMLU 全称 Massive Multitask Lang...
0
19.8K
0
AI模型评测
# AI模型评测
Open LLM Leaderboard
Open LLM Leaderboard 是最大的大模型和数...
0
21.7K
0
AI模型评测
# AI模型评测
C-Eval
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件...
0
3.9K
0
AI模型评测
# AI模型评测
FlagEval
FlagEval(天秤)由智源研究院将联合多个高校团队打造...
0
4.2K
0
AI模型评测
# AI模型评测
SuperCLUE
SuperCLUE 是一个中文通用大模型综合性评测基准,从三...
0
8.4K
0
AI模型评测
# AI模型评测
OpenCompass
OpenCompass是由上海人工智能实验室(上海AI实验室...
0
4.7K
0
AI模型评测
# AI模型评测
CMMLU
CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在...
0
6K
0
AI模型评测
# AI模型评测
MMBench
MMBench是一个多模态基准测试,由上海人工智能实验室、南...
0
4.9K
0
AI模型评测
# AI模型评测
HELM
HELM全称Holistic Evaluation of L...
0
5.5K
0
AI模型评测
# AI模型评测
Chatbot Arena
Chatbot Arena是一个大型语言模型 (LLM) 的...
0
3K
0
AI模型评测
# AI模型评测
LLMEval3
LLMEval是由复旦大学NLP实验室推出的大模型评测基准...
0
4.3K
0
AI模型评测
# AI模型评测
H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 L...
0
3.1K
0
AI模型评测
# AI模型评测
PubMedQA
PubMedQA是一个生物医学研究问答数据集,包含了1K专家...
0
2K
0
AI模型评测
# AI模型评测
没有了
网址
日榜
昨日
周榜
月榜
AI Smash or Pass
什么是AI Smash or Pass? Glambase是...
Sprunki
介绍 Sprunki 是一款适合所有人的有趣创意音乐游戏。 ...
即创
即创专注于智能创意生产与管理分析,同时兼容开放生态,提供视频创作、图文生成、直播工具等多种场景服务,帮助客户解锁创意生产力、携手服务商激发创新,撬动多元供给,助力商业化经营。
JanitorAI
介绍 探索与JanitorAI的创意可能性,这是一个独特的A...
All Sprunki Phases(1-9) in Here – Online Game for Free
介绍 在线免费玩所有 Sprunki 游戏阶段! 什么是 A...
SpicyChat
介绍 SpicyChat 是一个引人入胜的 AI 驱动聊天平...
查看完整榜单
猜你喜欢
发布
更新
浏览
点赞
加载更多
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍