LOADING STUFF...
首页
排行榜
在线智能工具
个人书签工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
AI模型评测
共 14 篇网址
排序
发布
更新
浏览
点赞
收藏
随机
AGI-Eval
AGI-Eval是什么 AGI-Eval是上海交通大学、同济...
0
2.4K
0
AI模型评测
# AI模型评测
MMLU
MMLU 全称 Massive Multitask Lang...
0
17K
0
AI模型评测
# AI模型评测
Open LLM Leaderboard
Open LLM Leaderboard 是最大的大模型和数...
0
20.9K
0
AI模型评测
# AI模型评测
C-Eval
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件...
0
3.8K
0
AI模型评测
# AI模型评测
FlagEval
FlagEval(天秤)由智源研究院将联合多个高校团队打造...
0
3.8K
0
AI模型评测
# AI模型评测
SuperCLUE
SuperCLUE 是一个中文通用大模型综合性评测基准,从三...
0
6.3K
0
AI模型评测
# AI模型评测
OpenCompass
OpenCompass是由上海人工智能实验室(上海AI实验室...
0
4.2K
0
AI模型评测
# AI模型评测
CMMLU
CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在...
0
5.8K
0
AI模型评测
# AI模型评测
MMBench
MMBench是一个多模态基准测试,由上海人工智能实验室、南...
0
4.5K
0
AI模型评测
# AI模型评测
HELM
HELM全称Holistic Evaluation of L...
0
5.3K
0
AI模型评测
# AI模型评测
Chatbot Arena
Chatbot Arena是一个大型语言模型 (LLM) 的...
0
2.9K
0
AI模型评测
# AI模型评测
LLMEval3
LLMEval是由复旦大学NLP实验室推出的大模型评测基准...
0
4K
0
AI模型评测
# AI模型评测
H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 L...
0
3K
0
AI模型评测
# AI模型评测
PubMedQA
PubMedQA是一个生物医学研究问答数据集,包含了1K专家...
0
1.9K
0
AI模型评测
# AI模型评测
没有了
网址
日榜
昨日
周榜
月榜
豆包
豆包是你的 AI 聊天智能对话问答助手,写作文案翻译情感陪伴编程全能工具。豆包为你答疑解惑,提供灵感,辅助创作,也可以和你畅聊任何你感兴趣的话题。
NudeAI
介绍 使用 NudeAI 轻松创建令人惊叹的裸体艺术。 什么...
Sprunki
介绍 Sprunki 是一款适合所有人的有趣创意音乐游戏。 ...
SpicyChat
介绍 SpicyChat 是一个引人入胜的 AI 驱动聊天平...
Sprunki Interactive
介绍 体验 Sprunki Interactive 的魔幻世...
百度作家平台
百度作家平台是百度官方推出的一站式AI辅助创作平台,提供丰富...
查看完整榜单
猜你喜欢
发布
更新
浏览
点赞
加载更多
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍