LOADING
首页
排行榜
在线智能工具
个人书签工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
热门
立即入驻
首页
•
AI模型评测
•
PubMedQA
PubMedQA
7个月前发布
1.9K
0
0
收藏
0
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
收录时间:
2024-10-18
打开网站
手机查看
AI模型评测
# AI模型评测
PubMedQA
打开网站
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
数据统计
相关导航
LLMEval3
LLMEval是由复旦大学NLP实验室推出的大模型评测基准...
MMLU
MMLU 全称 Massive Multitask Lang...
HELM
HELM全称Holistic Evaluation of L...
Chatbot Arena
Chatbot Arena是一个大型语言模型 (LLM) 的...
C-Eval
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件...
H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 L...
MMBench
MMBench是一个多模态基准测试,由上海人工智能实验室、南...
OpenCompass
OpenCompass是由上海人工智能实验室(上海AI实验室...
暂无评论
暂无评论...
网址
日榜
周榜
月榜
豆包
豆包是你的 AI 聊天智能对话问答助手,写作文案翻译情感陪伴编程全能工具。豆包为你答疑解惑,提供灵感,辅助创作,也可以和你畅聊任何你感兴趣的话题。
NudeAI
介绍 使用 NudeAI 轻松创建令人惊叹的裸体艺术。 什么...
Sprunki
介绍 Sprunki 是一款适合所有人的有趣创意音乐游戏。 ...
SpicyChat
介绍 SpicyChat 是一个引人入胜的 AI 驱动聊天平...
Sprunki Interactive
介绍 体验 Sprunki Interactive 的魔幻世...
百度作家平台
百度作家平台是百度官方推出的一站式AI辅助创作平台,提供丰富...
查看完整榜单
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍