首页
排行榜
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
首页
•
AI模型评测
•
PubMedQA
PubMedQA
1个月前发布
448
0
0
收藏
0
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
收录时间:
2024-10-18
打开网站
手机查看
AI模型评测
# AI模型评测
PubMedQA
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
数据统计
相关导航
FlagEval
FlagEval(天秤)由智源研究...
Open LLM Leaderboard
Open LLM Leaderboard 是最大...
MMBench
MMBench是一个多模态基准测试...
CMMLU
CMMLU是一个综合性的中文评估...
C-Eval
C-Eval是一个适用于大语言模...
LLMEval3
LLMEval是由复旦大学NLP实验...
OpenCompass
OpenCompass是由上海人工智能...
SuperCLUE
SuperCLUE 是一个中文通用大...
暂无评论
暂无评论...
网址
日榜
周榜
月榜
豆包
豆包是什么 豆包是由字节跳...
文心一言
百度推出的基于文心大模型的AI对话互动工具
冒泡鸭
冒泡鸭是什么 冒泡鸭是由国...
Meta AI助手
Meta AI是什么 Meta AI助手...
蚂上有创意
蚂上有创意是什么 蚂上有创...
法行宝
法行宝是什么 法行宝是由百...
查看完整榜单
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍