首页
排行榜
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
首页
•
AI模型评测
•
PubMedQA
PubMedQA
6个月前发布
1.5K
0
0
收藏
0
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
收录时间:
2024-10-18
打开网站
手机查看
AI模型评测
# AI模型评测
PubMedQA
打开网站
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
数据统计
相关导航
MMLU
MMLU 全称 Massive Multitask Lang...
FlagEval
FlagEval(天秤)由智源研究院将联合多个高校团队打造...
MMBench
MMBench是一个多模态基准测试,由上海人工智能实验室、南...
AGI-Eval
AGI-Eval是什么 AGI-Eval是上海交通大学、同济...
H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 L...
OpenCompass
OpenCompass是由上海人工智能实验室(上海AI实验室...
Chatbot Arena
Chatbot Arena是一个大型语言模型 (LLM) 的...
SuperCLUE
SuperCLUE 是一个中文通用大模型综合性评测基准,从三...
暂无评论
暂无评论...
网址
日榜
周榜
月榜
Adult AI Chat
Adult AI Chat
Sprunky Incredibox: Sprunky Game Online
Dive into the world of Sprunky, Play Sprunky Incredibox! Mix, match, and create unique Sprunky beats with our quirky characters. Experience music creation like never before.
Attention Required!
Attention Required! | Cloudflare
OptimizerAI
OptimizerAI是什么 OptimizerAI是一款人...
Superchat
介绍 Superchat 是一款为企业提供的一站式消息解决方...
Faceswapper
Faceswapper是什么 Faceswapper是AI在...
查看完整榜单
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍