首页
排行榜
在线智能工具
个人书签工具
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
首页
•
AI模型评测
•
PubMedQA
PubMedQA
6个月前发布
1.8K
0
0
收藏
0
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
收录时间:
2024-10-18
打开网站
手机查看
AI模型评测
# AI模型评测
PubMedQA
打开网站
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
数据统计
相关导航
HELM
HELM全称Holistic Evaluation of L...
H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 L...
FlagEval
FlagEval(天秤)由智源研究院将联合多个高校团队打造...
LLMEval3
LLMEval是由复旦大学NLP实验室推出的大模型评测基准...
OpenCompass
OpenCompass是由上海人工智能实验室(上海AI实验室...
AGI-Eval
AGI-Eval是什么 AGI-Eval是上海交通大学、同济...
Open LLM Leaderboard
Open LLM Leaderboard 是最大的大模型和数...
C-Eval
C-Eval是一个适用于大语言模型的多层次多学科中文评估套件...
暂无评论
暂无评论...
网址
日榜
周榜
月榜
Attention Required!
Attention Required! | Cloudflare
豆包
豆包是你的 AI 聊天智能对话问答助手,写作文案翻译情感陪伴编程全能工具。豆包为你答疑解惑,提供灵感,辅助创作,也可以和你畅聊任何你感兴趣的话题。
18+ AI Chat
介绍 探索与 18+ AI Chat 的亲密对话。 什么是 ...
BoyinThai
介绍 跟随BoyinThai指南,探索泰国顶级同志旅游目的地...
Joi, AI Girlfriend (18+)
介绍 发现 Joi,你的亲密 AI 女朋友,带来个性化体验...
Adult AI Chat
Adult AI Chat
查看完整榜单
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍