CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力,涵盖了从基础学科到高级专业水平的67个主题。它包括:需要计算和推理的自然科学,需要知识的人文科学和社会科学,以及需要生活常识的中国驾驶规则等。此外,CMMLU中的许多任务具有中国特定的答案,可能在其他地区或语言中并不普遍适用。因此是一个完全中国化的中文测试基准。
数据统计
数据评估
关于CMMLU特别声明
本站太极导航提供的CMMLU都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由太极导航实际控制,在2024年5月17日 下午5:07收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,太极导航不承担任何责任。
相关导航
Ask Youtube
AskYoutube是一个人工智能工具,允许用户询问、搜索和发现来自Youtube的内容 Discover the power of AI with AskYoutube. Instantly find answers to your queries without needing to watch all the Youtube videos. Simply type in your question and get the most accurate and concise information. AskYoutube - making video knowledge accessible at your fingertips!
暂无评论...