CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力,涵盖了从基础学科到高级专业水平的67个主题。它包括:需要计算和推理的自然科学,需要知识的人文科学和社会科学,以及需要生活常识的中国驾驶规则等。此外,CMMLU中的许多任务具有中国特定的答案,可能在其他地区或语言中并不普遍适用。因此是一个完全中国化的中文测试基准。
数据统计
数据评估
本站太极导航提供的CMMLU都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由太极导航实际控制,在2024年5月17日 下午5:07收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,太极导航不承担任何责任。
相关导航

AI动力图书搜索引擎。 Discover your next favorite book with BookAbout - the revolutionary platform that uses AI technology to search through over 500,000 books. Say goodbye to traditional book searching and hello to a new way of discovering literature. Join us on our journey of book discovery and find your next literary adventure

免费高质量的Prompts集合 Collection of Public, Free, High Quality Prompts Browse The Site Models Prompts Embeddings Models Library Fine-Tuned Model Flexible Diffusion model DreamBooth Model Synthwave (DreamBooth model) DreamBooth Model All in one Pixel Art (DreamBooth Model) DreamBooth Model Borderlands (DreamBooth model) DreamBooth Model Cal Arts (DreamBooth Model) DreamBooth Model Pixel Landscapes V1 (DreamBooth model) DreamBooth Model