LOADING
一个由Hugging Face提供的开...
斯坦福大学CRFM团队开发的一...
北京智源人工智能研究院推出...
一个AI大模型评测社区
由H2O.ai开发的一款企业级AI...
AIPing是一个为开发者和团队...
中文通用大模型综合性测评基准
一个专门为评估语言模型在中...
由OpenCompass社区开发的多模...
一个用于生物医学研究问题回...
是一个基于人类偏好评估AI聊...
一个用于评估语言模型在多任...
一个由上海交通大学、清华大...