HyperAI

在 Discord 上讨论

日期

3 个月前

许可证

CC BY-SA 4.0

标签

自然语言处理

Multi-LMentry 是于 2025 年发布的一个多语言评测基准数据集，旨在系统评估大型语言模型（LLMs）在多语言环境下对低层次语言理解与基础推理任务的跨语言泛化能力。

该数据集涵盖九种语言：英语、加泰罗尼亚语、德语、西班牙语、巴斯克语、加利西亚语、韩语、意大利语和巴西葡萄牙语。任务由母语使用者手动重新设计，形式与原始 LMentry 框架相似，但并非直接翻译，以确保语言与文化的自然性和适配性。

数据集结构

该数据集按语言分文件夹组织。
在每个语言文件夹中，每个任务对应一个 JSON 文件。
每个 JSON 文件包含该任务的输入提示和预期输出。
任务类型包括简单句子构造、语境词汇选择、字母推理等。
部分任务具有语言特定性，例如在不适用的语言中排除了押韵词任务。

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 support@hyper.ai 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

在 Discord 上讨论

日期

3 个月前

许可证

CC BY-SA 4.0

标签

自然语言处理

数据集结构

该数据集按语言分文件夹组织。
在每个语言文件夹中，每个任务对应一个 JSON 文件。
每个 JSON 文件包含该任务的输入提示和预期输出。
任务类型包括简单句子构造、语境词汇选择、字母推理等。
部分任务具有语言特定性，例如在不适用的语言中排除了押韵词任务。

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 support@hyper.ai 以便及时审查和下架。

olmOCR-mix-1025 文档识别数据集

3 个月前

71.74 GB83

Mobile Actions 移动端函数调用数据集

1 个月前

DetectiumFire 多模态火灾理解数据集

2 个月前

MUVR 多模态非裁剪视频检索基准

2 个月前

GroundingME 复杂场景理解评测数据集

1 个月前

VERA 语音推理评测数据集

3 个月前

2.37 GB59

GroundCUA 界面操作训练数据集

3 个月前

Open Schematics 电路原理图理解与生成数据集

1 个月前

SSRB 半结构化数据自然语言查询数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

Multi-LMentry 多语言基础任务基准数据集

数据集结构

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Multi-LMentry 多语言基础任务基准数据集

数据集结构

相关数据集

olmOCR-mix-1025 文档识别数据集

Mobile Actions 移动端函数调用数据集

DetectiumFire 多模态火灾理解数据集

MUVR 多模态非裁剪视频检索基准

GroundingME 复杂场景理解评测数据集

VERA 语音推理评测数据集

GroundCUA 界面操作训练数据集

Open Schematics 电路原理图理解与生成数据集

SSRB 半结构化数据自然语言查询数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Multi-LMentry 多语言基础任务基准数据集

数据集结构

相关数据集

olmOCR-mix-1025 文档识别数据集

Mobile Actions 移动端函数调用数据集

DetectiumFire 多模态火灾理解数据集

MUVR 多模态非裁剪视频检索基准

GroundingME 复杂场景理解评测数据集

VERA 语音推理评测数据集

GroundCUA 界面操作训练数据集

Open Schematics 电路原理图理解与生成数据集

SSRB 半结构化数据自然语言查询数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

olmOCR-mix-1025 文档识别数据集

Mobile Actions 移动端函数调用数据集

DetectiumFire 多模态火灾理解数据集

MUVR 多模态非裁剪视频检索基准

GroundingME 复杂场景理解评测数据集

VERA 语音推理评测数据集

GroundCUA 界面操作训练数据集

Open Schematics 电路原理图理解与生成数据集

SSRB 半结构化数据自然语言查询数据集

相关数据集

olmOCR-mix-1025 文档识别数据集

Mobile Actions 移动端函数调用数据集

DetectiumFire 多模态火灾理解数据集

MUVR 多模态非裁剪视频检索基准

GroundingME 复杂场景理解评测数据集

VERA 语音推理评测数据集

GroundCUA 界面操作训练数据集

Open Schematics 电路原理图理解与生成数据集

SSRB 半结构化数据自然语言查询数据集