6 个月前

自然语言处理

自然语言处理

Justin Lee Sowmya Vajjala

摘要

自动可读性评估（Automatic Readability Assessment, ARA）是指为文本分配阅读难度等级的任务，在自然语言处理（NLP）研究中传统上被视为一个分类问题。本文首次提出一种基于神经网络的成对排序（pairwise ranking）方法来解决ARA任务，并将其与现有的分类、回归以及非神经网络排序方法进行对比。通过在三个英文数据集、一个法文数据集和一个西班牙文数据集上开展实验，我们验证了所提模型的性能表现。实验结果表明，该方法在单语单语料库及跨语料库测试场景下均表现优异，并且在仅使用英文数据进行训练的情况下，实现了对法语和西班牙语文本超过80%的零样本跨语言排序准确率。此外，本文还发布了一个全新的英法双语可读性平行语料库。据我们所知，本文首次提出了用于ARA任务的神经网络成对排序模型，并首次展示了基于神经网络模型在跨语言、零样本场景下评估可读性的实验结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

自然语言处理

Justin Lee Sowmya Vajjala

摘要

自动可读性评估（Automatic Readability Assessment, ARA）是指为文本分配阅读难度等级的任务，在自然语言处理（NLP）研究中传统上被视为一个分类问题。本文首次提出一种基于神经网络的成对排序（pairwise ranking）方法来解决ARA任务，并将其与现有的分类、回归以及非神经网络排序方法进行对比。通过在三个英文数据集、一个法文数据集和一个西班牙文数据集上开展实验，我们验证了所提模型的性能表现。实验结果表明，该方法在单语单语料库及跨语料库测试场景下均表现优异，并且在仅使用英文数据进行训练的情况下，实现了对法语和西班牙语文本超过80%的零样本跨语言排序准确率。此外，本文还发布了一个全新的英法双语可读性平行语料库。据我们所知，本文首次提出了用于ARA任务的神经网络成对排序模型，并首次展示了基于神经网络模型在跨语言、零样本场景下评估可读性的实验结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供