




2018年
CoLA数据集首次发表在《The Corpus of Linguistic Acceptability in Context》论文中,由Alex Warstadt、Amanpreet Singh和Samuel R. Bowman共同提出,旨在评估自然语言处理模型对语法正确性的理解能力。
2019年
CoLA数据集在GLUE(General Language Understanding Evaluation)基准测试中被广泛应用,成为评估模型在语言可接受性任务上性能的重要工具。
2020年
随着预训练语言模型(如BERT、GPT-3)的发展,CoLA数据集被用于微调这些模型,以提升其在语法判断任务上的表现。
