SigmaLaw-ABSA数据集的构建主要围绕法律意见文本的方面情感分析任务。数据集的构建始于从SigmaLaw-Large Legal Text Corpus and Word Embeddings数据集中收集案例,该数据集包含来自美国最高法院的大量法律案例。研究者选取了约2000个句子进行标注,其中包括完整的句子和从原句中提取的有意义的子句。为了确保标注的一致性,三位法律专业的本科生和研究生参与了标注过程,他们负责确定每个方面的类别和情感标签。标注过程中,使用Fleiss'kappa系数来评估标注者之间的一致性,结果显示标注者之间的一致性达到了中等水平。