

FineFake 数据集用于 FineFake : A Knowledge-Enriched Dataset for Fine-Grained Multi-Domain Fake News Detection 研究。该数据集包含文本数据、元数据、图像数据和知识数据。
数据集分为六个主题和八个平台:
数据以 pickle 文件形式存储,可以通过以下代码打开: python pip install pickle pip install pandas import pickle as pkl import pandas as pd with open(file_name,"rb") as f: data_df = pkl.load(f) # data_df 是 DataFrame 格式
pickle 文件包含 13 列,每列及其含义如下:
列名 | 含义 |
---|---|
text | 新闻正文 |
image_path | 图片路径(相对路径) |
entity_id | 文本实体的维基ID |
topic | 六个主题之一 |
label | 标签 |
fine-grained label | 细粒度标签 |
knowledge_embedding | 知识嵌入 |
description | 文本实体描述 |
relation | 关系 |
platform | 新闻来源 |
author | 作者 |
date | 新闻发布日期 |
comment | 评论 |
标签 | 含义 |
---|---|
0 | 真新闻 |
1 | 文本-图像不一致 |
2 | 内容-知识不一致 |
3 | 基于文本的假新闻 |
4 | 基于图像的假新闻 |
5 | 其他 |