

UCI Machine Learning Repository in CSV
UCI Machine Learning Repository是一个包含数据库、领域理论和数据生成器的集合,用于机器学习社区进行机器学习算法的实证分析。
python import numpy as np import pandas as pd
URL = "https://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data" Col_Names = [age,workclass,fnlwgt,education,education-num,marital-status,occupation,relationship,race,sex,capital-loss,hours-per-week,native-country,Income]
Data = pd.read_csv(URL,header=None) Data.columns = Col_Names Data
数据集包含以下属性:
1987年
UCI Machine Learning Repository首次发表,由加州大学欧文分校(UCI)的David Aha和其同事创建,旨在为机器学习研究提供一个公共数据集资源。
1990年
数据集数量显著增加,涵盖了多个领域,包括分类、回归和聚类等,成为学术界和工业界广泛使用的资源。
2000年
UCI Machine Learning Repository开始提供在线访问和下载服务,进一步促进了其在全球范围内的使用和影响力。
2010年
数据集的质量和多样性进一步提升,新增了大量高质量的数据集,涵盖了更多新兴领域和应用场景。
2020年
UCI Machine Learning Repository继续扩展,数据集数量超过500个,成为全球最受欢迎和广泛使用的机器学习数据集资源之一。