我们正处于一个快速发展的信息化时代,数据极大地影响着我们的生活。数据科学是研究探索网络空间中数据自然界奥秘的理论、方法和技术,研究的对象是数据自然界,研究认识数据的各种类型、状态、属性及变化形式和变化规律,其目的在于揭示自然界和 ...
首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致 ...