你们需要的数据集,都给准备好了

作者:亚盈体育发布时间:2022-09-16 14:42

本文摘要:相信许多同学一直苦于没有数据集可以训练,这里给大家提供了一份可以使用业余时间完成的数据科学项目清单!项目分为三种类型:可视化项目探索性数据分析(EDA)项目预测建模可视化项目最容易上手的就是数据可视化, 以下三个数据集可以用于建立一些有意思的的可视化效果并加到你的简历中。新冠bingdu可视化学习如何使用Plotly构建动态可视化数据,展示冠状bingdu是如何在全球规模内流传的。Plotly很好用,它可以做动态可视化,悦目且操作简朴。

亚盈体育

相信许多同学一直苦于没有数据集可以训练,这里给大家提供了一份可以使用业余时间完成的数据科学项目清单!项目分为三种类型:可视化项目探索性数据分析(EDA)项目预测建模可视化项目最容易上手的就是数据可视化, 以下三个数据集可以用于建立一些有意思的的可视化效果并加到你的简历中。新冠bingdu可视化学习如何使用Plotly构建动态可视化数据,展示冠状bingdu是如何在全球规模内流传的。Plotly很好用,它可以做动态可视化,悦目且操作简朴。难易水平:简朴数据集:https://www.kaggle.com/sudalairajkumar/novel-corona-virus-2019-dataset澳洲大火数据可视化2019-2020年的森林大火季,也称为玄色夏天,由2019年6月开始的几场极端野火组成的。

据维基百科统计,这场大火烧毁了约1,860万公顷的土地和5,900多座修建物。这是一个有趣的项目,可以使用Plotly或Matplotlib数据可视化工具来可视化野火的规模和对地理的影响。难易水平:简朴数据集:https://www.kaggle.com/carlosparadis/fires-from-space-australia-and-new-zeland地表温度可视化你是否怀疑过全球变暖的看法?建立一些数据可视化效果,显示地球外貌温度如何随时间变化,并可以通过建立折线图或其他动画的Choropleth贴图来实现!也可以建立一个预测模型来预测未来五十年内地球的温度。

难易水平:介于简朴到中等之间数据集:https://www.kaggle.com/berkeleyearth/climate-change-earth-surface-temperature-data/kernels探索性数据分析项目探索性数据分析(EDA),也称为数据挖掘,意思是数据分析历程中使用了多种技术来更好明白数据。纽约Airbnb数据挖掘自2008年以来,Airbnb使游客和房东出行更利便,提出更多个性化的体验世界的方式。该数据集包罗有关2019年纽约出租的信息以及包罗其地理信息,价钱,评论数量等。

可以分析的一些角度如下:哪些区域生意最好,为什么?哪些区域的流量比其他区域大,为什么?价钱,评论数量和预订天数之间是否存在一些关系?难易水平:中等数据集:https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data哪些因素与员工去职和绩效有关IBM公然了一个综合数据集,可以使用它来相识种种因素如何影响员工的流失率和满足度。一些变量包罗教育水平,事情相关性,绩效评估和事情生活平衡水平等。分析此数据集,找到任何确实影响员工满足度的变量,另外,还可以看看是否可以对变量举行重要水平排名。难易水平:简朴数据集:https://www.kaggle.com/pavansubhasht/ibm-hr-analytics-attrition-dataset世界大学排名你认为你的国家拥有世界上最好的大学吗?成为“最好”大学的权衡尺度是什么?该数据集包罗三个全球大学排名方式。

使用此数据,你是否可以回覆以下问题:顶尖的大学都在哪些国家?决议世界排名的主要因素是什么?难易水平:简朴数据集:https://www.kaggle.com/mylesoneill/world-university-rankings饮酒与在校体现喝酒会影响学生的结果吗?如果不会,那有什么此外影响吗?这个数据是从中学数学和葡萄牙语课程的学生举行的一项观察中获得的。它包罗几个变量,例如饮酒量,家庭人数,到场课外运动。

亚盈体育

使用这些数据,挖掘学校结果与种种因素之间的关系。另外,看看是否可以凭据其他变量来预测学生的结果!难易水平:简朴数据集:https://www.kaggle.com/uciml/student-alcohol-consumption宠物小精灵数据挖掘对所有游戏玩家来说,这是一个包罗来自七代802个 Pokemon的信息数据集。

试着回覆以下几个问题!哪一代宠物小精灵最强?哪代最弱?哪种类型神奇宝物最强?哪种最弱?能否建设分类器来识别神奇宝物?身体特征与气力状态(进攻,防守,速度等)之间是否有相关性?难易水平:简朴数据集:https://www.kaggle.com/rounakbanik/pokemon探索影响预期寿命的因素世卫组织建设了一段时间内所有国家康健状况的数据集,其中包罗预期寿命,成人死亡率等方面的统计数据。使用此数据集,探索种种变量之间的关系,预测对预期寿命的最大影响因素是什么?请实验回覆以下问题:最初选择的种种预测因素是否真的影响预期寿命?实际影响预期寿命的预测变量有哪些?预期寿命值低于(<65)的国家是否应该增加其医疗保健支出以改善其平均寿命?婴儿和成人死亡率如何影响预期寿命?预期寿命与饮食习惯,生活方式,运动,吸烟,饮酒等是正相关还是负相关?是否接受教育对人类寿命有何影响?预期寿命与饮酒是正相关还是负相关?人口浓密的国家的预期寿命是否有降低的趋势?免疫笼罩率对预期寿命有什么影响?难易水平:简朴数据集:https://www.kaggle.com/kumarajarshi/life-expectancy-who预测模型能源消耗的时间序列预测该数据集由美国区域传输组织PJM网站上的功耗数据组成,使用此数据集,检察是否可以构建时间序列模型来预测能耗。除此之外,还可以检察是否可以找到一天中每个小时的趋势,沐日用电量以及恒久趋势!难度:中高级数据集:https://www.kaggle.com/robikscube/hourly-energy-consumption。


本文关键词:你们,需,要的,数据,集,都给,准备,好了,相信,亚盈体育

本文来源:亚盈体育-www.hzhlsygs.com