基于SparkSQL的电影分析项目实战

在本篇分享中,将介绍一个完整的项目案例,该案例会真实还原企业中SparkSQL的开发流程,手把手教你构建一个基于SparkSQL的分析系统。为了讲解方便,我会对代码进行拆解,完整的代码已上传至GitHub,想看完整代码可以去clone,顺便给个**Star**。以下是全文,希望本文对你有所帮助。看完记得三连:分享、点赞、在看
https://github.com/jiamx/spark_project_practise

项目介绍
数据集介绍
使用MovieLens的名称为ml-25m.zip的数据集,使用的文件时movies.csv和ratings.csv,上述文件的下载地址为:
http://files.grouplens.org/datasets/movielens/ml-25m.zip

movies.csv
该文件是电影数据,对应的为维表数据,大小为2.89MB,包括6万多部电影,其数据格

基于SparkSQL的电影分析项目实战最先出现在Python成神之路

版权声明:
作者:感冒的梵高
链接:https://www.techfm.club/p/11925.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>