物流离线数仓项目是以物流为基础业务,真实还原了物流平台对于用户数据的分析和统计,最终以大屏展示的方法给大家呈现数据分析的结果。 本项目以物流采集项目为前置基础,直接使用物流采集项目的基础加购,在此基础上将数据导入数仓当中,之后对数据进行系统化的分析计算,最终得到指标需求结果。 离线数仓项目分为四个部分——数仓建模原理介绍,数仓模型搭建,DolphinScheduler全流程调度,SuperSet可视化大屏展示。 需要依赖使用到的框架有Hadoop,Hive,Spark,Kafka,Flume,Flink-CDC,Datax,DolphinScheduler,SuperSet等。 整套课程帮助大家彻底了解数仓建模理论体系,深入认识物流平台的业务理论体系。