1、dwd有哪些表、ads指标怎么计算得到 2、加工策略、dwd到dws,整合,load方式加载,全量覆盖 3、两层的表结构上有什么区别 4、存储格式是什么样子,orc 5、跑批的时候用spark,spark查询的时候用的多,hive用来做存储 6、优化数据倾斜、分区处理、优化语句先过滤后关联,看执行计划 7、调度如何监控、异常处理、碰到过的异常、怎么处理的,8088界面日志可以看 8、遇到的问题映射不上、调度环境原因 9、上线的问题、发现问题怎么分析怎么处理 10、连条测试、svn 11、测试报告、里面的内容 12、需求的发布流程:产品经理开会、项目经理过一遍、反串讲 13、orcale里面的表有哪些种类 14、存储过程的异常处理,exception 15、表跑的慢使用优化器,并行 16、随着时间的积累,sql跑的越来越慢的原因,如何处理 17、执行计划关注哪些点,扫表方式、关联方式、耗费 18、cpu,io比较高的原因(可能是内存溢出?倾斜?) 19、索引失效的情况,索引列运算、函数、模糊查询 20、后期规划是怎么样的,多结合业务方面的 21、有什么想问的?工作中会用什么环境、需要侧重增长哪方面的能力?