1、自我介绍 2、上一个项目介绍 3、hadoop 4、数据倾斜 在大数据的情况下数据倾斜是经常发生的,要看下我转发的那个cnds,我也看不懂 5、怎么优化sql 1、sql语句优化 减少性能不好的sql写法,然后通过优化器看耗费 2、索引优化 常用的字段要建索引,还要确保使用索引进行关联的时候索引没有失效 3、表分区 建表的时候进行表分区 4、加并行 就说用得比较少 6、怎么确保sql的准确 我回答:开发阶段完成之后会对自己写的sql进行造数据来测试 7、你们之前是怎么建模的 就随便说了下星型模型和雪花模型,然后工作中主要用到星型模型,讲一堆星型模型的特性,然后他问我 工作使用星型模型都能解决全部吗,我说是 8、部门是怎么分工的有几个人 我说一个项目经理,然后3个测试还有6个开发,两个开发数据系统到ods,两个开发是ods到dw,两个开发是dw到dm还有报表 9、基本你写上去的每个项目都会问道 他直接问我第三个项目的一个指标,我愣了,然后他说可能是太长时间忘记了吧,然后我说我给他说一个最近项目的指标吧 10、然后又问了我写的第二个项目 11、 他说主要看重的还是对项目的了解程度