目录一、案例项目实施方案二、 RegexSerDe处理数据三、数据拆分四、UDF数据转换五、数据分析六、基于python数据预处理 一、案例项目实施方案拿到源数据access.log之后,准备工作如下:1.数据进行预处理,加载hive表之前>>MR程序处理 >>正则表达式(企业推荐) >>python脚本2.表拆分,源数据不变,创建对应业务需求的字表3