源码简介:

课程特色:
规划全面:内容涵盖用户标签指标体系、数据分析、数据开发、ETL、搭建开发环境、Kafka和Hbase等常用大数据组件的介绍、画像的产品形态、打通数据服务层、以及如何应用用户标签和效果评估
实操性强:每章案例都进行详细的分析和开发过程讲解,附有相应的分析报告、文档以及代码。通过在搭建的虚拟机环境中执行任务,帮助学习者更好地理解工程上的实现方式和实现细节

课程大纲:
第一章:用户画像基础知识
1、开发用户画像需要掌握的能力
2、实际案例-用户画像及其应用规划说明
3、实际案例-用户标签应用实施方案说明
4、实际案例-工程开发代码
5、需要开发的表及表结构设计

第二章:用户标签指标体系
1、用户属性维度指标体系
2、用户行为维度指标体系
3、用户消费维度指标体系
4、用户风控维度指标体系
5、标签口径及数据调研分析
6、标签命名方式小结

第三章: 搭建开发环境
1、搭建虚拟机开发环境及节点间互信
2、HDFS的安装及应用场景
3、ZooKeeper的安装及应用场景
4、Yarn的安装及应用场景
5、Hbase的安装及应用场景
6、MySQL的安装及应用场景
7、Sqoop的安装及应用场景
8、kafka的安装及应用场景
9、Spark的安装及应用场景

第四章:标签数据存储
1、Hive存储及应用特点
2、MySQL存储及应用特点
3、Hbase存储数据及应用特点
4、为什么用不同数据库存储标签数据

第五章:标签数据开发
1、数据仓库基础知识
2、统计类标签开发案例
3、规则类别标签开发案例
4、挖掘类别标签开发案例
5、流式计算标签开发(1)-kafka介绍
6、流式计算标签开发(2)-streaming的Receiver模式与Direct模式
7、流式计算标签开发(4)-记录消费的offset
8、流式计算标签开发(5)-Spark Streaming上线工程化

第六章:开发性能调优
1、数据倾斜调优
2、Hive合并小文件
3、使用Spark缓存(cache、persist、checkpoint)
4、开发中间表

第七章:作业流程调度
1、crontab命令调度
2、airflow调度-基础概念
3、airflow调度-安装
4、airflow调度-主要功能模块
5、airflow调度-工作流调度
6、airflow调度-工程案例
7、标签数据监控预警(Hive、MySQL、Hbase)
8、ETL异常问题排查及解决方案

第八章: 用户画像产品化
1、标签视图与标签查询
2、标签编辑管理
3、自定义查询与人群圈定
4、维透视分析功能

第九章:用户画像应用
1、业务数据分析
2、精准营销(短信、邮件)
3、推荐系统中应用

截图:

加入本站会员,开启尊贵特权之体验

本站资源支持会员下载专享,普通注册会员只能原价购买资源或者限制免费下载次数,付费会员所有资源可下载。

包月会员(国庆特价)

88金币

会员时长:30天
每日2个免费下载次数
享受资源专属折扣

前往开通
包年会员(国庆特价)

188金币

会员时长:365天
一年内,每日2次下载次数
享受资源专属折扣

前往开通
永久会员(国庆特价)

288金币

会员时长:永久
每日5个免费下载次数
享受资源专属折扣

前往开通

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源