高度决定眼界、专业创造价值!中国规模最大、实力最强的培训服务提供商!

24小时服务热线:020-31041068

详细内容:当前的位置:首页 >> 公开课

大数据分析及可视化技术应用实战培训班

  • 开课时间: 2020年6月19日 周五 2020年6月22日 周一 查看最新上课时间
  • 开课城市: 北京
  • 培训时长:4天
  •  
  • 课程类别: 培训发展
  • 主讲老师:钟老师等(查看该老师更多课程)
  • 课程编号: 49609
  • 查找同类课程
大数据分析及可视化技术应用实战培训班其它上课时间:

培训对象:

1.大数据分析应用开发工程师 2.大数据分析项目的规划咨询管理人员 3.大数据分析项目的IT项目高管人员 4.大数据分析与挖掘处理算法应用工程师 5.大数据分析集群运维工程师 6.大数据分析项目的售前和售后技术支持服务人员

培训内容:


培训费用

面授班培训费5800 元/人(含场地费、考试证书费、教材费、学习期间的午餐费) 食宿统一安排,费用自理。 本课程学习考核通过后颁发《大数据开发高级架构师》证书, 证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。


课程特色

1. 本课程尽量避开数学公式,按照“讲清思想方法原理—结合具体案例—R语言实现细节”思路,让即使是几乎没有什么基础的学员,掌握数据挖掘和可视化的基本思路和模式,打下未来深入的良好基础,能在工作和学习中结合具体问题立马上手操作解决;

2. 课程注重学练结合的方法,会采取课中练习的方法,充分调动大家思考的积极性,在做中掌握相关知识和技能;

3. 课程紧紧抓住基于R语言的数据挖掘和可视化的重点和难点,详细的分析和讲解,在理解难、容易出错的地方反复提醒,以便学员在课后容易的进行自己复习和相关拓展。



课程大纲

第一天

上午 数据处理及复杂数据可视化(一)

第一讲 大数据挖掘及可视化介绍

数据挖掘及可视化背景

数据挖掘流程

常用挖掘工具介绍

R语言的优势

R数据挖掘可视化工具-Rattle快速上手

R语言对复杂数据可视化的优势

R语言快速入门

利用caret包做数据抽样及虚拟化处理

第一天

下午 数据处理及复杂数据可视化(二)

第二讲 数据质量分析及高级可视化

缺失值处理的高级方法

异常值甄别的高级方法

数据可视化进阶:lattice及ggplot2包介绍

数据交互可视化:rCharts、recharts、networkD3、plotly等包介绍

第二天

上午 数据挖掘模型实战(一)

第三讲 聚类分析及R语言实现

聚类分析是一种原理简单、应用广泛的数据挖掘技术。顾名思义,聚类分析即是把若干事物按照某种标准归为几个类别,其中较为相近的聚为一类,不那么相近的聚于不同类。

案例一:对著名的鸢尾花数据进行K均值聚类分析

案例二:对汽车数据进行K均值聚类分析

案例三:对洛杉矶街区数据进行层次聚类

案例四:对汽车数据进行层次聚类

第四讲 关联规则及R语言实现

关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析,并通过arulesViz扩展包对关联规则进行可视化展示。

案例:利用超市购物篮Groceries数据进行关联规则分析

第二天

下午 数据挖掘模型实战(二)

第五讲 KNN近邻算法及R语言实现

KNN(k-Nearest Neighbor)分类算法是数据挖掘分类技术中较简单的方法之一。所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。

案例一:对鸢尾花数据集进行knn分类

案例二:对乳腺癌数据进行knn分类

案例三:对文本数据进行knn分类

第六讲 决策树分类及R语言实现

决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C5.0算法,使用rpart和C50函数进行R语言分析。

案例一:对鸢尾花数据集运用C50算法分类

案例二:对鸢尾花数据集运用CART算法进行分类

案例三:对汽车数据运用CART对汽车重量进行预测

第三天

上午 行业应用案例分享(一)

第七讲 深度挖掘用户付费行为及社会网络分析

对用户的购买行为进行购物篮分析

智能推荐系统常用算法介绍

对用户购物行为构建智能推荐系统

社会网络图基本知识

利用R语言绘制社会网络图

利用Gephi绘制社会网络图

对用户购物行为进行聚类分析,发现社群

第三天

下午 行业应用案例分享(二)

第八讲 航空公司客户价值分析

背景与挖掘目标

分析方法及过程

数据探索分析

数据预处理

模型构建

模型应用

第九讲 漏斗模型及路径分析

漏斗模型的主要应用场景

路径分析的主要应用场景

漏斗模型与路径分析的不同点

sunburst事件路径图的绘制方法

利用基于时序的关联规则对点击事件进行分析

第四天 学习考核与业内经验交流


授课师资

谢老师 计算机硕士,数据分析与可视化专家,高级培训讲师。中国R语言资深顾问,WOT“互联网+”大数据技术、百城沙龙大数据沙龙广深两地特邀顾问。目前就职于某集团上市公司的高级数据分析师,主要利用R语言进行大数据的挖掘和可视化工作。本人从事数据挖掘建模工作已有8年,曾经从事过咨询、电商、电购、电力、游戏等行业,了解不同领域的数据特点。有丰富的利用R语言进行数据挖掘实战经验,部分研究成果曾获得国家专利。培训过的精品课程有:《R语言基础培训》、《Rattle:可视化数据挖掘工具》、《数据分析之R语言实战》、《机器学习与R语言实践》、《R语言与文本挖掘》

钟老师 现任职于中科院某研究所,高级工程师,副高职称,博士毕业于中国科学院计算技术研究所,获工学博士学位(计算机系统结构方向)。中培教育的大数据、云计算、移动互联网系列课程建设与教学专家。近七年来带领团队主要从事大数据与云计算技术项目的研发与IT项目管理工作。钟老师有着多年的企业内训和公开课培训讲师经历,主讲大数据平台技术、云计算、移动互联网、电子商务、IT信息软件项目管理、企业信息化规划与管理、IT战略规划与企业架构、数据中心主机规划与IDC系统运营等企业实战类培训课程。

培训发展推荐讲师

培训发展公开课推荐

最新发布公开课推荐

博课在线客服关闭


线