您好,欢迎访问广东培训网!
当前位置:首页 > 企业内训 > 个人技能 > 课程内容

Python和R数据挖掘技术基于Python和R语言的数据挖掘和统计分析技术

  • 课程类型:内训课
  • 培训天数:3天
  • 用手机看:
    手机扫码
  • 授课老师:推荐
  • 课程编号:NX83717
  • 费用预算:根据方案进行定制
在线咨询
培训对象

1,系统架构师、系统分析师、高级程序员、资深开发人员。

2,牵涉到数据挖掘和统计分析的数据中心运行、规划、设计负责人。

3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。

4,高校、科研院所牵涉到数据挖掘与统计分析处理的项目负责人。

课程简介

第一讲数据挖掘,Python和R简介

1.1  数据挖掘

1.2  Python语言

1.3R语言

1.4Iris数据集

1.5Bodyfat数据集

第二讲数据的导入与导出

2.1R数据的保存与加载

2.2CSV文件的导入与导出

2.3通过ODBC从数据库中读取数据

2.4从Excel中导入与导出数据

2.5Python的数据操作

第三讲 数据可视化展现

3.1查看数据

3.2单个变量展现

3.3多个变量展现

3.4更多探索

3.5将图表保存到文件中

第四讲 决策树与随机森林

4.1使用party包构建决策树

4.2使用rpart包构建决策树

4.3随机森林

4.4Python中的决策树实现

4.5Python决策树实例

第五讲回归分析

5.1线性回归

5.2逻辑回归

5.3广义线性回归

5.4非线性回归

5.5Python中的回归实现

5.6Python回归实例

第六讲聚类分析

6.1k-means聚类

6.2k-medoids聚类

6.3层次聚类

6.4基于密度的聚类

6.5Python中的聚类实现

6.6Python聚类实例

第七讲离群点检测

7.1单变量的离群点检测

7.2局部离群点因子检测

7.3用聚类方法进行离群点检测

7.4时间序列数据的离群点检测

7.5Python中的孤立点实例

第八讲 时间序列分析

8.1R中的时间序列数据

8.2时间序列分解

8.3时间序列预测

8.4时间序列聚类

8.5时间序列分类

8.6Python中的时间序列实例

第九讲关联规则

9.1关联规则的基本概念

9.2Titanic数据集

9.3关联规则挖掘

9.4消除冗余

9.5解释规则

9.6关联规则的可视化

9.7Python中的关联规则实例

第十讲社交网络分析

10.1词项网络

10.2推文网络

10.3双模式网络

10.4Python中的社交网络分析实例

讲师介绍

杨老师  主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。

内训服务流程
内训服务流程
在线报名/咨询
联 系 人 :
联系方式:
公司名称:
咨询事项: