Oracle大数据培训课程

 

 

课程名称Oracle大数据培训课程。

时间安排120课时。

学习环境:云计算教学环境,部署以下必需的软件产品

·        OracleEnterpriseLinux6.4

·         OracleDatabase12cRelease1EnterpriseEdition(12.1.0.2)

·         ClouderaDistributionincludingApacheHadoop(CDH5.1.2)

·         ClouderaManager(5.1.2)

·         OracleBigDataConnectors4.0

·        OracleNoSQLDatabaseEnterpriseEdition12cR1(3.0.14)

·         OracleJDeveloper12c(12.1.3)

·         OracleSQLDeveloperandDataModeler4.0.3

·         OracleDataIntegrator12cR1(12.1.3)

·         OracleGoldenGate12c

·         OracleRDistribution3.1.1

·         OraclePerfectBalance2.2

 

模块概览:Oracle大数据培训课程共包含5个模块,各模块说明如下:

 

Oracle Big Data Fundamentals

总体课程目标:

1.定义大数据和讨论Oracle大数据的解决方案

2.描述Hadoop NoSQL生态系统

3.检查和运行MapReduce作业

4.使用HivePig进行查询

5.使用Oracle大数据连接器

6.使用Hadoop, Oracle SQL Analytics,Oracle Advanced Analytics, Oracle Big Data Discovery分析数据

7.使用Oracle Big Data Appliance (BDA)

8.对数据提供安全保证及启用资源管理

 

1课:课程介绍

讨论课程目标和学习路线图

附录内容的列举

确定练习环境

确定相关参考文档和其它学习资源

 

2课:大数据和Oracle信息管理系统

明确在实施大数据时的挑战和机遇

描述Oracle大数据信息管理系统的架构

描述Oracle处理大数据的技术方法

 

3课:使用Oracle Big Data Lite虚拟机

– OracleBig Data Lite虚拟机的介绍

大数据应用方案Oracle MoviePlex的描述

 

4课:介绍大数据生态系统

定义Hadoop生态系统

描述Hadoop的核心组件

选择一个Hadoop版本:ApacheCDH

列举Hadoop生态系统中其它的相关项目

 

5课:HDFS介绍

描述HDFS结构性组件

使用shell命令行接口与HDFS数据交互

 

6课:使用CLI, Fuse DFSFlume获取数据

描述命令行接口CLI的使用

描述Fuse DFS的好处

定义Flume

描述Flume数据流机制

确定Flume的配置选项

 

7课:使用Oracle NoSQL数据库获取和访问数据

描述NoSQL数据库的特征

–NoSQL数据库与关系型数据库及HDFS的差别

描述Oracle NoSQL数据库的优点

Oracle NoSQL数据库中加载和删除数据

Oracle NoSQL数据库中检索数据

 

8课:Oracle NoSQL数据库的主要管理任务

规划与安装

节点的安装与配置

部署KVStore

 

9课:MapReduce介绍

描述MapReduce的处理过程

 

10课:使用YARN管理资源

使用YARN高效地管理Hadoop资源

 

11课:HivePig概览

定义Hive

描述Hive数据流

创建Hive数据库

定义Pig

列举Pig的特征

 

12课:Cloudera Impala概览

描述Cloudera Impala的特征

解释Impala如何与HiveHDFSHBase协同工作

 

13课:使用Oracle XQuery for Hadoop

使用OracleXQuery for Hadoop创建和执行XQuery转换

 

14课:Solr概览

描述Cloudera Search(Solr)

 

15课:Apache Spark

–ApacheSpark概览

描述Spark结构

解释弹性分布式数据集

解释有向无环图

 

16课:整合大数据的选项

确定整合数据的需求

描述Oracle大数据管理系统支持的数据整合技术

 

17课:ApacheSqoop概览

描述Sqoop

描述Sqoop特征

描述Sqoop连接器

描述Oracle Data IntegrationSqoop的集成

 

18课:使用Oracle Loader for Hadoop (OLH)

定义Oracle Loader for Hadoop

列举Oracle Loader for Hadoop的安装步骤

描述从Hadoop加载数据到Oracle数据库的方法

 

19课:使用Copy to BDA

描述Copy to BDA的目的

使用Copy to BDA

 

20课:使用Oracle SQL Connector for HDFS

定义Oracle SQL Connector for HDFS (OSCH)

描述OSCH安装步骤和软件预先要求

描述OSCH的操作和好处

 

21课:在Hadoop上使用Oracle数据集成器和GoldenGate

–Oracle数据集成器和Hadoop的交互

–Oracle GoldenGate容灾与Hadoop的交互

 

22课:使用Oracle Big Data SQL

描述Oracle Big Data SQL如何实现在Oracle数据库和HadoopNoSQL之间的动态整合访问

使用Oracle Big Data SQL执行整合后的数据分析

 

23课:使用Oracle高级分析:Oracle Data MiningOracle R Enterprise

定义Oracle Advanced Analytics

描述Oracle Data Mining的使用和好处

描述Oracle R Enterprise的使用和好处

 

24课:介绍Oracle Big Data Discovery

–Oracle Big Data Discovery的特征

–Oracle Big Data Discovery的优势

 

25课:介绍Oracle Big Data Appliance (BDA)

确定Oracle大数据设备

确定Oracle大数据设备的硬件和软件组件

 

26课:管理OracleBDA

安装DBA软件

确定用于监控BDA的可用工具

使用Oracle企业管理器监控BDA

使用Cloudera Manager管理各类操作

使用Hadoop管理工具

使用Cloudera HueCDH交互

启动和停止Oracle BDA

 

27课:平衡MapReduce作业

定义Oracle BDAPerfect Balance特征

使用Perfect Balance来平衡MapReduce作业

作为一个独立的工具来运行Job Analyzer或者Perfect Balance

识别、定位并读取生成的报告

使用Job Analyzer收集其它度量数据

配置Perfect Balance

使用chopping(值的分区)

解决运行Perfect Balance时作业的问题

使用Perfect Balance的示例

 

28课:保证数据安全

描述如何保证大数据应用中的数据安全

 

更多详细内容请登录网站查询:www.udbs.cn

 

西安优盛数据库技术中心

201510

关于我们 | 新闻中心 | 合作伙伴 | 联系我们 |
西安优盛信息技术有限公司  版权所有©2007-2018  陕ICP备07501629号
在线客服系统