第一章 单元测试

1、单选题:
以下哪个不是大数据分析的特征?( )
选项:
A:数据分析类型多
B:数据处理速度快
C:数据价值密度高
D:数据分析量大
答案: 【数据价值密度高

2、单选题:
以下哪些不属于大数据分析工具?( )
选项:
A:Spass
B:Illustrator
C:Spark
D:Hadoop
答案: 【Illustrator

3、单选题:
Spark SQL的前身是?( )
选项:
A:Shark
B:Apache Drill
C:Hive
D:Cloudera Impala
答案: 【Shark

4、单选题:
Spark SQL的核心组件是?( )
选项:
A:Core
B:Hive
C:Hive-Thriftserver
D:Catalyst
答案: 【Catalyst

5、多选题:
以下属于大数据分析类别的有?( )
选项:
A:诊断分析
B:描述性分析
C:预测性分析
D:规范性分析
答案: 【诊断分析;
描述性分析;
预测性分析;
规范性分析

第二章 单元测试

1、单选题:
能够把hdfs和yarn同时启动的命令是?( )
选项:
A:start-all.sh
B:start-dfs.sh
C:start-yarn.sh
D:start-hadoop.sh
答案: 【start-all.sh

2、单选题:
执行mapreduce jar包的命令是?( )
选项:
A:hadoop jar
B:hdfs dfs jar
C:java jar
D:java -jar
答案: 【hadoop jar

3、单选题:
下面哪个程序负责HDFS数据存储。( )
选项:
A:NameNode
B:secondaryNameNode
C:Jobtracker
D:Datanode
答案: 【Datanode

4、单选题:
HDFS中的block默认保存几份?( )
选项:
A:1
B:3
C:2
D:不确定
答案: 【3

5、单选题:
以下不属于Hadoop内核的组成部分的是?( )
选项:
A:HDFS
B:MapReduce
C:YARN
D:Hbase
答案: 【Hbase