大数据案例之HDFS-HIVE-Spark

发现Hive后台使用MapReduce作为执行引擎，实在是有点慢.几十万数据查询了10+秒，上千万数据查询了100+秒。

还是单纯查询没有附加任何条件。Hive作为数据仓库是不错的选择，单表支持几十亿数据库存储。

对于查询来说，我想就需要考虑其他的MapReduce查询方式了。这里考虑学习SparkSql。

原因的话就让我们一起来学习，认识吧。

推荐管理Hive数据库软件 Aginity Workbench for Hadoop

推荐管理Hive数据库软件 `Aginity Workbench for Hadoop`