大数据hive/scala/python/java

公司信息: 广州地精网络科技有限公司
信息发布人: 李亚坤
详情

Hive数据仓库工具将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。通过类SQL语句实现快速MapReduce统计,使MapReduce编程变得更加简单易行。


Hive应用场景


总的来说,Hive是十分适合数据仓库的统计分析和Windows注册表文件。


Hive在Hadoop中扮演数据仓库的角色。Hive添加数据的结构在HDFS(Hive superimposes structure on data in HDFS),并允许使用类似于SQL语法进行数据查询。


Hive更适合于数据仓库的任务,主要用于静态的结构以及需要经常分析的工作。Hive与SQL相似促使其成为Hadoop与其他BI工具结合的理想交集。


Hive使用


Hive在Hadoop之上,使用Hive的前提是先要安装Hadoop。