Apache Hive 使用 HDFS 时为什么也需要配置 MySQL 数据库?

2020-05-20 21:50:29 +08:00
 DGideas
大家好,我最近刚接触 Hadoop (及其周边组件)。

在我根据《 Hadoop 权威指南 第四版》 P476 以及网上其他教程安装配置 Hive 的时候,我注意到类似于这篇博客( http://www.meilongkui.com/archives/1561 )提到的情况:即需要配置 MySQL 或其他数据库才能使用 Hive 。

我的问题是既然 Hive 能使用 HDFS 作为数据仓库,为什么还要额外配置其他数据库才能使用呢?我使用的 Hive 版本是 3.1.2,Hadoop 版本为 3.2.1 。

这个问题我在 Hive 官网上找了找文档和说明,感觉 Hive 官网上说明性的东西好少……用英文在 Google 搜索也没有相关结果,遂在 V2EX 上提问,简单问题,望大佬轻喷。

补充:我注意到类似( https://blog.csdn.net/seaReal1/article/details/80073931 )的解答,但是感觉并不是很懂,也不确认讲得对不对
1580 次点击
所在节点    问与答
6 条回复
min
2020-05-20 22:12:22 +08:00
DGideas
2020-05-20 22:16:31 +08:00
@min 非常感谢!
gengz
2020-05-21 11:19:11 +08:00
因为需要一组数据去描述你的数据(元数据),至于你怎么去维护这组元数据,可以是文件,可以是数据库,也可以是自己( rdms 的元数据就是自己本身存储)。
HEROic
2020-05-21 12:41:27 +08:00
不是有内置小 derby 数据库嘛。。 可以不配置的
DGideas
2020-05-21 13:04:38 +08:00
@HEROic 我这边按照 Hive 官网的 Getting Started Guide ( https://cwiki.apache.org/confluence/display/Hive/GettingStarted )中 Running Hive 一小节做的配置,但是报 FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 错误
DGideas
2020-05-21 13:06:53 +08:00
@HEROic 感谢,我可能没理解对,我自己再配置下 Apache Derby 试试~

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/673780

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX