我已经尝试过Amazon为EMR实例提供的
JSON SerDe,如果您需要将JSON字典字段地址/映射到列,则效果很好.但是我无法想象如何对JSON数组做同样的事情.例如,如果有一个JSON数组,如下所示:
[23123.32,“Text Text”,{ “key1”: “value1” } ]
有没有办法将数组的第一个元素映射到Hive表中的列?嵌入式字典字段怎么样?
解决方法
我一直在努力解决同样的问题,直到我在github上找到这个serde –
https://github.com/rcongiu/Hive-JSON-Serde 只需在启动配置单元时使用“add jar”命令将其包含在内,它就像魅力一样.
https://github.com/rcongiu/Hive-JSON-Serde 只需在启动配置单元时使用“add jar”命令将其包含在内,它就像魅力一样.