我想在工作中使用大数据分析.我已经实现了在容器内创建容器的所有docker东西.但是,我是大数据的新手,当速度很重要时(对吗?),使用Hadoop for HDFS并在Hadoop本身上使用Spark而不是MapReduce是网站和应用程序的最佳方法.这可以在我的Docker容器上工作吗?如果有人可以指引我到其他地方去学习,这将非常有帮助.
最佳答案
您可以尝试使用Cloudera QuickStart Docker Image入门.请查看https://hub.docker.com/r/cloudera/quickstart/.此Docker映像支持Cloudera Hadoop平台和Cloudera Manager的单节点部署.此外,此docker映像也支持spark.