频道导航

Ubuntu 下安装sparklyr 并连接远程spark集群

2020-06-24 Ubuntu 前端之家

前端之家收集整理的这篇文章主要介绍了Ubuntu 下安装sparklyr 并连接远程spark集群，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

安装sparklyr

1.通过devtools包实现sparklyr包的安装：

install.packages("devtools")
devtools::install_github("rstudio/sparklyr")

出现问题：安装不上，因为Ubuntu中需要安装一些包

$ sudo apt-get install libcurl4-openssl-dev libssl-dev

2.在本地安装spark

library(sparklyr) spark_install(version = "2.1.0"，hadoop_version="2.7")

3.设置JAVA，SPRK，SPRK_VERSION环境变量

Sys.setenv(JAVA_HOME='/home/haoyu/jdk1.7')
Sys.setenv(SPARK_HOME='/home/haoyu/spark/spark-2.1.0-bin-hadoop2.7')
Sys.setenv(SPARK_VERSION='2.1.0')

4.连接本地spark

install.packages("dplyr")
library(dplyr) sc <- spark_connect(master = "local")

5.连接远程spark

sc <- spark_connect(master="spark://192.168.20.172:7077")

注意：之前如果设置了环境变量的话，就直接使用以上语句就行，否则的话得在函数里添加环境变量的参数。
6.读取HDFS文件，并放进spark集群中

ccf_online_stage1_train <- spark_read_csv( sc,name="online_trian", path="hdfs://192.168.20.172:900/haoyu_data/O2O/ccf_online_stage1_train.csv", charset="utf-8" )

上一篇：Ubuntu + VTK-5.8.0 下一篇：apt-get update 失败 ubuntu:Tempo

猜你在找的Ubuntu相关文章

学linux,从Ubuntu开始

1.安装过程出现0x00000000指令引用的0x00000000内存该内存不能为written 如果你安装的是in...

作者：前端之家时间：2020-12-29

ubuntu16.04获取root权限并用root用户登录

写在全面：如果根据以下教程涉及到只读文件需要更改文件权限才能需修改文件内容，参考我的...

作者：前端之家时间：2020-12-12

ubuntu18.04获取root权限并用root用户登录

写在前面：以下步骤中需要在终端输入命令，电脑端查看博客的朋友可以直接复制粘贴到终端，...

作者：前端之家时间：2020-12-12

ubuntu16.04和18.04更换国内源

ubuntu16.04和18.04更换国内源写在前面：安装好ubuntu双系统后，默认的软件更新源是国外的...

作者：前端之家时间：2020-12-12

ubuntu双系统启动时卡死解决办法

ubuntu双系统启动时卡死解决办法（在ubuntu16.04和18.04测试无误）问题描述：在安装完ub...

作者：前端之家时间：2020-12-12

Ubuntu安装ssh

作者：前端之家时间：2020-07-20

Ubuntu报“xxx is not in the sudoers file.This incident will be reported” 错误解决方法

作者：前端之家时间：2020-07-20

ubuntu-make | Ubuntu Linux一键安装开发环境

-- 作者谢恩铭转载请注明出处内容简介什么是ubuntu-make 安装最新版ubuntu-make 用ubu...

作者：前端之家时间：2020-07-20

Ubuntu 17.04（Zesty Zapus）正式发布，可以下载使用了

今天，2017 年 4 月 13 日，Canonical 官方发布了 Ubuntu 17.04（Zesty Zapus）的最终版。...

作者：前端之家时间：2020-07-20

Ubuntu 为钱而放弃 Unity ？ Linux 社区的反应

（点击上方公众号，可快速关注）编译：伯乐在线/黄小非如有好文章投稿，请点击 → 这里...

作者：前端之家时间：2020-07-20

编程分类

Linux Windows CentOS Ubuntu Nginx WebService Scala Memcache Apache Redis Docker Bash Azure Tomcat LNMP Shell 数据结构服务器运维网络安全

最新文章