频道导航

使用R / RCurl高效下载大文件

2020-07-01 Linux 前端之家

前端之家收集整理的这篇文章主要介绍了使用R / RCurl高效下载大文件，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我看到许多使用RCurl下载二进制文件的例子就像这样：

library("RCurl")
curl = getCurlHandle()
bfile=getBinaryURL (
        "http://www.example.com/bfile.zip",curl= curl,progressfunction = function(down,up) {print(down)},noprogress = FALSE
)
writeBin(bfile,"bfile.zip")
rm(curl,bfile)

如果下载量非常大,我认为最好将它并入存储介质,而不是将其全部存储在内存中.

在RCurl文档中,有一些例子可以通过块获取文件,并在下载文件时对它们进行操作,但它们似乎全部引用为文本块.

你能给一个工作榜样吗？

UPDATE

用户建议对于二进制文件使用带有mode =’wb’选项的R本机下载文件.

在许多情况下,本地函数是一个可行的替代方案,但是有一些这种本机函数不适用的用例(https,Cookie,表单等),这就是RCurl存在的原因.

解决方法

这是工作的例子：

library(RCurl)
#
f = CFILE("bfile.zip",mode="wb")
curlPerform(url = "http://www.example.com/bfile.zip",writedata = f@ref)
close(f)

它将直接下载到文件.返回的值将是(而不是下载的数据)请求的状态(0,如果没有发生错误).

提到CFILE在RCurl手册上有点简洁.希望将来会包括更多的细节/例子.

为了方便起见,将相同的代码作为函数打包(并使用进度条)：

bdown=function(url,file){
    library('RCurl')
    f = CFILE(file,mode="wb")
    a = curlPerform(url = url,writedata = f@ref,noprogress=FALSE)
    close(f)
    return(a)
}

## ...and now just give remote and local paths     
ret = bdown("http://www.example.com/bfile.zip","path/to/bfile.zip")

上一篇：如何在Linux下生成系统范围的唯一I 下一篇：如何使用不同颜色的不同字段打印aw

猜你在找的Linux相关文章

文件查找---find

文件查找（find） 1 find 简单的说，就是实时查找指定的内容或条件。特点：最新、最快、最...

作者：Sunzz 时间：2024-09-28

非交互式添加分区

非交互式添加分区方法一添加/deb/sdb 下的分区，其实位置为1到1000M，第二个分区位置为1...

作者：Sunzz 时间：2024-09-28

编译安装httpd

编译安装httpd 1 去官网下载源码包为避免非法软件，一定要去官网下载http://www.apache.o...

作者：Sunzz 时间：2024-09-28

磁盘分区-gdisk用法

gdisk用法 gdisk - InteractiveGUIDpartitiontable (GPT) manipulator GPTfdisk (akagdisk...

作者：Sunzz 时间：2024-09-28

Linux常用快捷按键

1 一定用快捷键这里简单的说下几个常用的快捷按键。 1.1 移动光标快捷键 Crtl + a 光...

作者：Sunzz 时间：2024-09-28

文件的压缩与解压

文件的压缩与解压常用命令和参数 1 gzip -c 将压缩或解压的结果输出至标准输出 -d 解压缩...

作者：Sunzz 时间：2024-09-28

合并 CentOS 6.8 的两个ISO镜像

合并 CentOS 6.8 的两个ISO镜像 1、创建相关目录：说明： /mnt/dvd1和/mnt/dvd2 用于挂载...

作者：Sunzz 时间：2024-09-28

常用的文件查看命令

常用的文件查看命令 1 cat 常用参数 -n 显示行号 -E 显示行尾结束符 $ -b 显示非空行编号 ...

作者：Sunzz 时间：2024-09-28

mount 1 挂载mount 基本概念挂载：将额外文件系统与根文件系统现存的目录建立起关联关系，...

作者：Sunzz 时间：2024-09-28

部署DNS服务

DNS，全称Domain Name System，即域名解析系统。 DNS功能主机名到IP地址的映射有两种方式...

作者：Sunzz 时间：2024-09-28

编程分类

Linux Windows CentOS Ubuntu Nginx WebService Scala Memcache Apache Redis Docker Bash Azure Tomcat LNMP Shell 数据结构服务器运维网络安全

最新文章