什么是Ruby on Rails的一个很好的PDF到HTML转换器?

前端之家收集整理的这篇文章主要介绍了什么是Ruby on Rails的一个很好的PDF到HTML转换器?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在尝试将程序化PDF转换为 HTML.到目前为止,我一直在使用 pdftohtml,但我们的用户对结果不满意.

这就是我需要的:

>我在使用Ruby on Rails,但在Unix上工作的任何工具都可以正常工作,因为我可以从命令行调用它.但当然,一个好的宝石或插件将是完美的.
>我更喜欢它是开源的
>它需要能够处理图像
>如果有需要的话可以放弃图像,这将是很好的
>需要稳定
>它需要返回html的布局靠近原来的pdf(我试过pdftohtml,结果不是很好的情况)

解决方法

这里有几个更多的替代pdftohtml / xpdf:

> Adob​​e有一个免费的在线PDF到HTML或文本conversion service.可能需要一两分钟才能将文档恢复,但我怀疑这个选项会给你最好的结果.
>有一个pdf-reader红宝石宝石,可以让您访问PDF文件的内部.这将涉及到您的一些开发/扩展,但您可以使用它来解析PDF文件生成漂亮的HTML.如果您知道用户提前转换的文件类型(例如,如果他们正在使用标准化表单),这可能比听起来更容易.
>如果您使用ghostscript(gem在这里找到)将PDF转换为另一种格式,您可能会有更多的选择.宝石可以从PDF文件生成图像(png,jpg等),但是您可能将最好的运气转换成PostScript文件,因为似乎有一个十亿“PostScript到[insert format here]”转换器.

猜你在找的Ruby相关文章