我的公司通过Excel从外部公司接收数据.我们将其导出到sql Server以运行数据报告.他们现在正在改为PDF格式,有没有办法可靠地从PDF中移植数据并将其插入我们的sql Server 2008数据库?
解决方法
这完全取决于他们如何在PDF中包含数据.一般来说,这里有两种可能的情况:
>数据只是PDF中的文本对象.您需要使用工具从PDF中提取文本,然后将其插入数据库.
>数据包含在PDF中的表单字段中.您需要使用工具从表单字段中提取数据并将其插入数据库.
希望场景#2适用于您,因为这正是PDF表单的设计目的.场景#1实际上只是一个你只能使用的黑客,如果你没有任何其他选择.从PDF中提取纯文本并不像您预期的那样简单或准确.
如果您正在收到PDF表单,那么您需要做的就是将PDF表单中的正确字段与数据库中的相应字段匹配,然后填入数据.如果您编写自己的应用程序,此过程可以完全自动化.
Would this require writing an app or
is there an automated way of doing
this?
是的,这两个选项都需要编写应用程序或购买应用程序.如果您编写自己的应用程序,则需要找到支持从表单字段检索数据或从PDF中提取文本的第三方PDF库.