我有一些
XML文件包含研究项目的数据,我需要运行一些统计数据.数据量接近100GB.
结构不是那么复杂(可能映射到关系模型中的10个表),并且考虑到问题的性质,这些数据永远不会再次更新,我只需要在易于运行查询的地方使用它上.
我已经阅读过有关XML数据库的信息,以及在其上运行XPATH风格查询的可能性,但我从未使用它们,而且我对它不太满意.将数据放在关系数据库中将是我的首选.
所以,我正在寻找一种方法将存储在XML中的数据转换为关系数据库(想想一个类似于MysqLdump生成的大型.sql文件,但其他任何东西都可以).
最终目标是能够运行SQL查询来处理数据.
经过一些研究,我几乎确信我必须自己写.
但我觉得这是一个普遍的问题,因此应该有一个已经做到这一点的工具.
那么,您知道任何将XML数据转换为关系数据库的工具吗?
PS1:
我的想法是这样的(它可以以不同的方式工作,但只是为了确保你得到我的观点):
>分析数据结构(基于XML本身,或在XSD上)
>基于该结构构建关系数据库(表,键)
>生成sql语句以创建数据库
>生成sql语句以创建数据填充
PS2:
我在这里看过some posts,但我仍然无法找到解决方案.
微软的“Xml Bulk Load”工具似乎在这方面做了一些事情,但我没有MS sql Server.
数据库不是搜索数据的唯一方法.我强烈推荐
Apache Solr
> Strategies to Implement search on XML file
将原始数据保存为XML并使用Solr索引进行搜索