我需要解析大小为40GB的
XML文件,然后进行规范化,并插入到
MySQL数据库中.我需要在数据库中存储多少文件不清楚,我也不知道XML结构.
@H_403_1@我应该使用哪种解析器,你会怎么做呢?
在
PHP中,您可以使用
XMLReader
Docs读取极大的XML文件:
$reader = new XMLReader(); $reader->open($xmlfile);@H_403_1@极大的XML文件应以压缩格式存储在磁盘上.至少这是有道理的,因为XML文件具有高压缩比.例如gzipped像large.xml.gz. @H_403_1@PHP通过compression wrappersDocs很好地支持XMLReader:
$xmlfile = 'compress.zlib://path/to/large.xml.gz'; $reader = new XMLReader(); $reader->open($xmlfile);@H_403_1@XMLReader允许您“仅”操作当前元素.这意味着它只是前瞻性的.如果你需要保持解析器状态,你需要自己构建它. @H_403_1@我经常发现将基本运动包装到一组迭代器中会很有帮助,这些迭代器知道如何在XMLReader上操作,就像只迭代元素或子元素一样.您可以在Parse XML with PHP and XMLReader中找到这个概述. @H_403_1@另见: @H_403_1@> PHP open gzipped XML