1概述
大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。
能够读取关系数据库中的数据。
通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档
能够通过solr文档更新solr
提供 通过配置文件就能够导入所有数据的能力
能够配置 “完全导入”和“增量导入”的时间
让读取xml文件,并建立索引成为可配置。
能够将 其他的数据源(例如:ftp,scp,etc)或者其他格式的文档(Json,csv)以插件的形式集成到项目中。
2.3 导入xml文件
2.3.1 配置导入字段
在managed-schema文件中新增:
<field name="name"type="string" stored="true" indexed="true"omitNorms="false"/> <field name="isbn"type="string" stored="true" indexed="true"/>
2.3.2 编辑导入文件
<add overwrite="true" commitWithin="10000"> <doc> <field name="id">1</field> <field name="isbn">ABC1234</field> <field name="name" boost="2">Some Book</field> </doc> <doc boost="2.5"> <field name="id">2</field> <field name="isbn">ZYVW9821</field> <field name="name" boost="2">Important Book</field> </doc> <doc> <field name="id">3</field> <field name="isbn">NXJS1234</field> <field name="name" boost="2">Some other book</field> </doc> </add>
2.3.3 导入
进入 Solr目录,如:G:\solr\example\exampledocs目录;
java -Dtype=text/xml-Durl=http://localhost:8983/solr/solr_xml/update -jar post.jar book.xml
导入完成后可以在界面Query查询数据,如: