我正在使用维基百科主题的名称为我的全文索引实验创建一个模型.
我在“主题”(遗留)上设置和索引,并对“美国”进行全文搜索:
start n=node:topic('name:(united states)') return n
第一批结果根本不相关:
'List of United States National Historic Landmarks in United States commonwealths and territories,associated states,and foreign states'
[…]
实际的“美国”被埋在了名单的深处.
因此,它提出了这样的问题:为了在结果上找到最佳匹配(例如levershtein,bi-gram等算法),首先必须获取与模式匹配的所有项.
这将是一个严重的约束,因为在这种情况下我有21K行,约4秒.
neo4j使用哪种算法来订购全文搜索(START)的结果?
它使用哪种理由对结果进行排序以及如何使用cypher对其进行更改?
在doc中编写使用JAVA api来应用sort() – 有一个教程可以指定修改哪些文件,并且在任何调整之前知道使用哪个排名基础是非常有用的.