最近一个多礼拜,通过对基于Postgresql的全文检索的安装和使用。发现一个问题: 就是中文分词技术还是很难的,包括分词的技巧和如何进行分词。例如: “2011新款”这个词,使用bamboo时,该分词建立索引有两种形式分别为2011、新款;2011、新、款。 如果在查询时,这个"2011新款"词,将只能查出其中的一条记录。 待续……