5.5.2 自定义词库

ShopNC

5.5.2      自定义词库

系统使用的索引分词器默认为 scws,当内置的词库不能满足您的应用时,可以使用下面介绍的自定义词库功能,涉及的相关文件如下(假设 $prefix 是您的安装目录)

$prefix/etc/dict_user.txt

打开上述文件,文件开头已经有了相关注释和说明。这个文件就是自定义词库文件,如果您同一台机器上装有多个 xunsearch 服务端,那么每个服务端独自使用自己的自定义词典文件。

添加删除修改自定义词库只要编辑该文件即可,以下为相关规范:

     文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改

     每行一条记录表示一个词,每行包含 1~4 个字段,字段之间用空格或制表符(\t)分隔

     字段含义依次表示 “词语”,“词频(TF)”,“逆词频率(IDF)”,“词性(ATTR)

     后面三个字段如果省略依次使用 scws 的默认值

     特殊词性 ! 可用于表示删除该词

     自定义词典优先于内置词典加载和使用,以 # 开头的行为注释


Copyright ©2009 - 2014 shopnc.net.All rights reserved.
Powered By ShopNC