PHPCMS帮助手册

SCWS分词扩展

中文分词引擎,它能将一整段的汉字基本正确的切分几个成词,从而更准确、快速的查找你搜索的内容! 在输入关键词尽量使用有语义的词语,如,“中国,系统,节日”

一、SCWS分词扩展----WIN

1、取得 scws(php_scws.dll for win32)
http://www.hightman.cn/bbs/showthread.php?tid=71&extra=page%3D1
2、取得scws(win版本,同时scws是分字符集和php对应的版本号),下载后解压到目录(如:C:\php5\scws)
打开php.ini 添加如下配置:
[scws]
scws.default.charset = "gbk" #数据库的字符集
scws.default.fpath = "C:\php5\scws" #scws的安装目录
重启你的apache服务器。现在看看是否配置成功。

位置:系统设置----网站配置----网站设置

二、SCWS分词扩展----linux

1. 取得 scws-1.0.0 的代码
    wget http://www.hightman.cn/down/logged/lscws-1.0.0.tar.gz
2. 解开压缩包
    [root@localhost ~]$ tar xvzf scws-1.0.0.tar.gz
3. 进入目录执行配置脚本和编译
    [root@localhost ~]$ cd scws-1.0.0
    [root@localhost ~]$ ./configure --prefix=/usr/local/scws
    make && make install
4. 顺利的话已经编译并安装成功到 /usr/local/scws 中了,执行下面命令看看文件是否存在
    [root@localhost ~]$ ls -al /usr/local/scws/lib/libscws.la
5. 试试执行 scws-cli 文件
    [root@localhost ~]$ /usr/local/scws/bin/scws -h
    scws (scws-cli/1.0.0)
    Simple Chinese Word Segmentation - Command line usage.
    Copyright (C)2007 by hightman.
    ...
6. 生成词典
在源代码目录树的 etc/ 目录下附上了词典的文本文件,编码为 GBK,使用前必须先转换成 xdb 格式。
假设您在 源码目录中,请执行
[root@localhost ~]$ /usr/local/scws/bin/gen_scws_dict -h 查看词典生成帮助,调用指令(-c用于指定编码, gbk或utf8):
[root@localhost ~]$ /usr/local/scws/bin/gen_scws_dict -c gbk -i etc/dict_chs_gbk.txt -o /usr/local/scws/etc/dict_chs_gbk.xdb
执行需要一段时间,最终生成可用的 xdb 文件于 /usr/local/scws/etc/ 中
注:如果您需要使用 utf8 编码,请事先将 dict_chs_gbk.txt 转换成 utf8 编码再调用 gen_scws_dict 来转换。
注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure --help 查看。
常用的三个选项为:
--prefix=< scws的安装目录>
--disable-mmap <这表示禁用 MMAP 来读取 xdb,在 debian, ubuntu 的部分 Linux 中建议关闭 mmap>
--enable-developer <这表示以开发者模式编译,主要是用于调试编译时加入了 -g 选项及部分标准输出的信息>
更多的了解请看目录里的 README文件

[PHP 扩展安装说明]
介绍安装方式,假设您已经将 scws-1.0.0 安装到/usr/local/scws 中或 $prefix 中。
安装此扩展要求您的 php 和系统环境安装了相应的 autoconf automake 工具及 phpize
phpize 是属于 php-devel 中的东西,主要是设定 php 外挂模块的一些设定
1. 进入源码目录的 phpext/ 目录
2. 执行 phpize (在PHP安装目录的bin/目录下)
3. 执行 ./configure --with-scws=/usr/local/scws
若 php 安装在特殊目录 $php_prefix, 则请在 configure 后加上
--with-php-config=$php_prefix/bin/php-config
4. 执行 make 然后用 root 身份执行 make install

5. 在 php.ini 中加入以下几行

[scws]
extension = scws.so
scws.default.charset = gbk
scws.default.fpath = $prefix/etc  #$prefix  swcs安装目录

6. 命令行下执行 php -m 就能看到 scws 了或者在 phpinfo() 中看看关于 scws 的部分

位置:系统设置----网站配置----网站设置

NetPc