资 源 简 介
This is an implementation of MMSEG Chinese segmentation algorithm, wrapped as a PHP extension. It also provides some basic string pattern searching functions based on double-array trie tree.
一点历史
这个project大约是09年初开始做的,很快就形成了现在版本的样子,后陆续做了一些小修改和修复了一些小bug,现整理了一下决定发布。把它open source的主要原因,就是希望这个小工具能对大家有用,并且能够参与进来一起把它做的更好
20101025
Change Log
20130509 0.0.9 released fixed an issue when compiler uses strict type checking
20101108 0.0.8 beta,加入xs_simhash和xs_hdist函数,分别计算simhash和汉明距离。
关于xsplit的交流,请到xsplit贴吧: http://tieba.baidu.com/f?kw=xsplit 参与讨论。
xsplit是一个PHP扩展,提供基于MMSEG算法的分词功能。目前只在linux下测试并部署过,希望有朋友可以帮忙编译提供windows下的dll。
xsplit只处理UTF8编码格式,如果是其他编码格式,请在使用前自行转换
xsplit主要有以下几个函数:
```
bool xsbuild ( array $words, string $dictfile )
resource xsopen (string $dictfile [, bool $persistent])
array xssplit ( string $text [, int $splitmethod =