资 源 简 介
smallseg -- 开源的的轻量级的中文分词工具包
特点:可自定义词典、速度快、可在Google App Engine上运行。
分词效果在线演示:
https://smallseg.appspot.com/smallseg
友情链接:结巴分词
https://github.com/fxsjy/jieba
例子:
```
cuttest("这是一个伸手不见五指的黑夜。我叫孙悟空,我爱北京,我爱Python和C++。")
cuttest("我不喜欢日本和服。")
cuttest("雷猴回归人间。")
cuttest("工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作")
cuttest("我需要廉租房")
cuttest("永和服装饰品有限公司")
cuttest("我爱北京天安门")
cuttest("abc")
cuttest("隐马尔可夫")
cuttest("雷猴是个好网站")
cuttest("“Microsoft”一词由“MICROcomputer(微型计算机)”和“SOFTware(软件)”两部分组成")
cuttest("草泥马和欺实马是今年的流行词汇")
cuttest("伊藤洋华堂总府店")
cuttest("中国科学院计算技术研究所")
cuttest("罗密欧与朱丽叶")
Load dict...
Dict is OK.
这是 一个 伸手不见五指 黑夜 我叫 孙悟空 我爱 北京 我爱 Python C++
================================
我 不喜欢 日本 和服
================================
雷猴 回归 人间
================================
工信 信处 女