资 源 简 介
整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别,
教育类包括31篇文档,
商业与经济类有93篇文档,
计算机与因特网102篇文档,
娱乐与休闲166篇文档,
自然科学有208篇文档。
目录“DataSet”:RawText中的文本分词后保存在DataSet目录。
数据表“WordsTable”:保存DataSet中所有文本的倒排文档。
其中“目录DataSet”和“DataBase.mdb”为实验测试所必须