提取网页内容,去掉标签,去掉无用链接,主要服务于自然语言处理中对网页内容要求的应用。...
资 源 简 介
提取网页内容,去掉标签,去掉无用链接,主要服务于自然语言处理中对网页内容要求的应用。
-extract the content of the sites and remove labels, eliminating useless links, major service on natural language processing of web content requirements of the application.
文 件 列 表
WebExtract
Debug
Extract.cpp
Extract.h
Navy_memo.doc
Navy_memo.txt
ReadMe.txt
StdAfx.cpp
StdAfx.h
WebExtract.cpp
WebExtract.dsp
WebExtract.dsw
WebExtract.ncb
WebExtract.opt