资 源 简 介
專案改址
目前專案已更名為 - Crawlzilla
提供更多功能且更穩定的版本並更新於 http://code.google.com/p/crawlzilla/
說明
Nutch 是目前最知名也是最好的opensource 搜尋引擎專案之一,想製作自己的客製化搜尋引擎? 用Nutch就對了!
但是Nutch的設定繁瑣,因此我們之前試著開發 NutchEz 來幫助簡化安裝、設定以及操作的步驟
NutchEz 顧名思義就是Nutch Easy,只要安裝NutchEz後就,再加上幾個指令,就可以輕鬆的產生出你自己的搜尋引擎囉!
目前正開始第二版本的NutchEz v0.2 ,希望能開發出功能更強,選項更多,但操作更人性化的專案
適用於
已經有很多搜尋引擎了,為什麼我們還要自己建?[BR]
原因有兩點(以下內容取自於家裡敦雲端搜尋公司 ):
* 商業必然廣告
搜尋幾乎是現代人上網時必做的事項之一,各大入口網站也無不絞盡腦汁提供更貼近人性化的搜尋。好用的搜尋讓人如魚得水,難以割捨;不好用的則將怨聲載道,眾叛親離。讀者們或許有過如下經驗:使用某大商業搜尋引擎時,列出的結果總是塞了一堆行銷和廣告,我們得用眼睛過濾掉這些無用的資訊並多翻個幾頁才可能找到想要的資料。
當然我們不該指責這些提供搜尋的公司,公司本為了獲利而生存,在需獲利又不能跟使用者收費的前提下,勢必得提供廣告版面給買主,或是將廣告行為秘密地安插至搜尋結果中,但這些行為依舊會影響到使用者的操作便利性。其實搜尋引擎不必然非得由大公司把持,即使是個人網站或企業內部,也可建置出相當客製化的搜尋引擎,而不必屈就於商業搜尋引擎。
建立自己的搜尋
部份個人或企業內部在架設網站時或許有些機密資料並