2013年11月18日 星期一

資料探勘軟體Weka之安裝篇

最近在準備資料探勘相關課程,為了讓大家能快快上手玩資料,這邊就寫整理一篇Weka的安裝篇給大家。


Weka是以Java為基礎的資料探勘(Data mining )(Machine learning)軟體,也是自由軟體(Open Source Software)Weka全名為懷卡托智能分析環境(Waikato Environment for Knowledge Analysis),而Weka同時也是紐西蘭(New Zealand)的特有種鳥名,而開發者也是來自紐西蘭的懷卡託大學(The University of Waikato)
(圖片來源:網路)


Weka整合了大量的資料探勘的演算法,因此在2005年第11ACM SIGKDD國際會議上,Weka小組獲得了資料探勘與知識探索的最高服務獎(2005 ACM SIGKDD Service Award)。

首先我們先到Weka官方網頁中下載Weka 3.6版本,依據個人電腦版本(Windows x86Windows x64Mac OS XLinux)來做下載,本篇範例是下載Windowsx86包含Java VM 1.7的版本,大約51MB

進入安裝畫面後,跟一般軟體安裝一樣,非常簡單,Next, Next....Next!!
按下「Next

按下「I Agree

按下「Next

按下「Next

按下「Install」,就開始安裝!!


接下來是安裝 Java,如果您確定電腦有就可以跳過,如果不確定就繼續安裝。



 再回到剛剛的安裝畫面,按下「Next」。

按下「Finish」,就可看到Weka的畫面了! 

Weka 工具畫面,請點選「Explorer



 接下來還沒完,由於我們探勘的資料集大部分都是華文為主,直接放到Weka裡面會發生下面亂碼悲劇。
因此要進行中文資料的參數調整。


首先我們要到Weka的資料夾中找尋RunWeka.ini的文件,使用記事本開啟。


接著在密密麻麻的文字中找 fileEncoding=Cp1252
接著將Cp1252 換成 UTF-8後儲存,接下來將Weka重新啟動即可。

提供大家測試資料做測試,若顯示下面畫面,表示您已更改成功!!


Weka如有無法啟動的問題,表示環境變量需設定,如下:
PATH:C:\Program Files\Java\jre7\bin


延伸閱讀:
Data Mining: Practical Machine Learning Tools and Techniques, Third Edition
台灣生活資料科學培養計畫 Data Science Program