Weka 3 - Data Mining with Open Source Machine Learning Software in Java
Weka - Browse Files at SourceForge.net
実行時にコンソールが一瞬表示されるだけの場合は、インストールフォルダにあるRunWeka.batをコマンドプロンプトから実行し、エラーを確認します。そのとき「'javaw' は、内部コマンドまたは外部コマンド、…」のように表示されるならば、JREをインストールするか、すでにインストールされているならばパスを設定します。
インストールフォルダのRunWeka.iniを編集することで、設定を変更できます。
RunWeka.iniにある
fileEncoding=Cp1252
のエンコーディングの記述を、
fileEncoding=utf-8
などに修正し、読み込むファイルもそれに合わせます。
GUIからは、メニューの【Tools → Package manager】から起動できます。weka - How do I use the package manager?
| Applications | 用途 |
|---|---|
| Explorer | 基本 |
| Experimenter | 実験と検証 |
| KnowledgeFlow | |
| Workbench | |
| SimpleCLI |
| Tools | 機能 |
|---|---|
| ArffViewer | ARFFなどのWekaが対応するファイルの閲覧と編集 |
| SqlViewer | |
| Bays net editor |
フォーマットの不明なファイル形式は、適当なファイルをその形式で出力してみることで確認できます。
サンプルのデータが、インストールフォルダのdataフォルダ内にあります。
@relation relation-name
relation-nameは文字列で、スペースを含む場合には引用符で囲みます。
@attribute attribute-name datatype
datatypeは次の6つの形式がサポートされます。
{}で囲むとnominalと見なされ、そのデータは列挙した値または未知の値を示す「?」とする必要があります。もしそれ以外の値が含まれると、「nominal value not declared in header」として読み込みに失敗します。Nominal attributes - weka - ARFF (book version)
@relation airline_passengers @attribute passenger_numbers numeric @attribute Date date 'yyyy-MM-dd'airline.arff
@RELATION iris
@ATTRIBUTE sepallength REAL
@ATTRIBUTE sepalwidth REAL
@ATTRIBUTE petallength REAL
@ATTRIBUTE petalwidth REAL
@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}
iris.arff
@dataThe @data Declaration - weka - ARFF (book version)
CSV形式は、下表のようにARFF形式に対応します。
| ARFF | CSV |
|---|---|
@relation weather
@attribute outlook {sunny, overcast, rainy}
@attribute temperature numeric
@attribute humidity numeric
@attribute windy {TRUE, FALSE}
@attribute play {yes, no}
@data
sunny,85,85,FALSE,no
sunny,80,90,TRUE,no
overcast,83,86,FALSE,yes
data\weather.numeric.arff の一部
|
outlook,temperature,humidity,windy,play sunny,85,85,FALSE,no sunny,80,90,TRUE,no overcast,83,86,FALSE,yes |
このようにCSVは属性の名前だけを1行目に列挙し、型は指定できません。