scikit-learnのSVMを使った入門編としてXOR演算を学習させる（Pythonによるスクレイピング＆機械学習テクニック） - 俺人〜OREGIN〜俺、バカだから人工知能に代わりに頑張ってもらうまでのお話

今回は、scikit-learnのSVMを使って、入門編としてXOR演算を学習させました。ついに機械学習の章に入ってきて、テンションも上がります。最近実践中心だったので、基礎からもう一度学び直したいと思います。

Pythonによるスクレイピング＆機械学習開発テクニック増補改訂 Scrapy、BeautifulSoup、scik [ クジラ飛行机 ]の第４章を参考にさせていただきながら、取り組んでいます。

環境構築については、Dockerを使われる方は、以下をご参照ください。

oregin-ai.hatenablog.com

OSから、Ubuntuを導入して取り組む方は、以下をご参照ください。

oregin-ai.hatenablog.com

では、振り返っていきたいと思います。

scikit-learnのSVMを使ってXOR演算を学習させる。

scikit-learnのSVMを使ってXOR演算を学習させる。

1.scikit-learnとは何か

scikit-learnは、Pythonで提供されている機械学習のフレームワークです。scikit-learnでは、機械学習用の様々なツールが用意してあり、教師あり学習の分類や回帰から、教師なし学習のクラスタリングや次元削減まで、手軽に実施することができます。また、ツールだけでなく機械学習を試すためのサンプルデータも用意されているところが嬉しいです。

インストールされていない場合は、以下でインストールできます。

pip3 install scikit-learn

公式サイトは、以下にありますので、必要に応じご参照ください。

scikit-learn.org

2.全体像

では、入門編として、単純なXOR演算を学習するモデルを作成して行きます。

XOR演算は、図1.のように両方とも０または両方とも１の時は０を出力し、どちらか片方が０でもう片方が１の場合は１を出力する演算です。

これは、入力PとQの組み合わせにより、出力が１、０に分類される、分類問題と捉えることができます。

f:id:kanriyou_h004:20200510144243p:plain — 図1.XOR演算

上記の入出力データを訓練データとして学習し、XORの処理が行えるモデルを構築します。

コード全体は以下の通りで、「xor-train.py」に保存しました。

from sklearn import svm

# (1)XOR の演算結果（訓練データ）の作成
xor_data = [
#P, Q, result
[0, 0, 0],
[0, 1, 1],
[1, 0, 1],
[1, 1, 0]
]

#(2)学習するためにデータとラベルに分割
data =
label =
for row in xor_data:
p = row[0]
q = row[1]
r = row[2]
data.append([p,q])
label.append(r)

#(3)学習を実施
clf = svm.SVC()
clf.fit(data, label)

#(4)データを予測
pred = clf.predict(data)
print('予測結果:', pred)

#(5)予測結果がラベルと合っているか確認
ok = 0

total=0
for idx, answer in enumerate(label):
p = pred[idx]
if p == answer: ok += 1
total +=1

print('正解率:', ok, '/', total, '=', ok/total)

では、コードを順番に見ていきます。

3.XOR の演算結果（訓練データ）の作成

XOR演算の結果を訓練データとして格納します。今回は、pandasを使わず、入力データと出力データの組み合わせを一つのリストとして、それぞれの組み合わせをさらにリストにする入れ子形式のリストを作成しています。

xor_data = [
#P, Q, result
[0, 0, 0],
[0, 1, 1],
[1, 0, 1],
[1, 1, 0]
]

4.学習するためにデータとラベルに分割

先ほど作成したxor_dataを、学習用のデータと、正解のラベルに分割します。

最初からデータとラベルを分けていないのは、実際の業務や、kaggleなどのコンペでは、あらかじめ正解ラベルがあるわけではなく、一連のデータの中から、求める目的変数を特定して訓練データと正解ラベルに分ける処理が基本になるので、その処理も含めています。（実際はpandasで扱うので、for文を書くことはほとんど無いですが。）

今回の分割では、for文でxor_dataから、１行ずつ入出力の組み合わせを取り出して、入力データをdataに追加（append）、出力データをlabelに追加しています。