Digital Evolution Laboratory driven by Public Health Initiative

オンラインAI自習教材ガイド

はじめに

人工知能を実現する方法として，今までいくつかの方法が開発されてきました．たとえば，「全ての人間は，死ぬ」，「ソクラテスは人間である」と教えると，「ソクラテスは，死ぬ」と答えるプログラムがあるとします．こうしたプログラムは，知的な振る舞いをするため，人工知能と呼べるかも知れません．こうしたプログラムにいろいろな知識を教えると，「とある病気において，患者が死ぬかどうか」を答えてくれるプログラムが実現するかも知れません．
しかし，人工知能の長い研究の結果，明らかとなったのは，そうしたプログラムが実用的な動作をするようになるまでには判断の根拠となる膨大な医学知識を整備する必要があるという点でした．そして，医学知識の理解にはより一般的な知識の整備も求められることから，その編纂に要するコストも膨れ上がり，およそ実用的でない水準となることが明らかとなりました．こうして，期待されたほど実用的なアプリケーションが実現しなかったことから，人工知能技術への関心は長らく停滞することになりました．
その後，人工知能が再び脚光を浴びるようになった背景には，いくつかの技術革新がありました．まず，コンピュータが知的な振る舞いをする上で必要になる知識を人間が教えるのではなく，問題を単純化することによって，機械が自ら学ぶことが可能となりました(機械学習)．また，人間の脳に含まれる神経網をモデルとしたニューラルネットワーク技術が発展し，様々な実用的なアプリケーションが実現しました(いわゆるディープラーニング)．さらに，コンピュータの性能一般が向上したことに加えて，機械学習やディープラーニングに求められる計算に特化した演算回路(GPU)が安価に入手可能となりました．

以上の結果，人工知能技術が，再び社会の注目を集めるようになりました．コンピュータ囲碁が，人間のトッププロに勝てるようになったことを聞いた方もおられるでしょう．自動運転車や医療用人工知能についてのニュースも，数多く聞かれます．そうした現在の人工知能技術の核にあるのが，与えられたデータから法則性を学びとる，機械学習と称される一連の手法です．このページでは，人工知能について自習してみたいとお考えの方のために，最適な教材を探り当てるお手伝いを試みます

次の質問に答えて適切な教材を探しましょう

Q. 人工知能を学ぶ目的は何ですか？

一般的な概要について
知りたいプログラミングを通して
実践してみたい仕組み・アルゴリズム・理論
について理解を深めたい

ふさわしい教材の選定のために，数学とプログラミングの能力についてチェックしてみましょう．
AIの中に機械学習という分野がありますので，その典型的な例として「回帰」の問題を考えてみましょう

回帰の具体例として，身長から体重を推定したい，塩分摂取量から血圧を推定したい，といった問題があります．
2つの実数の組のデータが $\{(x_1,~ y_1),~ (x_2,~ y_2),~ \cdots,~ (x_n,~ y_n)\}$ の$n$個あるとします． $x$を説明変数，$y$を目的変数といいます．これらのデータの分布が右の図のようになっていたとします．この図をみると，データを直線であてはめることができそうです．つまり，データの背後に比例関係という「法則」がありそうです．

人工知能・機械学習と回帰の
関係が分からない引き続き回帰の
問題を考える

「人工知能」という語句から，人間の知性を代替する機械についての驚異的な技術を想像される方がいるかもしれません．しかし技術的手法の基本的な考え方は，それほど難解というわけではありません．実は「回帰」の問題の中にそのエッセンスがつまっているのです．まずは，人工知能についての概説書を手に取られて，そのあたりのところを実感していただくのもよいかと思われます．

Q. 次の文章内の数式を理解できますか？

実際に直線$y=wx+b$でフィッティングして，与えられていない未知のデータ$x$から$y$を予測できるようにします．実測データ$y_i$とモデルからの予測値$wx_i+b$のずれ（誤差）が最小になるようにモデルパラメータ$w,~ b$を求めます．これを機械学習では「学習」といいます．ここでは，「損失関数」
$\displaystyle\quad L=\sum (wx_i+b-y_i)^2\qquad\qquad$ (1)
が最小になるという条件を採用します． $L$を$w$と$b$のの関数と考えると，$L$が最小（極小）になる
$\displaystyle\quad \frac{\partial L}{\partial w}=0\qquad\qquad$ (2)
$\displaystyle\quad \frac{\partial L}{\partial b}=0\qquad\qquad$ (3)
という条件から，$w$と$b$の連立方程式
$\displaystyle\quad (\sum x_ix_i)w + (\sum x_i)b - \sum x_iy_i=0\qquad\qquad$ (4)
$\displaystyle\quad (\sum x_i)w + nb - \sum y_i=0\qquad\qquad$ (5)
が得られ，これを解くと
$\displaystyle\quad w=\frac{n\sum x_iy_i - \sum x_i \sum y_i}{n\sum x_i^2-(\sum x_i)^2}\qquad\qquad$ (6)
$\displaystyle\quad b=\frac{n\sum x_i^2 \sum y_i - \sum x_i \sum x_iy_i}{n\sum x_i^2-(\sum x_i)^2}\qquad\qquad$ (7)
となります．
求めたパラメータを用いて直線を引くと右の図ようになります．以上の方法を最小二乗法といい，パラメータが解析的に求まりました．より複雑な問題の場合，「勾配法」を用いて損失関数を最小化しパラメータを決定します．
最後に統計学との関連を述べておきます．実測値と予測値のずれ$\epsilon_i = y_i-wx_i-b$が平均$0$，分散$\sigma^2$の正規分布
$\displaystyle\quad P(\{y_i\}|\{x_i\},~ w,~ b)=\frac{1}{(\sqrt{2\pi \sigma^2})^n}\exp(-\frac{1}{2\sigma^2}\sum (y_i-wx_i-b)^2)\qquad\qquad$ (8)
に従っているものと仮定します．これは，モデルパラメータが与えられたときにデータが得られる条件付き確率であり，「尤度」といいます．先ほど設定した損失関数最小の条件は尤度が最大になる条件と一致します．

式(1)の段階で
数式が分からない

誤差の2乗和を求めています

（高校数学B 数列の和）

式(2)，(3)の段階で
数式が分からない

損失関数の偏微分を計算しています

合成関数の微分の理解も必要です

（大学初年度微分積分学）

式(4)-(7)の段階で
数式が分からない

連立方程式を解いています

（大学初年度線型代数学）

式(7)までは分かる

Q. 以下は回帰の問題を扱うPythonプログラムの冒頭部分ですが，何を実行しようとしているか分かりますか？

import numpy as np xmin = 0.0 xmax = 10.0 n=20 x_data = np.linspace(xmin,xmax,n) y_data = x_data*2 + 5 + np.random.randn(n)

すべての行を理解できないいくつかの行は理解できる分からない行があるが
想像で補えるすべての行を説明できる

PythonライブラリのNumpyを読み込み， $0\le x\le 10$の範囲を$20$等分した$x$の座標を配列として確保し，各点で$y=2x+5$を計算しさらに平均0標準偏差1の正規分布に従う乱数を $y$に加えています．

「回帰」の問題を概観しましたが，ここに出てきた考え方は機械学習・深層学習において基本的かつ重要なものです．例えば，深層学習などのニューラルネットワークを用いた「学習」では，「損失関数」を最小にすることでニューラルネットワークの重みパラメータを調節します．このとき用いられる「勾配法」を「誤差逆伝播法」といいます．

教材に取り組まれる際に，これらのキーワードを手がかりにされるとよいでしょう．