いま、
の入力情報があるとします。
この情報から
の
いずれであるかを判定したいとします。
入力情報をなるべく有効利用して正しい(誤差のない)判定をするには
どうすればよいでしょうか?
:熱の有無を表す確率変数
:せきの有無を表す確率変数
:パターン(観測ベクトル)
:パターン空間(観測空間)
:患者が健康であるか病気であるかを表す確率変数
:患者が健康である確率
:患者が病気である確率
:熱の有無(
)、
せきの有無(
)をもとに
患者が病気か健康かを 医者が判断することを表す確率変数
:
医者が患者を健康であると判断する確率
:
医者が患者を病気であると判断する確率 
が
最小になるように
を求めること」に置き換えらます。
が最小になるように
識別規則
を決めればよいわけです。
誤り確率を少し変形すると次のように書き換えられます。
(変形の詳細はこちら)


以下のように定義される識別規則ベイズの識別規則

を
ベイズの識別規則といい、
ベイズの識別規則を用いると、
誤りの確率
が最小になります。


とします。

このように決めると
が成り立ちます。
証明
離散分布の識別関数
観測データがr個で、離散的な値(0,1)をとるときのベイズの識別規則は
次のようになります。
… 観測データがr個
… パターン空間

と判定
f(x)を用いる代わりに 次のように定義されるg(x)を用いても、
同様の識別を行うことができます。

と判定
が独立であると仮定すると、
g(x)は 線形識別関数(xに関する1次式)になります。
(証明)
連続分布の識別関数
以下のように 観測データがr個で、連続的な値をとるときも
離散分布の識別関数と同様に ベイズの識別規則
を使用できます。

パターン空間 
パターンクラス
(健康)、
(病気)
の正規分布に従うとき、
ベイズの識別規則の識別関数は、線形識別関数になる。
(証明)
back to this top
back to pattern top
back to home
![]()
Last modified :2000.01.12
Please send message to us!