Processing math: 100%
<<展開

Log(Sum)をSum(Log)で扱いたい

概要

解析を行いにくいLog(Sum) (別表記log-sum)をSum(Log)(別表記lsum-log)の形に変形することで処理を扱いやすくすることが度々行われます.Log(Sum)からSum(Log)にして扱う時、イェンセンの不等式によってそれらを実現し、Log(Sum)&gt;=Sum(Log)の関係となります.
Facebookシェア Twitterツイート LINEで送る
この章を学ぶ前に必要な知識
0
条件
  • Log(Sum)の形式で表される式
効果
  • Log(Sum)>=Sum(Log)を導きSum(Log)で処理できるようにします
ポイント
  • EMアルゴリズムにおいても扱いやすくするために上記処理が行われます.

解 説

以下で言うLog(Sum)とは log(Σqixi) のような形式で記述された関数を指し、 Sum(Log)とは Σqi(log(f(xi)) のような形式で記述された関数を指すこととします.
以下のLog(Sum), Sum(Log)とは
解析を行いにくいLog(Sum)をSum(Log)の形に変形することで処理を扱いやすくすることが度々行われます.EMアルゴリズムやその他の情報理論において使用されます. Log(Sum)を与えられたときに、イェンセンの不等式によって、Log(Sum)>=Sum(Log)の関係を導出します. これによってSum(Log)はLog(Sum)より必ず小さい状態であるため、それを考慮した処理を行うことができます. EMアルゴリズムでは、Log(Sum)で与えられる式は最大化を行いにくいため、その(変分)下限であるSum(Log)を求め、そのSum(Log)を大きくすることで、 Log(Sum)を最大化します.
Log(Sum)をSum(Log)で扱いたいとは
イェンセンの不等式についてはリンクを参照願います.
イェンセンの不等式
以下が実際にイェンセンの不等式を当て込んだときの変形になります. log(Σqipi(x))Σqi(log(pi(x))) 条件としてqiの和は1になる必要があります.1でない場合はその和で割ればすぐに扱える形に変形できます.
イェンセン不等式による変換の例

1.Log-Sum 不等式

またLog Sum不等式と呼ばれるイェンセンの不等式を使うことで容易に求められる不等式がある.
Log-Sum不等式について
イェンセンの不等式で出てくるf(x)をここではxlog(x)とする.log(x)は凹関数(上に凸な関数)だったが、このxlog(x)は凸関数(下に凸な関数)なので要注意.不等式の不等号の向きが逆転します. asum=Σai bsum=Σbi です. 以下がlog-sum 不等式でこれから導く式になります. Σni=1ailogaibi=asumlog(asumbsum) それでは導出です. Σni=1ailogaibi=Σni=1biaibilog(aibi)=Σni=1bif(aibi)=bsumΣni=1bibsumf(aibi)bsumf(Σni=1bibsumaibi)=bsumf(1bsumΣni=1ai)=bsumf(asumbsum)=asumlog(asumbsum) 以上です. 途中でイェンセンの不等式で変換をしているところを除きだいぶシンプルに導出できます.
log-sum不等式の導出
この章を学んで新たに学べる
Comments

Reasons
>>隠す

知識: イェンセンの不等式
イェンセンの不等式(Jensen Inequality)とは、上に凸な関数f(x)とn個の変数x1~xnを使って表される不等式.全て足したら1となる係数q1~qnを使って、f(Σ(qi * xi)) &gt;= Σ(qi * f(xi))が成立して、これをイェンセンの不等式と呼ぶ.