CとAの数物 Note

数学と物理のはざまに棲息。

行列の微分公式集

 まず、行列の微分は、成分ごとに微分することで得られます。つまり
n\times n行列M=(M_{ij})微分n\times n行列として

\displaystyle\frac{dM}{dx} :=\left(\frac{dM_{ij}}{dx}\right)
定義されます。

 行列の積MN微分(i,j)成分に注目して

\displaystyle\left(\frac{d}{dx}( MN)\right)_{ij} =\sum _{m=1}^{n}\frac{d}{dx}( M_{im} N_{mj}) =\sum _{m=1}^{n}\left(\frac{dM_{im}}{dx} N_{mj} +M_{im}\frac{dN_{mj}}{dx}\right)
となり、これは
\displaystyle\frac{d}{dx}( MN) =\frac{dM}{dx} N+M\frac{dN}{dx}
とかき直せます。通常の微分公式と一致しています。

 しかし、行列の累乗を考え始めると、事情は変わります。まずは2乗M^2は積の公式から

\displaystyle\frac{d}{dx}M^2 =\frac{dM}{dx} M+M\frac{dM}{dx}
となります。しかし、一般に行列とその微分は可換でなく、つまり
\displaystyle M\frac{dM}{dx} \neq \frac{dM}{dx} M
は一般に成り立たないので(x^2)^\prime=2xx^\primeと全く同じ形にはなりません。ただ、可換であったら、通常の微分公式になるので、名残は感じ取れると思います。
 更に高次の累乗については
\displaystyle \frac{dM^{k+1}}{dx} =\frac{dM^{k}}{dx} M+M^{k}\frac{dM}{dx}
から、帰納的に考えれば
\displaystyle \frac{d}{dx} M^{k} =\sum _{s=0}^{k-1} M^{s}\frac{dM}{dx} M^{k-s-1}
となることが分かると思います。

 負冪はM正則行列として、M^{-k}:=(M^{-1})^kと考えて計算します。ます、逆行列M^{-1}

\displaystyle 0=\frac{d}{dx}\left( MM^{-1}\right) =\frac{dM}{dx} M^{-1} +M\frac{dM^{-1}}{dx}
となるので
\displaystyle \frac{d}{dx}M^{-1} =-M^{-1}\frac{dM}{dx} M^{-1}
です。また、高次の負冪も累乗の微分公式から
\displaystyle \frac{d}{dx} M^{-k} =-\sum _{s=0}^{k-1} M^{-( s+1)}\frac{dM}{dx} M^{-( k-s)}
となります。ただ、M^{-2}以上微分の計算が必要になった場面にまだ出くわしたことはないです。

 次は、行列の指数関数...と思ったのですが、やたら重いので後回しにして、先に行列特有の演算、つまり、トレースと行列式微分を考えましょう。

 トレースについては簡単で

\displaystyle \frac{d}{dx}\operatorname{tr} M=\frac{d}{dx}\sum _{i=1}^{n} M_{ii} =\sum _{i=1}^{n}\frac{dM_{ii}}{dx} =\operatorname{tr}\frac{dM}{dx}
と、トレースと微分は可換に扱っても問題ないです。

 行列式に対してはあまり自明なものではなくなってきます。この行列式微分は多くは余因子展開を使うようですが、物理屋としては素直に出てくる発想ではないので、別証明を与えます。物理でよく使う公式

\displaystyle \ln\det M=\operatorname{tr}\ln M
から始めます。この式の証明は本筋から逸れるので、省略します。まず、左辺を微分すると、対数微分になるので
\displaystyle \frac{d}{dx}(\ln\det M) =\frac{1}{\det M}\frac{d}{dx}\det M
となります。右辺を微分する前に、ひとつ、\operatorname{tr}M^k微分を計算します。これまで示してきた微分公式から
\displaystyle \frac{d}{dx}\operatorname{tr} M^{k} =\operatorname{tr}\left(\sum _{s=0}^{k-1} M^{s}\frac{dM}{dx} M^{k-s-1}\right)
となりますが、トレースの巡回性から
\displaystyle \operatorname{tr}\left( M^{s}\frac{dM}{dx} M^{k-s-1}\right) =\operatorname{tr}\left( M^{k-1}\frac{dM}{dx}\right)
が成り立つので
\displaystyle \frac{d}{dx}\operatorname{tr} M^{k} =\operatorname{tr}\left( kM^{k-1}\frac{dM}{dx}\right)
が示せます。この上で、\operatorname{tr}\ln M
\displaystyle \ln M=\sum _{k=1}^{\infty }\frac{( -1)^{k-1}}{k}( M-I)^{k}
より、微分と無限和は可換性は自明ではないですけど、認めてもらうとすれば
\displaystyle \begin{aligned}\frac{d}{dx}(\operatorname{tr}\ln M)&=\frac{d}{dx}\operatorname{tr}\left[\sum _{k=1}^{\infty }\frac{( -1)^{k-1}}{k}( M-I)^{k}\right]\\
&=\operatorname{tr}\left[\sum _{k=1}^{\infty }( I-M)^{k-1}\frac{dM}{dx}\right]\end{aligned}
となり、トレースの中は
\displaystyle \sum _{k=1}^{\infty }( I-M)^{k-1} =\frac{1}{I-( I-M)} =M^{-1}
と、計算できます(これは形式的な計算ですが、\Sigma x^k=1/(1-x)の証明をなぞらえば、行列の逆数を用いずにできます)。右辺と左辺を並べれば
\displaystyle \frac{d}{dx}\det M=\det M\operatorname{tr}\left( M^{-1}\frac{dM}{dx}\right)
と、行列式微分が計算できました。ちなみに、この式は一般相対論ではg=\det g_{\mu\nu}として
\displaystyle \delta g=g g^{\mu\nu}\delta g_{\mu\nu}
として、用いられています。

 最後に、行列の指数関数

\displaystyle e^{M} :=\sum _{k=0}^{\infty }\frac{1}{k!} M^{k}
微分しましょう。物理ではユニタリ演算子は行列(演算子)の指数関数で現れ、それを微分するときに必要になってきます。ただ、学部レベルの話ではMが定行列Aと変数xの積M=Axとなっていることが多いので、このとき、e^{M}M、さらにM^\prime=Aは全て可換なので
\displaystyle \frac{d}{dx}e^{Ax}=Ae^{Ax}
とかけます。問題はこのように単純でないときになります。実際に微分していきましょう。まず
\displaystyle \frac{d}{dx} e^{M} =\sum _{k=0}^{\infty }\frac{1}{k!}\frac{d}{dx} M^{k} =\sum _{k=0}^{\infty }\frac{1}{k!}\sum _{s=0}^{k-1} M^{s}\frac{dM}{dx} M^{k-s-1}
機械的に計算できます。つぎに、和の取り方を変えて
\displaystyle \frac{d}{dx} e^{M} =\sum _{k=0}^{\infty }\sum _{s=0}^{\infty }\frac{k!s!}{( k+s+1) !} \cdot \frac{1}{k!} M^{k}\frac{dM}{dx}\frac{1}{s!} M^{s}
とかき直します。そして、ベータ関数の積分公式
\displaystyle B( k+1,s+1) =\int _{0}^{1} dtt^{k}( 1-t)^{s} =\frac{k!s!}{( k+s+1) !}
を代入します。すると、ksが完全に分離でき
\displaystyle \frac{d}{dt} e^{M} =\int _{0}^{1} dt\sum _{k=0}^{\infty }\sum _{s=0}^{\infty }\frac{1}{k!} M^{k}\frac{dM}{dx}\frac{1}{s!} M^{s}
と計算できます。総和と積分の交換性も自明ではないですが、交換できると仮定して進めていきましょう。すると、総和の中が指数関数の形になっているので
\displaystyle \frac{d}{dx} e^{M} =\int _{0}^{1} dte^{tM}\frac{dM}{dx} e^{( 1-t) M}
となります。はい、これが最終形です。e^M微分M微分で表せたので目的は達しています。なんだこれは、と思わなくはないですが、e^M微分M^\prime e^Mでもe^M M^\primeでもなく、左右に均等にe^Mを配分したもの、と見れるのではないのでしょうか。

 リー群やゲージ理論を勉強しているとU^{-1}dUという量がよく出てくるので、これを計算して終わります。Uはリー群の元としてU=e^{iX}と表します。このとき、U^{-1}=e^{-iX}であるので

\displaystyle \begin{aligned}
U^{-1} dU&=ie^{-iX}\int _{0}^{1} dte^{itX} dXe^{( 1-t) iX}\\
&=i\int _{0}^{1} dte^{( t-1) iX} dXe^{-( t-1) iX}\\
&=i\int _{0}^{1} dte^{-itX} dXe^{itX}\end{aligned}
となります。なお、最後の等号はt\mapsto 1-tの変換を行っています。