CとAの数物 Note

数学と物理のはざまに棲息。

行列の微分公式集

 まず、行列の微分は、成分ごとに微分することで得られます。つまり
n\times n行列M=(M_{ij})微分n\times n行列として

\displaystyle\frac{dM}{dx} :=\left(\frac{dM_{ij}}{dx}\right)
定義されます。

 行列の積MN微分(i,j)成分に注目して

\displaystyle\left(\frac{d}{dx}( MN)\right)_{ij} =\sum _{m=1}^{n}\frac{d}{dx}( M_{im} N_{mj}) =\sum _{m=1}^{n}\left(\frac{dM_{im}}{dx} N_{mj} +M_{im}\frac{dN_{mj}}{dx}\right)
となり、これは
\displaystyle\frac{d}{dx}( MN) =\frac{dM}{dx} N+M\frac{dN}{dx}
とかき直せます。通常の微分公式と一致しています。

 しかし、行列の累乗を考え始めると、事情は変わります。まずは2乗M^2は積の公式から

\displaystyle\frac{d}{dx}M^2 =\frac{dM}{dx} M+M\frac{dM}{dx}
となります。しかし、一般に行列とその微分は可換でなく、つまり
\displaystyle M\frac{dM}{dx} \neq \frac{dM}{dx} M
は一般に成り立たないので(x^2)^\prime=2xx^\primeと全く同じ形にはなりません。ただ、可換であったら、通常の微分公式になるので、名残は感じ取れると思います。
 更に高次の累乗については
\displaystyle \frac{dM^{k+1}}{dx} =\frac{dM^{k}}{dx} M+M^{k}\frac{dM}{dx}
から、帰納的に考えれば
\displaystyle \frac{d}{dx} M^{k} =\sum _{s=0}^{k-1} M^{s}\frac{dM}{dx} M^{k-s-1}
となることが分かると思います。

 負冪はM正則行列として、M^{-k}:=(M^{-1})^kと考えて計算します。ます、逆行列M^{-1}

\displaystyle 0=\frac{d}{dx}\left( MM^{-1}\right) =\frac{dM}{dx} M^{-1} +M\frac{dM^{-1}}{dx}
となるので
\displaystyle \frac{d}{dx}M^{-1} =-M^{-1}\frac{dM}{dx} M^{-1}
です。また、高次の負冪も累乗の微分公式から
\displaystyle \frac{d}{dx} M^{-k} =-\sum _{s=0}^{k-1} M^{-( s+1)}\frac{dM}{dx} M^{-( k-s)}
となります。ただ、M^{-2}以上微分の計算が必要になった場面にまだ出くわしたことはないです。

 次は、行列の指数関数...と思ったのですが、やたら重いので後回しにして、先に行列特有の演算、つまり、トレースと行列式微分を考えましょう。

 トレースについては簡単で

\displaystyle \frac{d}{dx}\operatorname{tr} M=\frac{d}{dx}\sum _{i=1}^{n} M_{ii} =\sum _{i=1}^{n}\frac{dM_{ii}}{dx} =\operatorname{tr}\frac{dM}{dx}
と、トレースと微分は可換に扱っても問題ないです。

 行列式に対してはあまり自明なものではなくなってきます。この行列式微分は多くは余因子展開を使うようですが、物理屋としては素直に出てくる発想ではないので、別証明を与えます。物理でよく使う公式

\displaystyle \ln\det M=\operatorname{tr}\ln M
から始めます。この式の証明は本筋から逸れるので、省略します。まず、左辺を微分すると、対数微分になるので
\displaystyle \frac{d}{dx}(\ln\det M) =\frac{1}{\det M}\frac{d}{dx}\det M
となります。右辺を微分する前に、ひとつ、\operatorname{tr}M^k微分を計算します。これまで示してきた微分公式から
\displaystyle \frac{d}{dx}\operatorname{tr} M^{k} =\operatorname{tr}\left(\sum _{s=0}^{k-1} M^{s}\frac{dM}{dx} M^{k-s-1}\right)
となりますが、トレースの巡回性から
\displaystyle \operatorname{tr}\left( M^{s}\frac{dM}{dx} M^{k-s-1}\right) =\operatorname{tr}\left( M^{k-1}\frac{dM}{dx}\right)
が成り立つので
\displaystyle \frac{d}{dx}\operatorname{tr} M^{k} =\operatorname{tr}\left( kM^{k-1}\frac{dM}{dx}\right)
が示せます。この上で、\operatorname{tr}\ln M
\displaystyle \ln M=\sum _{k=1}^{\infty }\frac{( -1)^{k-1}}{k}( M-I)^{k}
より、微分と無限和は可換性は自明ではないですけど、認めてもらうとすれば
\displaystyle \begin{aligned}\frac{d}{dx}(\operatorname{tr}\ln M)&=\frac{d}{dx}\operatorname{tr}\left[\sum _{k=1}^{\infty }\frac{( -1)^{k-1}}{k}( M-I)^{k}\right]\\
&=\operatorname{tr}\left[\sum _{k=1}^{\infty }( I-M)^{k-1}\frac{dM}{dx}\right]\end{aligned}
となり、トレースの中は
\displaystyle \sum _{k=1}^{\infty }( I-M)^{k-1} =\frac{1}{I-( I-M)} =M^{-1}
と、計算できます(これは形式的な計算ですが、\Sigma x^k=1/(1-x)の証明をなぞらえば、行列の逆数を用いずにできます)。右辺と左辺を並べれば
\displaystyle \frac{d}{dx}\det M=\det M\operatorname{tr}\left( M^{-1}\frac{dM}{dx}\right)
と、行列式微分が計算できました。ちなみに、この式は一般相対論ではg=\det g_{\mu\nu}として
\displaystyle \delta g=g g^{\mu\nu}\delta g_{\mu\nu}
として、用いられています。

 最後に、行列の指数関数

\displaystyle e^{M} :=\sum _{k=0}^{\infty }\frac{1}{k!} M^{k}
微分しましょう。物理ではユニタリ演算子は行列(演算子)の指数関数で現れ、それを微分するときに必要になってきます。ただ、学部レベルの話ではMが定行列Aと変数xの積M=Axとなっていることが多いので、このとき、e^{M}M、さらにM^\prime=Aは全て可換なので
\displaystyle \frac{d}{dx}e^{Ax}=Ae^{Ax}
とかけます。問題はこのように単純でないときになります。実際に微分していきましょう。まず
\displaystyle \frac{d}{dx} e^{M} =\sum _{k=0}^{\infty }\frac{1}{k!}\frac{d}{dx} M^{k} =\sum _{k=0}^{\infty }\frac{1}{k!}\sum _{s=0}^{k-1} M^{s}\frac{dM}{dx} M^{k-s-1}
機械的に計算できます。つぎに、和の取り方を変えて
\displaystyle \frac{d}{dx} e^{M} =\sum _{k=0}^{\infty }\sum _{s=0}^{\infty }\frac{k!s!}{( k+s+1) !} \cdot \frac{1}{k!} M^{k}\frac{dM}{dx}\frac{1}{s!} M^{s}
とかき直します。そして、ベータ関数の積分公式
\displaystyle B( k+1,s+1) =\int _{0}^{1} dtt^{k}( 1-t)^{s} =\frac{k!s!}{( k+s+1) !}
を代入します。すると、ksが完全に分離でき
\displaystyle \frac{d}{dt} e^{M} =\int _{0}^{1} dt\sum _{k=0}^{\infty }\sum _{s=0}^{\infty }\frac{1}{k!} M^{k}\frac{dM}{dx}\frac{1}{s!} M^{s}
と計算できます。総和と積分の交換性も自明ではないですが、交換できると仮定して進めていきましょう。すると、総和の中が指数関数の形になっているので
\displaystyle \frac{d}{dx} e^{M} =\int _{0}^{1} dte^{tM}\frac{dM}{dx} e^{( 1-t) M}
となります。はい、これが最終形です。e^M微分M微分で表せたので目的は達しています。なんだこれは、と思わなくはないですが、e^M微分M^\prime e^Mでもe^M M^\primeでもなく、左右に均等にe^Mを配分したもの、と見れるのではないのでしょうか。

 リー群やゲージ理論を勉強しているとU^{-1}dUという量がよく出てくるので、これを計算して終わります。Uはリー群の元としてU=e^{iX}と表します。このとき、U^{-1}=e^{-iX}であるので

\displaystyle \begin{aligned}
U^{-1} dU&=ie^{-iX}\int _{0}^{1} dte^{itX} dXe^{( 1-t) iX}\\
&=i\int _{0}^{1} dte^{( t-1) iX} dXe^{-( t-1) iX}\\
&=i\int _{0}^{1} dte^{-itX} dXe^{itX}\end{aligned}
となります。なお、最後の等号はt\mapsto 1-tの変換を行っています。

物理よりな微分幾何③ 共変外微分と曲率

 前回の共変微分に続いて、共変外微分を解説します。共変微分\overline{D}は、\Omega^0(E)=\Gamma(E)から、\Omega^1(E)=\Gamma(T^*M\otimes E)への微分写像として、定義されており、共変外微分は、それを自然に\Omega^p(E)から\Omega^{p+1}(E)への微分写像として拡張したものです。なので、記号は共変微分と同じ\overline{D}を使います。

定義 共変外微分(covariant exterior derivative)
 p自然数とする。共変外微分\overline{D}:\Omega^p(E)\to\Omega^{p+1}(E)ライプニッツ
\displaystyle \overline{D}( \xi \theta ) =\overline{D} \xi \land \theta +\xi d\theta ,\ \xi \in \Gamma ( E) ,\ \theta \in \Omega^{p}( M)
を満たす。
 共変外微分微分であるので、線形性を要請しますが、これは定義の\overline{D}\xiが通常の共変微分d\thetaが外微分であることから分かります。特にp=0のとき、共変微分の定義と一致します。また、外微分の類似式として、\phi\in\Omega^p(E),\theta\in\Omega^q(M)に対し、\phi\wedge\theta\in\Omega^{p+q}(E)の外微分
\displaystyle \overline{D}( \phi \land \theta ) =\overline{D} \phi \land \theta +( -1)^{p} \phi \land d\theta
と計算できます。
 外微分ではd^2=0と、二回合成で消える性質があったので、共変外微分ではこの性質がどのように引き継がれているかを見てみましょう。\xi\in\Gamma(E),\theta\in\Omega(M)に対して\overline{D}^2を作用させると
\displaystyle 
\begin{aligned}
\overline{D}^{2}( \xi \theta ) &=\overline{D}(\overline{D} \xi \land \theta +\xi d\theta )\\
&=\overline{D}^{2} \xi \land \theta -\overline{D} \xi \land d\theta +\overline{D} \xi \land d\theta +\xi \land d^{2} \theta \\
&=\overline{D}^{2} \xi \land \theta 
\end{aligned}
となるため、\Gamma(E)に対してのみ、\overline{D}^2の作用を考えればいいことが分かります。
 \overline{\sigma}=e\sigma\in\Gamma(E)を使って展開してみると
\displaystyle 
\begin{aligned}
\overline{D}^{2}\overline{\sigma } &=\overline{D}( e( d+A) \sigma ) =\overline{D} e\land ( d+A) \sigma +ed\{( d+A) \sigma \}\\
&=eA\land ( d+A) \sigma +edA\sigma -eA\land d\sigma \\
&=e( dA+A\land A) \sigma 
\end{aligned}
となります。ここで注目すべきことは、最後の式に\sigma微分項を含んでいない、いう点です。つまり、\overline{D}^2は最早、微分演算子ではなくAが行列値であったので、\overline{D}^2は行列値の2形式となります。行列の添え字を復活させると
\displaystyle \overline{D}^{2}\left( e_{i} \sigma ^{i}\right) =e_{j}\left( dA^{j}{}_{i} +A^{j}{}_{k} \land A^{k}{}_{i}\right) \sigma ^{i}
となります。この\overline{F}:=\overline{D}^2\in\Omega^2(\operatorname{End}( E))を曲率といいます。ここで、\operatorname{End}( E)\operatorname{Hom}(E,E)=E\otimes E^*ともかかれ、切断\Gamma(\operatorname{End}( E))E_xからE_xへの線形写像、基底をあたえれば行列になるものです。
 曲率\overline{F}を基底をつかって展開すれば
\displaystyle \overline{F}( e\sigma ) =eF\sigma =e_{i} F^{i}{}_{j} \sigma ^{j}
とかけ、F=dA+A\wedge Aがなりたつことが分かります。また、\xi\in\Gamma(E),\theta\in\Omega(M)に対し
\displaystyle \overline{D}^{2}( \xi \theta ) =\overline{F} \xi \land \theta =\overline{F} \land \xi \theta
を満たすので、\varphi\in\Omega^p(E)に対し\overline{D}^{2}\varphi=\overline{F}\wedge\varphiがなりたちます。
 F,A
\displaystyle F=\frac{1}{2} F_{\mu \nu } dx^{\mu } \land dx^{\nu } , A=A_{\mu } dx^{\mu }
と係数をおけば
\displaystyle dA=\partial _{\mu } A_{\nu } dx^{\mu } \land dx^{\nu } =\frac{1}{2}( \partial _{\mu } A_{\nu } -\partial _{\nu } A_{\mu }) dx^{\mu } \land dx^{\nu }
\displaystyle A\land A=A_{\mu } A_{\nu } dx^{\mu } \land dx^{\nu } =\frac{1}{2}( A_{\mu } A_{\nu } -A_{\nu } A_{\mu }) dx^{\mu } \land dx^{\nu }
より
\displaystyle F_{\mu \nu } =\partial _{\mu } A_{\nu } -\partial _{\nu } A_{\mu } +[ A_{\mu } ,A_{\nu }] ,\ \ [ A_{\mu } ,A_{\nu }] =A_{\mu } A_{\nu } -A_{\nu } A_{\mu }
が成り立ちます。また、D_\mu=\partial_\mu+A_\muを用いて
\displaystyle F_{\mu \nu } =[ D_{\mu } ,D_{\nu }]
とかかれることもあります。接続の定義の際に、虚数iだけ違うので完全に一致はしませんが、ヤン・ミルズのゲージ理論での曲率を再現しています。さらに、F(i,j)成分{F^i}_j
\displaystyle F^{i}{}_{j} =\frac{1}{2} F^{i}{}_{j\mu \nu } dx^{\mu } \land dx^{\nu }
と展開した係数はE=TMのとき、リーマンの曲率テンソルになります。

 続いて、曲率の共変外微分\overline{D}\overline{F}を考えてみましょう。\overline{\sigma}\in\Gamma(E)に対し、\overline{F}\overline{\sigma}\in\Omega^2(E)であり、\overline{D}\overline{F}

\displaystyle \overline{D}(\overline{F}\overline{\sigma }) =(\overline{D}\overline{F})\overline{\sigma } +\overline{F} \land \overline{D}\overline{\sigma }
を満たすように定義されます。
 \overline{D}^3=\overline{D}^2\overline{D}=\overline{D}\overline{D}^2を使うと
\displaystyle \overline{D}^{3}\overline{\sigma } =\overline{D}(\overline{F}\overline{\sigma }) =(\overline{D}\overline{F})\overline{\sigma } +\overline{F} \land \overline{D}\overline{\sigma }
\displaystyle \overline{D}^{3}\overline{\sigma } =\overline{D}^{2}(\overline{D}\overline{\sigma }) =\overline{F} \land \overline{D}\overline{\sigma }
が成り立ちます。つまり、見比べると
\displaystyle \overline{D}\overline{F} =0
となります。これをビアンキ恒等式といいます。

 ビアンキ恒等式\overline{D}\overline{F} =0では、実計算には余りにも不向きなので、より有用な表示を考えています。\overline{\sigma}=e\sigma\in\Gamma(E)に対し(\overline{D}\overline{F})(e\sigma)=e(DF)\sigmaとかくと、DF=0であり、DF

\displaystyle \begin{aligned}
\overline{D}(\overline{F}\overline{\sigma }) &=\overline{D}( eF\sigma ) =ed( F\sigma ) +eA\land F\sigma \\
&=e( dF+F\land d+A\land F) \sigma 
\end{aligned}
\displaystyle \overline{F} \land \overline{D}\overline{\sigma } =\overline{F} \land e( d+A) \sigma =e( F\land d+F\land A) \sigma
から
\displaystyle DF=dF+A\land F-F\land A=0
とも表現できます。また
\displaystyle DF=\frac{1}{2} D_{\rho } F_{\mu \nu } dx^{\rho } \land dx^{\mu } \land dx^{\nu }
と展開すると
\displaystyle A\land F-F\land A=\frac{1}{2}[ A_{\rho } ,F_{\mu \nu }] dx^{\rho } \land dx^{\mu } \land dx^{\nu }
より
\displaystyle D_{\rho } F_{\mu \nu } =\partial _{\rho } F_{\mu \nu } +[ A_{\rho } ,F_{\mu \nu }]
ともかけます。ただし、ビアンキ恒等式D_{\rho } F_{\mu \nu }=0ではないことに注意が必要です。
 D_{\rho } F_{\mu \nu }は添え字の入れ換えに対し反対称ではないので、DFの係数が0になるように展開するには
\displaystyle DF=\frac{1}{2\cdot 3!} D_{[ \rho } F_{\mu \nu ]} dx^{\rho } \land dx^{\mu } \land dx^{\nu }
と展開する必要があります。ここでD_{[ \rho } F_{\mu \nu ]}
\displaystyle D_{[ \rho } F_{\mu \nu ]} :=D_{\rho } F_{\mu \nu } +D_{\mu } F_{\nu \rho } +D_{\nu } F_{\rho \mu } -D_{\rho } F_{\nu \mu } -D_{\mu } F_{\rho \nu } -D_{\nu } F_{\rho \mu }
と定義されます。このように定義したときDF=0D_{[ \rho } F_{\mu \nu ]}=0とかけます。また、F_{\mu\nu}は2形式Fの係数であり、F_{\mu\nu}=-F_{\nu\mu}がなりたつので、成分についての正しいビアンキ恒等式
\displaystyle D_{\rho } F_{\mu \nu } +D_{\mu } F_{\nu \rho } +D_{\nu } F_{\rho \mu } =0
となります。
 リーマンの曲率テンソルに対しては
\displaystyle D_{\rho } R^{\sigma }{}_{\lambda \mu \nu } +D_{\mu } R^{\sigma }{}_{\lambda \nu \rho } +D_{\nu } R^{\sigma }{}_{\lambda \rho \mu } =0
とかけますが、E=TMにはビアンキ恒等式と呼ばれる式がもう一つあり、それに対して今回導いた式はビアンキの第2恒等式と呼ばれます。
 また、\mathrm{U}(1)ゲージ理論では、マクスウェル方程式のうち二つがビアンキ恒等式として扱うことが出来ます。残りの2式は恒等的に成り立つ式ではなく、ラグラジアンが指定する運動方程式となっています。このシリーズの目標はゲージ理論なので、そのうち、この話はしていきたいと思っています。

 最後に、曲率の変換性について考えます。Uから、U^\primeに座標変換したとき、基底がe^\prime=esと変換されたとします。このとき

\displaystyle \overline{F}\overline{\sigma } =e^\prime F^\prime \sigma^ \prime =eF\sigma
が成り立ち、e=e^\prime s^{-1}と、\sigma =s\sigma ^\prime より
\displaystyle e^\prime F^\prime \sigma^ \prime =e^\prime s^{-1} Fs\sigma ^\prime
つまり
\displaystyle  F^\prime=s^{-1} Fs
のように変換されることが分かります。Fの変換性はsとその逆行列s^{-1}で挟まれたものであるので、F行列式とトレースは
\displaystyle \det F^\prime =\det\left( s^{-1} Fs\right) =\det F
\displaystyle \operatorname{tr} F^\prime =\operatorname{tr}\left( s^{-1} Fs\right) =\operatorname{tr} F
のように、基底のとりかたに依らない量になります。これによって、後々、特性類というものを上手く考えることができるようになってきます。

 今回はここまでにして、次回は具体的なベクトル束に対して、これまで出てきた概念を計算してみたいと思います。

物理よりな微分幾何② 接続と共変微分

 前回は、ベクトルの定義をして、ベクトル場やテンソル場などは、ベクトル束の切断である、との話をしました。続いては、共変微分についての数学的表現を話していきます。
 最初に共変微分の定義をのべて、そこから、物理での共変微分とそれが一致することをみていきます。

定義 共変微分(covariant derivative)
 ベクトル束\pi:E\to M上の共変微分\overline{D}:\Gamma(E)\to \Gamma(T^*M\otimes E)とは以下を満たす写像である。

  1. \overline{D}は線形写像である。
    \displaystyle \overline{D}(c_1 \xi_1+c_2 \xi_2)=c_1\overline{D}\xi_1+c_2\overline{D}\xi_2,\ c_1,c_2\in\mathbb{R},\ \xi_1,\xi_2\in\Gamma(E)
  2. \overline{D}ライプニッツ則を満たす。

\displaystyle \overline{D}(f\xi)=df\xi+f\overline{D}\xi,\ \ f\in C^\infty(M),\ \xi\in\Gamma(E)

 まず、 T^*M\otimes Eについて説明します。もう少し一般化して\wedge^k M\otimes Eについて考えましょう。この切断\overline{\sigma}\in\Gamma(\wedge^k M\otimes E)

\displaystyle \overline{\sigma } =\frac{1}{k!} e\left( \land ^{k} dx\right) \sigma :=\frac{1}{k!} \sigma _{\mu _{1} \cdots \mu _{k}}^{i} e_{i} \otimes dx^{\mu _{1}} \land \cdots \land dx^{\mu _{k}}
とかけます。ここで\sigma _{\mu_{1} \cdots \mu_{k}}^{i}e_{i}\in E_xであるので、\sigmaEk形式と呼ばれます。これらを
\displaystyle \wedge^k E:=\wedge^k M\otimes E,\ \ \Omega^k(E):=\Gamma(\wedge^k E)
とかいておきます。また、\Omega^0(E)=\Gamma(E)とします。これは
\displaystyle \overline{\sigma} =\left( e_{1} ,\dotsc ,e_{r}\right)\begin{pmatrix}
 \frac{1}{k!}\sigma _{\mu_{1} \cdots \mu_{k}}^{1}dx^{\mu_{1}} \land \cdots \land dx^{\mu_{k}}\\
\vdots \\
\frac{1}{k!}\sigma _{\mu_{1} \cdots \mu_{k}}^{r}dx^{\mu_{1}} \land \cdots \land dx^{\mu_{k}}
\end{pmatrix}
とかいたほうが分かりやすいかもしれません。つまり、Ek形式は成分がk形式のベクトルと表せます。
 また、線形性とライプニッツ則は微分であるためには満たさなければいけません。一般に数学では、線形性とライプニッツ則みたす写像微分といいます。

 \overline{\sigma}\in\Gamma(E)=\Omega^0(E)に対し、\overline{D}\overline{\sigma}\in\Omega^1(E)Eに値をとる1次微分形式なので

\displaystyle \overline{D}\overline{\sigma } =edx( D\sigma ) =\left( D_{\mu } \sigma ^{i}\right) e_{i} dx^{\mu } , D_{\mu } \sigma ^{i} :=( D\sigma )_{\mu }^{i}
と展開できます。この展開係数が物理でよくみる形の共変微分になります。座標変換を考えてみると
\displaystyle e_{i} dx^{\mu } ={s^{j}}_{i}\frac{\partial x^{\mu }}{\partial x ^{\prime\nu }} e^\prime _{j} dx^{\prime\nu }
になるので、\overline{D}\overline{\sigma } =edxD\sigma =e^\prime dx^\prime D^\prime \sigma^ \prime に注意すると、成分について
\displaystyle D^\prime _{\nu } \sigma ^{\prime j} ={s^{j}}_{i}\frac{\partial x^{\mu }}{\partial x ^{\prime \nu }} D_{\mu } \sigma ^{i}
と変換されることがわかります。確かに共変微分が共変的な変換を受けていることが分かります。

 D\sigmaライプニッツ則から

\displaystyle \overline{D}\overline{\sigma } =\overline{D}( e\sigma ) =\overline{D} e\cdot \sigma +ed\sigma
とかけます。ここで、e_i\in\Gamma(E)であり、\overline{D} e\in\Omega^1(E)となるので、\overline{D} eE値1形式になります。このため、\overline{D} ee_iで再度展開すると
\displaystyle \overline{D} e=eA,\ \overline{D} e_{i} =e_{j} A^{j}{}_{i}
とかけます。Aは1次微分形式の行列とみることができ、これを接続、または接続形式といいます。(共変微分のことを接続という本もあります)
 接続を用いると共変微分
\displaystyle \overline{D}\overline{\sigma } =\overline{D} e\cdot \sigma +ed\sigma =eD\sigma ,\ D:=d+A
とかけます。物理では基本的に基底を明示しないで、成分だけで議論をすすめるので、共変微分D\sigma=d\sigma+A\sigmaのようにかいています。また、A=A_\mu dx^\muと展開すれば
\displaystyle D_{\mu } \sigma =( \partial _{\mu } +A_{\mu }) \sigma
ともかけます。\partial _{\mu}偏微分\partial/\partial x^\muのことですが、TMの基底と区別するため\partial _{\mu}とかいています。また、A微分形式の添え字と、行列の添え字の計3つの添え字をもつ量であり、これはクリストッフェル記号が添え字を3つもつことに対応します。

 共変微分と接続の変換性について見ていきましょう。e^\prime =esと変換することを考えます。まず、共変微分について

\displaystyle \overline{D}\overline{\sigma } = eD\sigma=e^\prime s^{-1} D ( s\sigma^\prime) =e^\prime D^\prime \sigma ^\prime
より
\displaystyle D^\prime\sigma^\prime =s^{-1}D( s\sigma^\prime )
が成り立つちます。これをD^\prime=s^{-1} D sとかくことがあります。また、接続は
\displaystyle s^{-1}D\left( s\sigma^ \prime \right) =D^\prime \sigma ^\prime =( d+A^\prime ) \sigma^ \prime
\displaystyle s^{-1}D\left( s \sigma^ \prime \right) =s^{-1}( d+A)\left( s\sigma ^\prime \right) =\left( d+s^{-1}As +s^{-1}ds\right) \sigma^ \prime
の2式がそれぞれなりたつので、見比べて
\displaystyle A^\prime =s^{-1}As +s^{-1}ds
という変換を受けます。このように、接続の変換には変換関数の微分が影響してきます。変換の1項目と2項目で微分の階数がことなってしまうため、接続は幾何学的な量で表すことが出来ません。つまり、接続は基底を定めて初めて表現できる量になります。このことは、あとで主束というものを考えるモチベーションとなります。また、このため、Aにはオーバーラインをつけていません。

 続いて、Eの共変微分から、双対束E^*の共変微分を導入します。\overline{X}\in\Gamma(E)と、\overline{Y}\in\Gamma(E^*)に対し、E^*の共変微分\overline{D}\overline{Y}

\displaystyle 
d\langle \overline{Y} ,\overline{X}\rangle =\langle\overline{D}\overline{Y} ,\overline{X}\rangle +\langle\overline{Y} ,\overline{D}\overline{X}\rangle
を満たすように定めます。eの双対基底をfとします。つまり\langle f^i,e_j\rangle=\delta^i_jとします。これを用いて、\overline{Y}=fY:=f^iY_iと展開すれば、内積
\displaystyle \langle \overline{Y} ,\overline{X}\rangle =\langle fY,eX\rangle =Y_{i} X^{i} ={}^{t} YX
と表せます。よって
\displaystyle d\langle \overline{Y} ,\overline{X}\rangle ={}^{t}dYX+{}^{t} YdX
が成り立ちます。また、Eの接続をAE^*の接続をA^*とすると
\displaystyle \langle \overline{D}\overline{Y} ,\overline{X}\rangle ={}^{t}\left(\left( d+A^{*}\right) Y\right) X={}^{t}dYX+{}^{t} Y^{t} A^{*} X
\displaystyle \langle \overline{Y} ,\overline{D}\overline{X}\rangle ={}^{t} Y( d+A) X={}^{t} YdX+{}^{t} YAX
が成り立つので、見比べると
\displaystyle A^{*} =-{}^{t} A
を得ます。
 また、EFテンソルE\otimes Fの共変微分\overline{X}\in\Gamma(E\otimes F)
\displaystyle\overline{X}=efX=e_if_jX^{ij}
と展開すれば
\displaystyle\overline{D}\overline{X} =\overline{D} efX+e\overline{D} fX+efdX=ef( d+A_{E} +A_{F}) X
となります。添え字をもどすと
\displaystyle DX^{ij} =dX^{ij} +( A_{E})^{i}{}_{k} X^{kj} +( A_{F})^{j}{}_{k} X^{ik}
とかけます。

 最後に、一般相対性理論の共変微分の式を導いておきます。相対論では\overline{X}\in\Gamma(TM)、つまり、反変ベクトル場の共変微分をクリストッフェル記号を用いて

\displaystyle D_{\mu } X^{\nu } =\partial _{\mu } X^{\nu } +\Gamma _{\mu \rho }^{\nu } X^{\rho }
と表します。これは接続を{A^\nu}_\rho=\Gamma _{\mu\rho }^{\nu }dx^\muと表していることを意味します。まずは、クリストッフェル記号の変換を考えてみましょう。基底は
\displaystyle \frac{\partial }{\partial x^{\prime \mu }} =\frac{\partial }{\partial x^{\nu }}\frac{\partial x^{\nu }}{\partial x^{\prime \mu }}
と変換されるので、接続の変換式は
\displaystyle A ^{\prime\mu }{}_{\nu } =\frac{\partial x ^{\prime\mu }}{\partial x^{\rho }} A^{\rho }{}_{\sigma }\frac{\partial x^{\sigma }}{\partial x ^{\prime\nu }} +\frac{\partial x ^{\prime\mu }}{\partial x^{\rho }} d\left(\frac{\partial x^{\rho }}{\partial x ^{\prime\nu }}\right)
となります。さらに、A ^{\prime\mu }{}_{\nu }=\Gamma^{\prime\mu}_{\lambda\nu}dx^{\prime\lambda} A^{\rho }{}_{\sigma }=\Gamma^\rho_{\kappa\sigma}dx^\kappaと展開すれば
\displaystyle \Gamma^{\prime\mu}_{\lambda\nu}dx^{\prime\lambda}=\frac{\partial x ^{\prime\mu }}{\partial x^{\rho }} \Gamma^\rho_{\kappa\sigma}\frac{\partial x^{\sigma }}{\partial x ^{\prime\nu }}dx^\kappa +\frac{\partial x ^{\prime\mu }}{\partial x^{\rho }} \frac{\partial}{\partial x^\kappa}\left(\frac{\partial x^{\rho }}{\partial x ^{\prime\nu }}\right)dx^\kappa
となるので
\displaystyle \Gamma _{\lambda \nu }^{\prime \mu } =\frac{\partial x ^{\prime\mu }}{\partial x^{\rho }}\frac{\partial x^{\kappa }}{\partial x^{\prime\lambda }}\frac{\partial x^{\sigma }}{\partial x^{\prime\nu }} \Gamma _{\kappa \sigma }^{\rho } +\frac{\partial x ^{\prime\mu }}{\partial x^{\rho }}\frac{\partial ^{2} x^{\rho }}{\partial x^{\prime\lambda } \partial x ^{\prime\nu }}
また、共変ベクトルの共変微分\overline{Y}\in\Gamma(T^*M)に対して
\displaystyle DY=dY-{}^{t} AY
が成り立つので
\displaystyle D_{\mu } Y_{\nu } =\partial _{\mu } Y_{\nu } -\Gamma _{\mu \nu }^{\rho } Y_{\rho }
となります。さらにテンソル\overline{T}\in\Gamma({T^{r}}_{s}M)についても、
\displaystyle \begin{aligned}D_{\rho } T^{\mu _{1} \cdots \mu _{r}}{}_{\nu _{1} \cdots \nu _{s}} &=\partial _{\rho } T^{\mu _{1} \cdots \mu _{r}}{}_{\nu _{1} \cdots \nu _{s}}\\
&+\sum _{i=1}^{r} \Gamma _{\rho \lambda }^{\mu _{i}} T^{\mu _{1} \cdots \lambda \cdots \mu _{r}}{}_{\nu _{1} \cdots \nu _{s}}\\
&-\sum _{j=1}^{s} \Gamma _{\rho \nu _{i}}^{\lambda } T^{\mu _{1} \cdots \mu _{r}}{}_{\nu _{1} \cdots \lambda \cdots \nu _{s}}\end{aligned}
となることがテンソル束の接続を考えれば分かります。残ったスカラー場ですが、スカラーSC^\infty(M)の元で、これは直積束M\times \mathbb{R}の切断になります。直積束に対しては接続は自明なので
\displaystyle D_{\mu } S=\partial _{\mu } S
となります。このように、一般相対性理論ベクトル束の言葉で翻訳し直すことができます。

 今回はここまでにして、次回は共変外微分と曲率を解説します。

物理よりな微分幾何① ベクトル束の定義

 ベクトル束の勉強をしていて、分かってきたとこも多くなったので、こちらにまとめていこう!

 というモチベーションでやっていきます。あと、できるだけ、物理側面についても触れようと思います。むしろ、物理向けにかきたいので、ちょくちょく、数学書の記法とは異なる記法になっているかもしれないです。

 では、まずは定義から

定義 ベクトル束(vector bundle)
 多様体M上のランク(rank)rの実ベクトル束\pi:E\to Mとは以下を満たすものである。

  1. E多様体の構造を持ち、\pi:E\to M微分可能な全射
  2. 各点x\in Mに対しファイバー(Fiber)E_x:=\pi^{-1}(x)r次元の実ベクトル空間。
  3. 各点x\in Mに対し、開近傍Uと、微分同相写像

\displaystyle \varphi_U:\pi^{-1}(U)\to U\times \mathbb{R}^r
が存在し
\displaystyle \varphi_U(x):E _ x \to \{ x \}\times\mathbb{R}^r \cong\mathbb{R}^r
はベクトル空間としての同型写像になる。

 底空間M全射\piが明らかなときはEのことをベクトル束ともいいます。ベクトル束がイメージするものは多様体の各点にベクトル空間がのっているようなものです。物理では、ベクトル場を考えるときに使います。
 \varphiはベクトル空間の座標(基底)の取り方を意味しています。\varphi^{-1}_U(x):\mathbb{R}^r\to E_xは同型写像であるので、\mathbb{R}^rの自然な基底\{\mathrm{e}_i\}に対し、\{\varphi^{-1}_U(x)(\mathrm{e}_i)\}は独立なr個のベクトルの組で、E_xの基底となります。
 また、\varphiは局所自明化とも呼ばれ、Eの局所的な座標表示を与えます。つまり、\pi^{-1}(U)\cong U\times \mathbb{R}^rであるので、p\in\pi^{-1}(U)\subset Ep=(x,v)ともかけます。ここで、x=\pi(p)\in M,v\in\mathbb{R}^rで、vE_xの基底を\{\varphi^{-1}_U(x)(\mathrm{e}_i)\}としたときの成分になります。この局所性は大切で、大域的な、つまりE全体の基底が存在するとは限りません。
 S^1上のランク1のベクトル束を見てみましょう。
f:id:C-and-A:20211119212258p:plain
これはメビウスの帯と円筒の2つあります。メビウスの帯はベクトルを一周させると反転してしまうので、大域的な基底は存在しません。対して、円筒は大域的な基底が存在します。また、円筒の捻じれの無いベクトル束S^1\times \mathbb{R}のように、底空間とベクトル空間の直積でかけるような束を直積束とも言います。
 物理的にはS^1上に周期境界条件または、反周期境界条件をいれた系とみることが出来ます。これには、実際にスピンが関わってくるのですが、できればこの解説もそのうちします。

 ベクトル場を見るために切断を導入しましょう。

定義 切断(section)
 ベクトル束Eの切断とは写像\overline{\sigma }:M\to Eであって
\displaystyle\pi\circ \overline{\sigma }(x)=x,\ x\in M
を満たすものである。切断の集合を\Gamma(E)とかく。また、開集合U\subset Mに対して
\displaystyle\pi\circ \overline{\sigma }(x)=x,\ x\in U
を満たす写像\overline{\sigma }:U\to \pi^{-1}(U)を局所切断といい、局所切断の集合を\Gamma(E;U)と表す。

切断のイメージとしては、下のようなものを考えると良いです。

上の図の通り、切断とは、底空間からファイバーへの写像で、\overline{\sigma }(x)を局所座標表示すると
\displaystyle\overline{\sigma }(x)=(x^1,...,x^n,\sigma^1(x),...,\sigma^r(x)),\ \ \sigma(x)=\begin{pmatrix}
\sigma^{1}( x)\\
\vdots \\
\sigma^{r}( x)
\end{pmatrix}\in \mathbb{R}^r
とかけます。そして、この\sigma(x)が物理で言うベクトル場となります。ベクトル場とはベクトル束の切断と言ってもいいでしょう。
 また、切断は切断同士の和も、切断のスカラー倍もまた、切断になるので\Gamma(E)はベクトル空間になります。
 先ほど、大域的な基底は存在するとは限らないといいましたが、局所的な基底は必ず存在します。実際、e_i:U\to \pi^{-1}(U)e_i(x)=(x,\varphi^{-1}_U(x)(\mathrm{e}_i))と定義すればこれが基底となります。e_iは座標表示すると
\displaystyle e_{i}( x) =\left( x^{1} ,\dotsc ,x^{n} ,0,\dotsc ,1,\dotsc ,0\right)
とかけることから分かると思います。これを用いると\overline{\sigma}\in\Gamma(E)
\displaystyle \overline{\sigma} =\sigma^{i} e_{i}
と局所的にかけます。このため、\Gamma(E;U)\{e_i\}を基底とした、C^\infty(M)係数ベクトル空間とみれます。アインシュタインの縮約を用いて総和記号\Sigmaを省略していることに注意してください。さらに、今後はこのように、幾何学的な量、つまり、座標表示をしない量にオーバーラインをつけ、それを座標表示したものをオーバーラインを外して表します。
 また、\Gamma(E)もベクトル空間になるので、\Gamma(E)の基底は存在しますが、この基底が全てのファイバー上で独立とは限らないという意味で、大域的な基底は存在しないといっています。


 最初の実ベクトル束の定義の「実」をそのまま「複素」に読み替えれば、自然に複素ベクトル束を定義できます。波動関数は複素ベクトル束の切断と考えることもできます。

 重要なベクトル束を2つ紹介しましょう。

定義 (余)接ベクトル((co)tangent bundle)
 Mの局所座標系を(x^1,...,x^n)ととる。また、p\in Mにおいて、ベクトル空間T_pMの基底を(\partial/\partial x^1,...,\partial/\partial x^n)とする。このとき、\overline{X}\in T_pM
\displaystyle \overline{X}=X^\mu\frac{\partial}{\partial x^\mu},\ \ X^1,...,X^n\in \mathbb{R}
とかける。これを用いて、T_pMの座標表示を(x^1(p),...,x^n(p),X^1,...,X^n)とする。T_pMはベクトル空間であり、TM=\cup_{p\in M} T_pMベクトル束となる。これを接ベクトル束という。
 また、余接ベクトル束は、基底を(dx^1,...,dx^n)とするベクトル空間T_p^*Mを張り合わせたベクトル束T^*M=\cup_{p\in M} T_p^*Mである。

 T^*Mアスタリスク、そして、名前の「co-」はTMの双対ベクトル束であることを意味しています。つまり、T_pMT_p^*Mは双対ベクトル空間になっていて、内積

\displaystyle\langle \overline{Y},\overline{X}\rangle =\left\langle Y_{\mu}dx^{\mu}  ,X^{\nu}\frac{\partial }{\partial x^{\nu}}\right\rangle =Y_{\mu} X^{\mu} ,\ \ Y\in T_{p}^{*} M,\ X\in T_{p} M
と与えられています。
 相対性理論を学んだことがある人は、添え字のつけ方にピンときたかもしれませんが、まさにTMの切断が反変ベクトル場でT^*Mの切断が共変ベクトル場になります。そう思うと、内積が自然に思えるのではないでしょうか。

 \overline{X}\in\Gamma(TM)が反変ベクトル場であることを確かめるには、座標変換に対するXの変換性を調べる必要があります。そこで、ベクトル束の変換関数を定義します。

定義 変換関数(transition functions)
M開被覆\{U_\alpha\}とする。\forall x\in U_\alpha\cap U_\betaに対し
\displaystyle\varphi_\alpha(x):E_x\to\mathbb{R}^r,\ \ \varphi_\beta(x):E_x\to\mathbb{R}^r
は同型写像であり、写像
\displaystyle s_{\alpha \beta } :U_{\alpha } \cap U_{\beta }\rightarrow \mathrm{GL}( n,\mathbb{R})
\displaystyle s_{\alpha \beta }( x) :=\varphi _{\beta }( x) \circ \varphi _{\alpha }^{-1}( x)
が定義できる。この\left\{s_{ \alpha \beta }\right\}を変換関数という。
 定義からx\in U_{\alpha } \cap U_{\beta } \cap U_{\gamma }について、コサイクル条件
\displaystyle
s_{\alpha  \alpha}( x) =I,\ \ \left( s_{ \alpha  \beta }( x)\right)^{-1} =s_{ \beta\alpha }( x),
\displaystyle
s_{\alpha \beta }( x) s_{\beta  \gamma }( x) =s_{ \alpha \gamma }( x)
が成り立つことが分かります。

 TMを使って、変換関数の振る舞いを見ていきましょう。
 p\in U\cap U^\primeとして、変換関数をs(p):=\varphi _{U^\prime }( p) \circ \varphi _{U^\prime }^{-1}( p)とします。\overline{X}\in\Gamma( TM)に対し

\displaystyle
\varphi _{U}(p)(\overline{X}) =X:=\begin{pmatrix}
X^{1}\\
\vdots \\
X^{n}
\end{pmatrix}\in \mathbb{R}^n
となります。\overline{X}\in T_pM幾何学的な量、つまり、基底に依らない表示になるので
\displaystyle \overline{X}=X^{\mu }\frac{\partial }{\partial x^{\mu }} =X ^{\prime\nu }\frac{\partial }{\partial x ^{\prime\nu }}
が成り立ちます。変換関数は
\displaystyle X^\prime =\varphi _{U^\prime }(p)\left( X^{\prime \nu }\frac{\partial }{\partial x ^{\prime \nu }}\right) =s( p) \circ \varphi _{U}( p)\left( X^{\mu }\frac{\partial }{\partial x^{\mu }}\right) =s( p) X
を満たしていることが分かります。

 ここで、チェーンルールから基底が

\displaystyle
\frac{\partial }{\partial x^{\mu}} =\frac{\partial }{\partial x^{\prime\nu}}\frac{\partial x^{\prime\nu}}{\partial x^{\mu}}
と変換されるので、見比べると
\displaystyle
X^{\prime\nu} =\frac{\partial x^{\prime\nu}}{\partial x^{\mu}} X^{\mu}
が成り立っていることが分かります。そして、まさにこれは、反変ベクトルの変換性を表していることが分かります。また、TMの変換関数はヤコビアン\partial x^{\prime\nu}/\partial x^{\mu}となることが分かります。つまり、数学的に、多様体のチャートが座標の取り方に対応していて、チャートを乗り換えることが座標変換になる、ということが分かります。

 同じことが、T^*Mについても出来て、\overline{Y}\in\Gamma(T^*M)

\displaystyle
Y_{\nu}^{\prime} =\frac{\partial x^{\mu}}{\partial x^{\prime\nu}} Y_{\mu}
という、共変的な変換を受けることが示せます。

 共変ベクトル、反変ベクトルとくれば、テンソルを作りたくなります。ということで、ベクトル束からベクトル束を作る操作を紹介します。(テンソルも線形性が成り立つという意味ではベクトルです)

 ベクトル空間V,Wが与えられたとき、直和V\oplus WテンソルV\otimes W、双対V^*外積\wedge^k V、対称積\operatorname{Sym}^{k} Vなどが定義できます。また、W\subset Vならば、商V/Wも定義できます。ここでは各操作について詳しく述べることはしません。
 対応して、底空間が同じベクトル束\pi_E:E\to M,\pi_F:F\to Mについて、各ファイバーごとに上の操作をすることによって、直和E\oplus FテンソルE\otimes F、双対E^*外積\wedge^k E、対称積\operatorname{Sym}^{k} Eが定義できます。
 特に、接ベクトル束r回、余接ベクトル束sテンソルした、テンソル

\displaystyle
{T^{r}}_{s} M=\overbrace{TM\otimes \cdots \otimes TM}^{r} \otimes \overbrace{T^{*} M\otimes \cdots \otimes T^{*} M}^{s}
の切断
\displaystyle
\overline{T}=T^{\mu _{1} \cdots \mu _{r}}{}_{\nu _{1} \cdots \nu _{s}}\frac{\partial }{\partial x^{\mu _{1}}} \otimes \cdots \otimes \frac{\partial }{\partial x^{\mu _{r}}} \otimes dx^{\nu _{1}} \otimes \cdots \otimes dx^{\nu _{s}}
テンソル場であり
\displaystyle
{T^{\prime\mu _{1} \cdots \mu _{r}}}_{\nu _{1} \cdots \nu _{s}} =\frac{\partial x^{\prime\mu _{1}}}{\partial x^{\rho _{1}}} \cdots \frac{\partial x^{\prime\mu _{r}}}{\partial x^{\rho _{r}}}\frac{\partial x^{\sigma _{1}}}{\partial x^{\prime\nu _{1}}} \cdots \frac{\partial x^{\sigma _{s}}}{\partial x^{\prime\nu _{s}}} {T^{\rho _{1} \cdots \rho _{r}}}_{\sigma _{1} \cdots \sigma _{s}}
のように変換をうけます。また計量g=g_{\mu\nu}dx^\mu\otimes dx^\nuT^*M\otimes T^*Mの切断であって、更にk形式は、\wedge^k T^*Mの切断と見れます。

 後々で使うので、\wedge^k M=\wedge^k T^*M,  \Omega^k(M)=\Gamma(\wedge^k M)と表記を定めておきます。k=0については、\Omega^0(M)=C^\infty(M)とします。
 最後に、たくさん出てくる添え字を略記する方法を定めておきたいと思います。\overline{X}\in\Gamma(E)を、局所的な基底\{e_i\}を使って、\overline{X}=X^ie_iと展開します。ここで

\displaystyle e=( e_{1} ,\dotsc ,e_{r}) ,\ X=\begin{pmatrix}
X^{1}\\
\vdots \\
X^{r}
\end{pmatrix}
と、基底の組を横ベクトル、成分を縦ベクトルであらわすことで、
\displaystyle \overline{X}=X^ie_i=eX
と表記します。また、テンソルE\otimes Fについては、自然な同型E\otimes F\cong F\otimes Eが存在するので、基底について、ef:=e\otimes f=f\otimes e=feと可換であるように見なし、記号\otimesを省略します。例えば、テンソル\overline{T}\in\Gamma({T^r}_sM)は局所的に
\displaystyle \overline{T} =\left(\frac{\partial }{\partial x}\right)^{r}( dx)^{s} T
とかきます。一応、重要な式については添え字をつけた表示も載せるようにします。

 今回はここまでにして、次回からは共変微分と接続についての話になります。

n人でじゃんけんするときの回数(改良編)

以前こんな問題について書いた。
c-and-a.hatenablog.com

問題設定

n人でじゃんけんを行い、あいこであればもう一度、勝ちが出れば、勝った人たちでまたじゃんけんを行う。これを最後に一人出るまで繰り返す。優勝者がでるまでに行ったじゃんけんの回数の期待値をE_nとする。E_nを求めよ。なお、E_1=0としておく。

簡単に言えば、みんなでじゃんけんをやったとき、優勝者を決めるのには何回必要かを考えた。これはなかなかに骨の折れる問題でとても解くのが難しく、前回の解答はとても満足のできる形にならなかった。

今回、もっとすっきりした解が求まったのでそれを紹介しよう。

前回と共通するところまでは飛ばそう。

回数の期待値の漸化式は

 \displaystyle {E}_{n}=\frac {1}{{2}^{n}-2}\left\lbrace {{3}^{n-1}+{\sum _{k=1}^{n-1}{\left({\begin{matrix}{n}\\ {k}\end{matrix}}\right) {E}_{k}}}}\right \rbrace,\quad E_1=0
とかけるのだった。これの導出は上のリンクから飛んでみて欲しい。

まず、母関数を考えるのは同じで

 \displaystyle F( x) =\sum ^{\infty }_{n=0}\frac{E_{n}}{n!} x^{n}
とかく。便宜的にE_0=0とした。

前回と同じようなトリックを使うと

 \displaystyle E_{n} =\frac{1}{2^{n} -2}\left\{3^{n-1} -2E_{n} +E_{n} +E_{n} +\sum ^{n-1}_{k=1}\begin{pmatrix}
n\\
k
\end{pmatrix} E_{k}\right\}
より
 \displaystyle E_{n} =\frac{1}{2^{n}}\left\{3^{n-1} +E_{n} +\sum ^{n}_{k=0}\begin{pmatrix}
n\\
k
\end{pmatrix} E_{k}\right\},\quad n\geq 2
が成り立つ。ここでは-2E_nを左辺に移項し、E_nのうち一つはシグマに吸収させている。

これを母関数に代入し整理していく
\begin{align*}
F( x) & =\sum ^{\infty }_{n=0}\frac{E_{n}}{n!} x^{n} =\sum ^{\infty }_{n=2}\frac{E_{n}}{n!} x^{n}\\
& =\sum ^{\infty }_{n=2}\frac{1}{n!}\frac{1}{2^{n}}\left\{3^{n-1} +E_{n} +\sum ^{n}_{k=0}\begin{pmatrix}
n\\
k
\end{pmatrix} E_{k}\right\} x^{n}\\
& =\frac{1}{3}\sum ^{\infty }_{n=2}\frac{1}{n!}\left(\frac{3}{2} x\right)^{n} +\sum ^{\infty }_{n=2}\frac{E_{n}}{n!}\left(\frac{x}{2}\right)^{n} +\sum ^{\infty }_{n=2}\frac{1}{n!}\left(\frac{x}{2}\right)^{n}\sum ^{n}_{k=0}\begin{pmatrix}
n\\
k
\end{pmatrix} E_{k}\\
& =\frac{1}{3}\left( e^{3x/2} -1-\frac{3x}{2}\right) +F( x/2) +\sum ^{\infty }_{n=0}\frac{1}{n!}\left(\frac{x}{2}\right)^{n}\sum ^{n}_{k=0}\begin{pmatrix}
n\\
k
\end{pmatrix} E_{k}
\end{align*}
式変形ではE_0=E_1=0を使って、和の開始をずらしたりしているので注意してほしい。

3項目は
\begin{align*}
\sum ^{\infty }_{n=0}\frac{1}{n!}\left(\frac{x}{2}\right)^{n}\sum ^{n}_{k=0}\begin{pmatrix}
n\\
k
\end{pmatrix} E_{k} & =\sum ^{\infty }_{n=0}\sum ^{n}_{k=0}\frac{1}{( n-k) !}\left(\frac{x}{2}\right)^{n-k} \cdot \frac{E_{k}}{k!}\left(\frac{x}{2}\right)^{k}\\
& =\sum ^{\infty }_{n=0}\sum ^{\infty }_{k=0}\frac{1}{n!}\left(\frac{x}{2}\right)^{n} \cdot \frac{E_{k}}{k!}\left(\frac{x}{2}\right)^{k}\\
& =e^{x/2} F\left(\frac{x}{2}\right)
\end{align*}
と簡約できるので、最終的に

 \displaystyle F( x) =\frac{1}{3}\left( e^{3x/2} -1-\frac{3x}{2}\right) +F( x/2) +e^{x/2} F( x/2)
、とかけるので、x/2xに置き換えて
 \displaystyle F( 2x) =\frac{1}{3}\left( e^{3x} -1\right)-x +\left( e^{x} +1\right) F( x)
という関数方程式を満たすことが分かる。F(x)=(1-e^x)f(x)とおいて、代入すれば
 \displaystyle \left( 1-e^{2x}\right) f( 2x) =\frac{1}{3}\left( e^{3x} -1\right) -x+\left( 1-e^{2x}\right) f( x)
となるので、未知関数の係数をそろえることが出来、整理すれば
 \displaystyle f( 2x) =-\frac{1}{3} e^{x} -\frac{1}{3}\frac{1}{e^{x} +1} +\frac{x}{e^{2x} -1} +f( x)
となる。

先に解答の方針を示そう。f(x)と上の式の右辺の3項がそれぞれ

 \displaystyle f( x) =\sum ^{\infty }_{n=0}\frac{a_{n}}{n!} x^{n}
 \displaystyle \frac{1}{3} e^{x} +\frac{1}{3}\frac{1}{e^{x} +1} -\frac{x}{e^{2x} -1} =\sum ^{\infty }_{n=0}\frac{b_{n}}{n!} x^{n}
と展開できるとしよう。このとき
 \displaystyle f( 2x) =\sum ^{\infty }_{n=0}\frac{2^{n} a_{n}}{n!} x^{n}
となるので、x^nの係数を比べて
 \displaystyle 2^{n} a_{n} =-b_{n} +a_{n}
となるので
a_0=0,\quad a_{n} =-\frac{b_{n}}{2^{n} -1},\quad n\geq 1

を得る。n=0については後で計算するが、b_0=0なので、a_0=0としてよい。そして
\begin{align*}
F( x) & =\left( 1-e^{x}\right) f( x)\\
& =-\sum ^{\infty }_{n=1}\frac{1}{n!} x^{n}\sum ^{\infty }_{m=1}\frac{a_{m}}{m!} x^{m}\\
& =-\sum ^{\infty }_{n=1}\sum ^{\infty }_{m=1}\frac{1}{( n+m) !}\begin{pmatrix}
n+m\\
m
\end{pmatrix} a_{m} x^{n+m}\\
& =-\sum ^{\infty }_{n=2}\frac{x^{n}}{n!}\sum ^{n-1}_{m=1}\begin{pmatrix}
n\\
m
\end{pmatrix} a_{m}
\end{align*}
であるのでE_0=E_1=0
 \displaystyle E_{n} =-\sum ^{n-1}_{m=1}\begin{pmatrix}
n\\
m
\end{pmatrix} a_{m} =\sum ^{n-1}_{m=1}\begin{pmatrix}
n\\
m
\end{pmatrix}\frac{b_{m}}{2^{m} -1},\quad n\geq 2
とかけるわけだ。

あとはb_nを求めていくのだが、まずは項ごとに考えていく。まずは

 \displaystyle \frac{1}{3} e^{x} =\sum ^{\infty }_{n=0}\frac{1}{3\cdot n!} x^{n}=\frac{1}{3} +\sum ^{\infty }_{n=1}\frac{1}{3\cdot n!} x^{n}
がすぐに分かる。次に、ベルヌーイ数B_nの生成母関数
 \displaystyle \frac{x}{e^{x} -1} =\sum ^{\infty }_{n=0}\frac{B_{n}}{n!} x^{n}
を用いると
 \displaystyle -\frac{x}{e^{2x} -1} =-\frac{1}{2}\frac{2x}{e^{2x} -1} =-\frac{1}{2}\sum ^{\infty }_{n=0}\frac{B_{n}}{n!}( 2x)^{n} =\sum ^{\infty }_{n=0}\frac{-2^{n-1} B_{n}}{n!} x^{n}
ベルヌーイ数はB_0=1と定義されるのでn=0だけ、分けて書くと
 \displaystyle -\frac{x}{e^{2x} -1} =-\frac{1}{2} +\sum ^{\infty }_{n=1}\frac{-2^{n-1} B_{n}}{n!} x^{n}
となる。最後に
 \displaystyle \frac{1}{e^{x} +1} -\frac{1}{2} =-\frac{1}{2}\frac{e^{x} -1}{e^{x} +1} =-\frac{1}{2}\tanh\frac{x}{2}
であったので
 \displaystyle \frac{1}{3}\frac{1}{e^{x} +1} =\frac{1}{6} -\frac{1}{6}\tanh\frac{x}{2}
である。\tanh xのTaylor展開はベルヌーイ数を用いて
 \displaystyle \tanh x=\sum ^{\infty }_{n=1}\frac{2^{n+1}\left( 2^{n+1} -1\right)}{( n+1) !} B_{n+1} x^{n}
とかけるので
 \displaystyle \frac{1}{3}\frac{1}{e^{x} +1} =\frac{1}{6} -\sum ^{\infty }_{n=1}\frac{1}{n!}\frac{2^{n+1} -1}{3( n+1)} B_{n+1} x^{n}
となる。よって
 \displaystyle \sum ^{\infty }_{n=0}\frac{b_{n}}{n!} x^{n} =\sum ^{\infty }_{n=1}\frac{x^{n}}{n!}\left(\frac{1}{3} -\frac{2^{n+1} -1}{3( n+1)} B_{n+1} -2^{n-1} B_{n}\right)
となり、確かにb_0=0であり、n\geq 1では
 \displaystyle b_{n} =\frac{1}{3} -\frac{2^{n+1} -1}{3( n+1)} B_{n+1} -2^{n-1} B_{n}
と分かる。よって求めたかった期待値は
 \displaystyle E_{n} =\sum ^{n-1}_{m=1}\frac{1}{2^{m} -1}\begin{pmatrix}
n\\
m
\end{pmatrix}\left(\frac{1}{3} -\frac{2^{m+1} -1}{3( m+1)} B_{m+1} -2^{m-1} B_{m}\right)
である。

小さい値について計算すると

 \displaystyle E_{2} =\frac{3}{2} ,\ E_{3} =\frac{9}{4} ,\ E_{4} =\frac{45}{14}
と正しい値を出力してくれる。Mathematicaを使うと、n=100なんかも計算できて、ちゃんと有理数の値も分かるのだが、分子と分母が巨大すぎて書ききれないので、近似値をかくと
 \displaystyle E_{100} \simeq 1.355203941481465182\times 10^{17}
である。つまり、100人で勝ち残りじゃんけんをすると、平均して135,520,394,148,146,518回もじゃんけんを行う必要があることが分かる。これでは、1秒に1回じゃんけんが出来たとしても、43億年程度かかってしまう計算になる。これは地球の年齢45億年に匹敵する。また、あと3人増えただけで、つまり、103人では、かかる時間は145億年になり、宇宙の年齢を超してしまう。勝ち残りじゃんけんが如何に非効率かがとても分かる結果になった。

latex : table の caption ごと左寄せする方法

latex で文章を書いているとき、表を(cell ごとのでなく、全体を)左寄せに書きたいときがある。しかし

\documentclass{article}

\begin{document}
Hogehogehogehoge

\begin{table}[h]
\caption{Hoge}
\begin{tabular}{|c|c|c|c|}
\hline
A & B & C & D  \\
\hline
E & F & G & H \\ 
\hline
\end{tabular}
\end{table}

Hogehoge
\end{document}

このようにやると、出力が下のようになり、caption が取り残される。table 環境を flushleft 環境で囲っても同じ結果になる。
f:id:C-and-A:20200704144751p:plain:w500


これは threeparttable パッケージを使えば解決できた。下のように tabular 環境を threeparttable 環境で囲む。

\documentclass{article}

\usepackage{threeparttable}

\begin{document}
Hogehogehogehoge

\begin{table}[h]
\begin{threeparttable}
\caption{Hoge}
\begin{tabular}{|c|c|c|c|}
\hline
A & B & C & D  \\
\hline
E & F & G & H \\ 
\hline
\end{tabular}
\end{threeparttable}
\end{table}

Hogehoge
\end{document}

出力は下のようになり、caption も引っ張ってこれる。
f:id:C-and-A:20200704145912p:plain:w500


threeparttable にはほかにも機能がありそうなので、色々試してみたい。

とある関数方程式について

以前じゃんけんの期待値について記事を書いたとき
\displaystyle g\left( x^{2}\right) =-\frac{1}{3} x-\frac{1}{3( x+1)} +\frac{\ln x}{x^{2} -1} +g( x)
という関数方程式をといた。しかし、そのときの方法では x=1 の近傍で発散してしまい、発散級数の総和法を用いて有限値に落とし込むということをしなければならない。今回、別の解法を見つけたので、それを紹介する。(ただ、これも実際計算しようとすると簡単にはいかない)

問題
Q(x) を既知の x=1 の周りで C^{\infty} 級である関数とする。 x=1 の周りで C^{\infty} 級である関数 p(x)x=1 の近傍で
\displaystyle p(x^2)=Q(x)+p(x),\quad p(1)=Q(1)=0
を満たすとき、p(x) を求めよ。

解法

以降、x=1 の近傍に限って話を進める。つまり、大域的な解については考慮しない。

p(x),Q(x)C^{\infty} 級なので
\displaystyle p( x) =\sum _{n=1}^{\infty}p_{n}( x-1)^{n},\quad Q( x) =\sum _{n= 1}^{\infty}q_{n}( x-1)^{n}
と展開できる。この係数 p_k を求めることが本稿の目標となる。


低次の係数から見ていこう。
式を微分することにより
\displaystyle 2xp^{\prime }\left( x^{2}\right) =Q^{\prime }( x) +p^{\prime }( x)
これに x=1 を代入すれば
\displaystyle 2p_{1} =q_{1} +p_{1} \quad \therefore p_{1} =q_{1}
を得る。


もう一度微分すれば
\displaystyle 2p^{( 1)}\left( x^{2}\right) +4x^{2}p^{( 2)}\left( x^{2}\right) =Q^{( 2)}( x) +p^{( 2)}( x)
より
\displaystyle p_{2} =\frac{1}{3} q_{2} -\frac{1}{3} q_{1}
となる。


以下同様に n微分を施し、x=1 を代入すれば、左辺には p_1,....,p_n、右辺には q_n,p_n が現れ、p_1,...,p_{n-1} は既に求まっているので、p_n を求めることが出来る。
あとは p(x^2) の高階微分と無限個の連立方程式をとけば、p_n が求まる、のだが、これからが厄介。


合成関数の高階微分については、Faà di Bruno の公式というものがあり、それによれば f(g(x))n微分
\displaystyle \frac{d^{n}}{dx^{n}} f( g( x)) =\sum ^{n}_{i=1}\sum _{( s)} n!f^{( i)}( g( x))\prod ^{n-i+1}_{k=1}\frac{1}{s_{k} !}\left[\frac{g^{( k)}( x)}{k!}\right]^{s_{k}}
とかける。なお、\displaystyle\sum_{(s)}
\displaystyle s_{1} +\cdots +s_{n-i+1} =i,\quad\ 1\cdot s_{1} +2\cdot s_{2} +\cdots +( n-i+1) s_{n-i+1} =n
を満たす非負整数の組 s=\left (s_1,...,s_{n-i+1}\right) についての総和を表す。また 0^0=1 とする。


これを p(x^2) に適応すると、(x^2)^{(1)}=2x, (x^2)^{(2)}=2, (x^2)^{(n)}=0, n\geq 3 であるので、sum の中が消えないためには i\leq n-1
\displaystyle s_{1} +s_{2} =i,\ s_{1} +2s_{2} =n,\ s_{k} =0,\ k\geq 3
i=n
\displaystyle s_{1} =n,\ s_{k} =0,\ k\geq 2
つまり
\displaystyle s_{1} =2i-n,\ s_{2} =n-i,\ s_{k} =0,\ k\geq 3
をみたす。よって
\displaystyle \begin{align}\frac{d^{n}}{dx^{n}} p\left( x^{2}\right) &=\sum _{n/2\leq i\leq n} n! p^{( i)}\left( x^{2}\right)\frac{1}{( 2i-n) !}\left[\frac{2x}{1!}\right]^{2i-n}\frac{1}{( n-i) !}\left[\frac{2}{2!}\right]^{n-i}\\
&=\sum _{n/2\leq i\leq n}\frac{n!2^{2i-n}}{( 2i-n) !( n-i) !} x^{2i-n} p^{( i)}\left( x^{2}\right)\end{align}
となることが分かる。n が偶数ならば n/2 から、奇数ならば (n+1)/2 からの和になる。


p(x^2)微分公式が導けたので、x=1 を代入し連立方程式
\displaystyle \sum _{n/2\leq m\leq n}\frac{n!2^{2m-n}}{( 2m-n) !( n-m) !} \cdot m!p_{m} -n!p_{n} =n!q_{n} ,\ n\in \mathbb{N}
を得る。


見通しをよくするため
\displaystyle a_{nm} =\begin{cases}
\binom{m}{2m-n} 2^{2m-n} & n/2\leq m< n\\
2^{n}-1 & n=m\\
0 & otherwise
\end{cases}
と書こう。なお、\binom{m}{2m-n} は二項係数である。このとき、連立方程式
\displaystyle \sum ^{\infty }_{m=1} a_{nm} p_{m} =q_{n}
と表せる。無限次元ベクトルと無限次元行列
\displaystyle \boldsymbol{p} =\left( \begin{array}{{>{\displaystyle}l}}
p_{1}\\
p_{2}\\
\vdots 
\end{array}\right) ,\ \boldsymbol{q} =\left(  \begin{array}{{>{\displaystyle}l}}
q_{1}\\
q_{2}\\
\vdots 
\end{array}\right) ,\ A=\begin{pmatrix}
a_{11} & a_{12} & \cdots \\
a_{21} & a_{22} & \cdots \\
\vdots  & \vdots  & \ddots 
\end{pmatrix}
を用いれば
A\boldsymbol{p}=\boldsymbol{q}
つまり、A逆行列 B が分かれば
\boldsymbol{p}=B\boldsymbol{q}
と解ける。


この A について、詳しく見ていこう。a_{nm} の定義から A は下三角行列である。これはとてもうれしい。なぜなら、無限次元行列の逆行列という見るからにエグいものが、有限次元に落とすことが出来る。つまり、B の左上の n\times n 行列(以降、小 n 次行列と呼ぼう)は An 次行列の逆行列になる。
\displaystyle \begin{pmatrix}
B_{11} & O\\
B_{21} & B_{22}
\end{pmatrix}\begin{pmatrix}
A_{11} & O\\
A_{21} & A_{22}
\end{pmatrix} =\begin{pmatrix}
B_{11} A_{11} & O\\
B_{21} A_{11} +B_{22} A_{21} & B_{22} A_{22}
\end{pmatrix}
とかけることからも明らかであろう(もっと一般に、A の対角線上のどの正方行列に対しても、対応する B の正方行列は逆行列になる)。そして、下三角行列の逆行列は下三角行列になるので、B\boldsymbol{q} が有限和になる。特に p_n を求めるのに q_{n+1} 以降の情報は不要である。また n/2\leq m\leq n という条件から non-zero の項だけ書けば
\displaystyle A=\begin{pmatrix}
a_{11} &  &  &  &  &  & \\
a_{21} & a_{22} &  &  &  &  & \\
 & a_{32} & a_{33} &  &  &  & \\
 & a_{42} & a_{43} & a_{44} &  &  & \\
 &  & a_{53} & a_{54} & a_{55} &  & \\
 &  & a_{63} & a_{64} & a_{65} & a_{66} & \\
 &  &  & \vdots  & \vdots  & \vdots  & \ddots 
\end{pmatrix}
と縦横どちらも行列の non-zero でない成分は高々有限個。


基本行列
\displaystyle R_{i} =\begin{pmatrix}
1 &  &  &  &  & \\
 & \ddots  &  &  &  & \\
 &  & 1 &  &  & \\
 &  &  & a^{-1}_{ii} &  & \\
 &  &  &  & 1 & \\
 &  &  &  &  & \ddots 
\end{pmatrix} ,\ \ ( R_{i})_{nm} =\begin{cases}
1 & n=m\neq i\\
a^{-1}_{ii} & n=m=i\\
0 & \mathrm{otherwise}
\end{cases}
 \displaystyle S_{ij} =\begin{pmatrix}
1 &  &  &  &  & \\
 & \ddots  &  &  &  & \\
 &  & 1 &  &  & \\
 &  &  & \ddots  &  & \\
 &  & -a_{ij} &  & 1 & \\
 &  &  &  &  & \ddots 
\end{pmatrix},\ \ 
( S_{ij})_{nm} =\begin{cases}
1 & n=m\\
 -a_{ij}  & n=i > m=j\\
0 & \mathrm{otherwise}
\end{cases}
A に左から
\displaystyle \cdots R_{4} S_{63} S_{53} S_{43} R_{3} S_{42} S_{32} R_{2} S_{21} R_{1} A
のようにかけよう。左に三点リーダがあり気持ち悪い気もするが
\displaystyle \cdots R_{3} S_{42} S_{32} R_{2} S_{21} R_{1} =\lim _{N\rightarrow \infty } R_{N} S_{2N-2,N-1} \cdots S_{21} R_{1}
のように解釈してほしい。R_NR_{N-1} の間には S_{2N-2,N-1}\cdots S_{N,N-1} を挟む。収束先が存在するかはあとで述べよう。
AR_1 をかけると、 A の(本当は R_1 A の、だが分かるだろう) (1,1) 成分が 1 になる。更に S_{21} をかけると、(2,1) 成分が 0 になる。更に R_2 をかけると、(2,2) 成分が 0 になる。といったように、小 1 次行列から順に単位行列にしていく。R_n までかければ、A の小 n 次行列が単位行列になることもわかる。以降の S_{n+1,n} などは全て小 n 次行列が単位行列であり、これらはまた下三角行列であるので、A の小 n 次行列が単位行列から崩れることはない。これより
\displaystyle B=\cdots R_{3} S_{42} S_{32} R_{2} S_{21} R_{1}
となる。


さて、収束先 B が存在することを示そう。
\displaystyle B_{N} =R_{N} S_{2N-2,N-1} \cdots S_{21} R_{1}
の行列要素を b^{(N)}_{nm} とし
\displaystyle b_{nm}=\lim _{N\rightarrow \infty } b^{( N)}_{nm}
が存在すること(つまり、行列の2乗ノルムに対する収束)を言えばよい。
まず、R_n,S_{nm} らは下三角行列であるので、B_N も下三角行列。よって b_{nm} =0,\ (n< m) 、つまり、先にも述べたが、B は下三角行列。また、R_n 以降の基本行列は全て小 n 行列が単位行列なので、B_n 以降の小 n 行列は変化しない。そして、B_n の成分は有限和なので収束し b_{nm}=b^{(n)}_{nm}, (n\geq m) となる。
しかし、証明が出来たわけではないのだが、B の下三角成分に 0 は存在しないだろう。つまり、残念ながら、B は線形写像ではない。どういうことかというと、例えば、\boldsymbol{q} = ^t\!\!( 1,0,0,\cdots ) のとき、\boldsymbol{p} = ^t\!\!( b_{11} ,b_{21} ,b_{31} ,\cdots ) となり、\boldsymbol{p} はベクトル空間の元ではなくなる(無限次元ベクトル空間の元は有限個の基底の線形和で与えられる)。
このことは、Q(x)多項式であっても、p(x)多項式になるとは限らないということを意味する。逆に、A は線形写像になるので、p(x)多項式ならば Q(x)多項式である。


b_{nm} の一般項を明示的に表すのは困難なので(出来なくはないだろうが、じゃんけんの一般項みたいにSigma, Sigma, Sigma になるので)、これで逆行列は求まったということにしてほしい。実際、行列要素はもとめることが出来るのだから問題ないだろう。因みに
\displaystyle A=\begin{pmatrix}
1 &  &  &  &  &  & \\
1 & 3 &  &  &  &  & \\
 & 4 & 7 &  &  &  & \\
 & 1 & 12 & 15 &  &  & \\
 &  & 6 & 32 & 31 &  & \\
 &  & 1 & 24 & 80 & 63 & \\
 &  &  & \vdots  & \vdots  & \vdots  & \ddots 
\end{pmatrix}
\displaystyle B_{6} =\begin{pmatrix}
1 &  &  &  &  &  & \\
 -\frac{1}{3} & \frac{1}{3} &  &  &  &  & \\
\frac{4}{21} & -\frac{4}{21} & \frac{1}{7} &  &  &  & \\
 -\frac{41}{315} & \frac{41}{315} & -\frac{4}{35} & \frac{1}{15} &  &  & \\
\frac{136}{1395} & -\frac{136}{1395} & \frac{14}{155} & -\frac{32}{465} & \frac{1}{31} &  & \\
 -\frac{6788}{87885} & \frac{6788}{87885} & -\frac{239}{3255} & \frac{1816}{29295} & -\frac{80}{1953} & \frac{1}{63} & \\
\vdots  & \vdots  & \vdots  & \vdots  & \vdots  & \vdots  & \ddots 
\end{pmatrix}
となる。


実際 p_n を求めるときは q_{n+1} 以降の情報は要らない、つまり、B の小 n 行列が確定していればいいので、
\displaystyle \begin{pmatrix}
p_{1}\\
\vdots \\
p_{n}\\
 *\\
\vdots 
\end{pmatrix} =B_{n}\begin{pmatrix}
q_{1}\\
\vdots \\
q_{n}\\
0\\
\vdots 
\end{pmatrix}
でよろしい。p_{n+1} 以降は正しくならないので * と書いた。
\displaystyle p_{n} =\left(\right.\overbrace{0,\cdots ,0}^{n-1}\left. ,1,0\cdots \right) B_{n}\begin{pmatrix}
q_{1}\\
\vdots \\
q_{n}\\
0\\
\vdots 
\end{pmatrix} =^{t}\boldsymbol{e}_{n} B\boldsymbol{q}
のように書くこともできるだろう。この表示を使えば
\displaystyle \begin{align}p( x) &=\sum ^{\infty }_{n=1} p_{n}( x-1)^{n} \\
&=\sum ^{\infty }_{n=1}( x-1)^{n}\ ^t\boldsymbol{e}_{n} B\boldsymbol{q}\\
&=\left( x-1,( x-1)^{2} ,( x-1)^{3} ,\cdots \right) B\boldsymbol{q}\end{align}
これをもって関数方程式はとけたと言い張ろうと思う。