walkingsdbgの日記

データ分析技術(機械学習・統計等)についてのメモを書きます。

長期投資における投資比率の最適化(2/2)

はじめに

 前回の記事では、期待対数効用のもとで最適な投資比率が満たすべき方程式を導出しました。しかし、この方程式を具体的に解くには、投資対象の金融資産を選び、さらに、それらの収益率の確率分布を求める必要があります。そこで本記事では、金融資産の選定と確率分布の推定を行い、投資比率の最適解を導出します。さらに、推定された収益率の確率分布を用いて資産運用のシミュレーションを行い、様々な投資比率における結果を比較します。なお、登場する数式・記号の定義は前回の記事に従います。

投資対象の金融資産の選定

 適当なインデックスファンド1つを投資対象として選びます。この理由は以下の通りです。

  1. 資産運用が簡単になるから。
  2. (とある強い仮定の下で)ボラティリティの意味でリスクをほぼ最小化するから。
  3. NISAを利用できるものが多いから。

 理由1について、投資する金融資産を1種類に絞ることで、データの取得、収益率の確率分布のモデリング、そして資産の売買の手間が減らせます。あまり投資に時間と労力を割きたくないと考える自分にとっては魅力的です。
 理由2の仮定とは、「全ての投資家が、金融資産の収益率の平均・分散・共分散について同じ情報を持ち、また、これらの情報に基づくとある共通のリスク回避的投資方法に従う」というものです。この仮定の下で、収益率のボラティリティを最小化する投資方法は、無リスク資産と市場平均ポートフォリオの組合せであることが知られています(1ファンド定理)*1。市場平均ポートフォリオ個人投資家が購入するのは手間ですが、インデックスファンドが市場平均ポートフォリオを近似するため、これに投資することがボラティリティをほぼ最小化すると考えられます。注意点として、1ファンド定理の仮定は実際の市場で厳密に成立しません。しかし、この仮定にある程度納得感があるのと、理由1で述べたように投資の負担が非常に小さくなる(インデックスファンドへの投資だけ考えればよい)ので、この仮定を受け入れて投資を行うことにします。
 理由3は、(決められた上限額まで)運用益が非課税であるため、その分だけ資産を増やせることを意味します。本来は運用益に対して20%の税金がかかるので、多くのインデックスファンドに対してNISAを利用して投資できるのは魅力的です。

金融資産の収益率の確率分布のモデリング

 以下のインデックスファンドの月次収益率のデータを用いて、1期先の収益率の確率分布 p(R_{t+1} | R_{1:t})を推定します。
emaxis.am.mufg.jp
 時系列データをモデリングする際には、主にトレンド・自己相関・周期性に注意する必要がありますが、これらをグラフからざっくり判断します。

  • 月次収益率の時系列

 顕著なトレンドは見当たりません。

  • 月次収益率の自己相関(コレログラム)

 自己相関も小さいです。また、12期前の自己相関が小さいことから、年単位の周期性もなさそうです。

上のグラフから、月次収益率R_tに明確なトレンド・自己相関・周期性は見当たらないことがわかります。したがって、月次収益率R_tは各時刻で独立かつ同一の分布に従うと仮定します。
 月次収益率R_tの確率分布をモデリングするため、このヒストグラムを見てみます。

上図から示唆されることは以下の通りです。

  • 単峰性である。
  • 左に裾が長い。

これらの特徴を表現できる確率分布として、以下のGumbel分布を用います。


 R_t \sim f \left( \left. R_t \right| \mu, \beta \right) = \frac{1}{\beta}\exp\left\{-\frac{R_t - \mu}{\beta} \exp\left( -\frac{R_t - \mu}{\beta} \right) \right\}
この分布は2つの未知パラメータ\mu,\betaを持つため、これらを最尤法で推定します。ただし、Gumbel分布は「右に」裾が長いため、収益率の符号を反転させたデータに対してパラメータを推定します。その結果、以下の推定値が得られました。

 \hat{\mu} = -0.037, \hat{\beta} = 0.040
この推定値を用いて、収益率のヒストグラムとGumbel分布(をy軸に関して反転させたもの)を重ねて書いたものが下図です。収益率の分布の性質が表現できているように見えます。

 ただし、限られたデータから推定した \hat{\mu}, \hat{\beta}はばらつきを持っています。さらに、将来もこの分布に従うかは不明なので、保守的な推定値を代わりに使いたいです。そこで、収益率の最頻値を表すパラメータ\muについては、最尤推定値の代わりに、その近似的な信頼区間の上限 {\hat{\mu}}_{ub}を用います。

 {\hat{\mu}}_{ub} = \hat{\mu} + \frac{z_{{\alpha}/{2}}}{nI_{1}\left( \mu \right)}
ここで、z_{{\alpha}/{2}}は標準正規分布の両側\alpha点、nはデータ数、I_{1}\left( \mu \right)はデータ1点あたりのフィッシャー情報量を表します。このフィッシャー情報量を厳密に計算することは困難なので、以下のように近次します。

 {
\displaystyle  
\begin{eqnarray}
I_{1}\left( \mu \right) 
&=&  E \left[ \frac{{\partial}^2}{\partial {\mu}^2}\left( \log f \left( \left. R_t \right| \mu, \beta \right) \right) \right] \\
&=&  \frac{1}{{\beta}^2}E \left[ \exp\left( -\frac{R_t - \mu}{\beta} \right) \right] \\
&\approx& \frac{1}{{\hat{\beta}}^2}E \left[ \exp\left( -\frac{R_t - \hat{\mu}}{\hat{\beta}} \right) \right] \\
&\approx& \frac{1}{{\hat{\beta}}^2} \frac{1}{N_\mathrm{MC}}\sum_{i=1}^{N_\mathrm{MC}} \exp\left( -\frac{R_{t,i} - \hat{\mu}}{\hat{\beta}} \right)
\end{eqnarray}
}
ここで、2行目から3行目ではパラメータ \mu, \beta最尤推定 \hat{\mu}, \hat{\beta}に置き換え、また、3行目から4行目ではモンテカルロ法による期待値の近似を行っています。なお、 N_\mathrm{MC}モンテカルロ法のサンプルサイズを表します。 N_\mathrm{MC}=100000として上式を計算すると、 {\hat{\mu}}_{ub}=-0.028と推定されました。これを用いて、各時刻の収益率R_tは独立に以下の分布に従うと仮定します。

 R_t \sim \frac{1}{\hat{\beta}}\exp\left\{-\frac{R_t - {\hat{\mu}}_{ub}}{\hat{\beta}} \exp\left( -\frac{R_t - {\hat{\mu}}_{ub}}{\hat{\beta}} \right) \right\} \tag{1}

各期の投資比率の最適解の導出

 前節で得られた収益率の確率分布を用いて、前回の記事で求めた以下の方程式を解くことで、インデックスファンドへの投資比率の最適解を求めます。ただし、この方程式の右辺は解析的に計算できないので、モンテカルロ法で近似します。


 E \left[ \left. \frac{R_{t+1}-R_{f,t}}{\left( 1+R_{f,t}+C_t+\omega^{*} \left( R_{t+1}-R_{f,t} \right) \right)} \right| S_{t} \right]=0
この左辺を様々な\omegaに対して計算したのが下図の黒の曲線です。縦軸が左辺の値、横軸が投資比率 \omegaを表します。また、赤の直線が右辺を表しており、これと黒の曲線の交点が投資比率の最適解 \omega^{*}を表します。

上図より、最適解は150~160%であり、100%を大きく上回っていることが分かります。これは、借金をしながらインデックスファンドに投資することを意味するので、非常にリスクが高い戦略であることが分かります。前回の記事で、期待対数効用の最大化は(期待値の最大化より)リスク回避的と述べましたが、それでもなおリスクが大きすぎることが分かりました。

資産運用のシミュレーションによる評価

 前節では、期待対数効用のもとでの最適解ですら現実的でないことを示しました。そこで本節では、投資比率を適当な範囲に制限してシミュレーションを行い、損失リスクと収益のバランスを見ることで、自分にとってベストな投資割合を探します。シミュレーションの設定は以下の通りです。

  • 最初の資産は100万円とする。
  • 投資とは別に定期的な収入があり、毎月5万円ずつ資産が増加する。
  • 投資対象は上記のインデックスファンドであり、その月次収益率は式(1)に従う。
  • 月に一度、一定の投資比率となるようリバランスを行う。
  • 運用期間は35年とする。

上記の設定のもとで、投資比率を10%、30%、50%とした場合の最終的な資産の分布を以下に示します。なお、赤の直線は、投資比率が0%である(=貯金のみを行う)場合の最終的な資産を表します。

投資比率10%の場合の最終資産の分布[単位:万円]
投資比率30%の場合の最終資産の分布[単位:万円]
投資比率50%の場合の最終資産の分布[単位:万円]

上図より、投資割合を高めるほど、最終的な資産の取りうる金額の範囲が大きくなることが分かります。リスク回避を重視する場合は、左側の裾を見て性能を評価するのが良いと思います。例えば、老後に必要な貯金額を2000万円と仮定すると、最終的な資産の分布の最小値がこれを上回るような投資比率(約10%)を選ぶのが良さそうです。

まとめ

 本記事では、投資比率の最適解を求めるため、インデックスファンド1種類を投資対象として選び、その月次収益率の確率分布を推定しました。しかし、その分布に基づいて期待対数効用を最大化する最適解を計算した結果、借金をしながら投資を行う非常に高リスクな投資方法であることが判明しました。そこで、代わりに様々な固定比率で資産運用のシミュレーションを行い、最終的な資産の分布に基づいて、リスクの許容度に見合った投資比率を検討しました。