根の成長を数式モデル化することで、側根の長さを比較する
生物学には数式モデルから実際の生物学的現象を説明する、”数理生物”と呼ばれる分野が存在します。数理生物学では、生物学的現象を物理学・化学の公式で解析的に記述し、現象の”核”となっている物理・化学的現象を解き明かします。
数理生物学は大きな分野で、実際の生物学的現象をうまく説明したモデルは山のようにあります(Monsi and Saeki 1953など)。しかし、一般的なモデルでは現実のデータと解析的に明らかにされた予測との間をつなぐのが非常に困難です。そもそも生物学的現象はバラツキを持ちますし、解析的な予測と完全一致する現象はまれです。では、どの程度予測と現象が一致していれば、そのモデルが正しいと言えるのでしょうか?
このデータとモデルの不一致性と、一致の度合いの問題については昔から疑問を持っていました。予測と現象が一致しないときはモデルがおかしいのか、データがおかしいのか、それとも両方問題があるのか、多くの場合不明です。データとモデルの一致を検証する方法がなければ、モデルの正しさを説明できません。
このページで説明する方法は、逆のアプローチを取っています。つまり、データを説明できる数式を準備することで、データを説明する要因を求める、というアプローチです。この方法では、データと数式を一致させるため、モデルの正しさは担保できます。一方で、モデルは物理学・化学の公式に基づかないため、”本当の現象”には近づきません。
本研究が”モデル”と”データ”を近づける一助になればよい、と考えております。
図:側根の長さを説明する変数
側根の長さは5つの独立したパラメータで説明できる。2つのライン間の側根の伸長速度の違いを側根の長さで示すにはtypeAのようでないといけないが、実際はtypeBのように各パラメータにそれぞれ差がある。そのため、側根の長さでは側根の伸長速度は説明できない。
図2: 回帰に用いた数式
赤文字で示したパラメータが根の形態を反映する。パラメータは実験結果からMCMCを利用して計算した。PRは主根、LRNはすべての側根の数(出てきた側根+側根原基の数)、PLRNは出てきた側根の数、LRは側根の長さの総和、tは時間(単位はday)。計算したパラメータを比較することで、根のどの特徴が異なっているのかそれぞれ独立に推定できる。
数式だけ見ると何をやってるのかよくわかりませんが、要は2パラメータずつ(例えば主根と側根の総数)の回帰を時間tを考慮に入れつつ4段階スタックして行う、ということをやっている(はず)です。この回帰は複雑すぎる上にそもそもデータは正規分布しないので、Newton法や一般線形モデルなどで回帰することはできません。そこでMCMCを利用したベイズモデルでの回帰を行いました。この回帰の結果から、(1)
窒素が多いと側根の伸長速度が遅くなる、(2) 窒素が少なすぎると主根が短くなり側根が出てきにくくなる、(3) アンモニアで育てると側根が出てきやすくなるが、根の伸長は抑えられる、ということがわかりました。
さらっと書くと簡単ですが、正直これで全部正しいかと言うとちょっと微妙なところです。特に、側根が出てくるかどうかを判別するところ(PLRNの数式)は数式に時間を含んでいるので、側根が出てくる割合(数式の右のロジスティック式)は時間と独立ではないというのが気にかかるところです(そしてこのあたりが論文の結論に関わっています)。さらに、結果は時系列なのに、解析は時系列っぽくない(時系列データはこんな感じでモデル化することが多いようです、が、なかなか難しい上に合目的的でない)のもどうなのかというところではあります。他にもいろいろ気になるところはあります(初期値の設定がとても恣意的、結果の解釈も恣意的と言えば恣意的、この数式が本当に正しいモデルなのか評価するのが難しい、というか比較的フィットしやすいモデルではあるけど”生物学の理論”的に正しいモデルではありえない、そもそも収束がそれほどよくない上に収束に時間がかかりすぎる、出てきたパラメータの範囲から差があるとかないとか断言することはできない等)。何より僕はともかくEditorもReviewerもおそらくこれが正しいかどうか正確に判断できないけど論文は通るというあたり、これで本当にいいのかなあという気もします。いろいろ後々批判を受けそうですが、植物生理学の分野でベイズモデルを利用した仕事はおそらくこれが初めて(か、限りなく初めてに近い)なので、いろいろ批判を受けつつみんなが統計モデルを利用するようになっていけばいいんじゃないかと思っています。
論文で利用した統計的手法は「データ解析のための統計モデリング入門」に詳細に記載されています。基本的なRの使い方は「The R tips(もしくはhttp://cse.naro.affrc.go.jp/takezawa/r-tips/r.html)」、グラフの記述は「ggplot2: Elegant Graphics for Data Analysis 」と「Rグラフィックスクックブック」を参考にしました。MCMCは上記の久保さんのホームページやこのページ、もしくはSlideshareのいくつかのスライド(これとかこれとかこれとか)を参考に勉強しました。