論文から学ぶ研究の進め方~仮説駆動型の研究 (Hypothesis-driven research)

もともと記載的な学問である解剖学などは別として、サイエンスの世界ではまず仮説を立ててそれを検証するという仮説駆動型研究が”作法”であり、今後もそうそう変わらないでしょう。ビッグデータの時代といわれている現在は、最初にデータありきの「データ駆動型」研究もあるとは思いますが、解析方法を選ぶ際に、そこになんらかの仮説が存在しているはずです。

研究費の申請書を書くにしても、論文を書くにしても、プレゼンテーションをするにしても、検証すべき仮説が中心に据えられます。にもかかわらず、仮説駆動型の研究姿勢が日本で十分に教育されてきたかといえば、不思議なことに全くそうはみえません。

研究のやり方の違いにもびっくりしました。日本では、針でも突っ込んで何が出てくるか見てみようという調子だけれど、エックルス先生は、予想を頭の中で組み立て、計画的に実験する。(未知に挑戦する私の脳  伊藤 正男  JT生命誌研究館 サイエンティスト・ライブラリー

大学院生が仮説不在のまま5年間なんとなく実験を続けて何かしら実験結果を得たとしても、完全に手遅れであり、それらのデータをもとに良いストーリーをつくることは困難です。

研究を始める時、計画を立てるとき、実験をするときには、必ず自分なりの仮説を構築してから始める癖をつけてください。そうすることが、結局はゴールへの最短で最善の道になるのです。仮説も無しに、やってみなければ分からない、やってみたらできるかもしれないと力任せに実験をするような愚かな真似を決してしないでくださいそんな事をしてもサイエンスとしては何の意味も 無く、ただの博打でしかないのですから。(必ず仮説を定義する 総合技術コンサルティング&人材育成 ジャパン・リサーチ・ラボ)

一つの研究はその成果を論文にまとめることにより一区切りつくわけですが、良いストーリーがないと良い論文にはなりません。また、仮説が書かれていない研究提案書で研究費を申請しても、通る可能性は低いでしょう。「仮説」と聞くと仰々しく感じる人がいるかもしれませんが、そもそも研究の場で使われる仮説とは何でしょうか?

 「まず実験をしてみてそれから考えよう」ということは多くの研究者がとっている姿勢で、一見これには仮説がないように思えるが、本当は違うと思う。例えば、変異体の遺伝学的スクリーニングは、関与している遺伝子の存在を仮定してそれを検証する実験であるし、あるタンパク質の細胞内局在を見る実験は、それが特定のオルガネラや領域に局在しているのではないかという仮説の検証である。ただ、仮説をどれだけ意識するか、どれだけ深い仮説をもつかには研究者によって大きな違いがあると思う。グラント申請レベルのプロジェクトに仮説があるのは当然であるが、どんなに些細な実験にも仮説は存在するはずである。仮説がなければ検証不可能で、そのような実験は目的を失っている。…(【細胞生物,Vol 15, No. 1 (2004)巻頭言より転載】東京大学大学院医学系研究科 水島研究室 分子生物学分野

仮説とは、簡単にいえば、「合理性のある提案」だとDavid Lindsay氏は著書の中で説明しています。ただし仮説は2つの特徴を備えていなければなりません。一つは「これまでの知見と矛盾しない」こと。もう一つは「検証可能である」ことです。

There are many texts on the philosophy of science and scientific method that deal extensively with the hypothesis but, in short, we can describe it as ‘a reasonable scientific proposal’. It is not a statement of fact but a statement that takes us just beyond known information and anticipates the next logical step in a sequence of supportable precepts. The hypothesis has to have two attributes to be useful in scientific investigation: it must fit the known information and it must be testable. To comply with the first attribute, you the scientist have to read and understand the literature. To comply with the second, you have to do an experiments. In essence, the paper you are about to write concerns nothing other than those two things. You can see why the hypothesis is so central to scientific writing. (強調のため一部太字 引用元:David Lindsay, Scientific Writing = Thinking in Words, page 7)

あまり教育的でない研究室に入ってしまった大学院生であっても、実際の論文を読むことにより仮説駆動型研究の何たるかを学ぶことができます。論文を構成する上でhypothesisがどのように使われているかを、以下、5つの論文を例に見てみます。

(1)その研究分野における比較的大きな仮説

この例ではまず仮説を提示し、仮説を検証するための実験結果を述べ、その実験結果が仮説に合うものであったと結論しています。

Neuronal oscillations have been hypothesized to play an important role in cognition and its ensuing behavior, but evidence that links a specific neuronal oscillation to a discrete cognitive event is largely lacking. We measured neuronal activity in the entorhinal-hippocampal circuit while mice performed a reward-based spatial working memory task. During the memory retention period, a transient burst of high gamma synchronization preceded an animal’s correct choice in both prospective planning and retrospective mistake correction, but not an animal’s incorrect choice. Optogenetic inhibition of the circuit targeted to the choice point area resulted in a coordinated reduction in both high gamma synchrony and correct execution of a working-memory-guided behavior. These findings suggest that transient high gamma synchrony contributes to the successful execution of spatial working memory. Furthermore, our data are consistent with an association between transient high gamma synchrony and explicit awareness of the working memory content. (強調のため一部太字 引用元:Cell 157(4):845-857の要旨)

(2)実験一つ分の小さな仮説

仮説と一口にいっても、ある研究分野に何十年も君臨しているような大きなものから、下の例のように、研究論文の中で自分で設定した小さな仮説まで様々なものがありえます。

Given that LPA is known to activate cortical contractility via the Rho/Rock pathway, we hypothesized that a mechanical polarization mechanism of the cell cortex could trigger the transformation of progenitor cells into stable-bleb cells (Carvalho et al., 2013). To test this hypothesis, we treated stable-bleb cells with the Rho kinase inhibitor Y-27632 or the myosin-II inhibitor Blebbistatin (Figure 2C). Treated cells lost their characteristic polarization, supporting a critical role for Rho/Rock-mediated cortical contractility in driving stable-bleb cell transformation. (強調のため一部太字 引用元:Cell 160(4):673-685のResultsセクションの一部)

(3)論文一つをまとめるための仮説

Hyothesizeという言葉は研究論文で比較的広い意味合いで用いられることもあります。下の例では、採用した方法論の有効性を示すのにHyothesizeという言葉が使われています。

Since computational modeling suggests that a failure to segregate protein damage may result in a reduced fitness (Erjavec et al., 2008) and functions crucial for cellular fitness are often performed by parallel partly redundant pathways, we hypothesized that machineries involved in the partitioning of protein aggregates could be identified by systematically screening for genetic interactions between SIR2 and nonessential and essential genes using synthetic genetic arrays (SGA) analysis ( Tong et al., 2001 and Tong et al., 2004). Using this approach, we found that cells lacking Sir2p share many genetic interactions with the conditional actin mutant, which is a result of sir2Δ cells showing a defect in CCT-chaperonin-dependent folding of actin. (強調のため一部太字 引用元:Cell 140(2):257-267 イントロダクション)

(4)因子を発見するための仮説

何か新規の因子を(偶然)発見した場合には仮説に基づいたストーリーを作りにくいのではないかと思う人がいるかもしれませんが、そんなことはありません。合理的な理由に基づいてある因子の存在を仮定し、その因子が満たすべき条件を挙げ、実際にそれらの条件を満たす因子を発見したという下の論文のような論理展開は、実際の発見のいきさつがどうであれ適用可能です。

Given the potential for nutrients to stimulate inflammatory pathways and the importance of keeping these pathways in check, we hypothesized that previously unrecognized counterregulatory mechanisms might exist to protect cells from activation of inflammatory pathways during physiological fluctuations in nutrient exposure or in nutrient-rich conditions. We reasoned that a factor participating in such a coordinating mechanism between nutrient and inflammatory responses would be expected to meet several criteria: (1) the gene product should be present in tissue types responsible for nutrient clearance from blood, such as adipose tissue; (2) expression or activity should be regulated by both nutritional and inflammatory stimuli; (3) the factor should regulate inflammatory signaling components and/or gene expression (cells or tissues lacking such a factor would then exhibit excess or prolonged inflammation in response to challenges by both nutrients and inflammatory mediators); (4) the factor should regulate cellular metabolism, and its absence should result in impaired cellular metabolic function; and (5) through regulation of metabolic function in particular cell types and organs, the factor should also impact systemic metabolism.
In this study, we identify six-transmembrane protein of prostate 2 (STAMP2) as a factor meeting these criteria. (強調のため一部太字 引用元:Cell 129(3):537-548 イントロダクション)

(5)複数の仮説の検討

ある現象を説明するために(相対立する)複数の仮説を提示し、各々から予言される内容と実際の実験結果との整合性を検証することによりどちらの仮説が正しいかを示すという組み立て方も論文に強い説得力を与えます。

At present, two theories attempt to link airway epithelial ion transport to lung defense and predict how mutations in CFTR adversely affect these relationships. One theory, the “hypotonic (low salt) ASL/defensin” hypothesis, postulates that normal airway epithelia are covered by an ASL with a [NaCl] sufficiently low (≤ 50 mM NaCl) to activate defensins and create an antimicrobial “shield” on airway surfaces (31, 38 and 10). Generation of a low [NaCl], hypotonic ASL reflects selective transepithelial absorption of salt but not water from ASL, presumably a consequence of putative airway epithelial water impermeability or surface forces (31, 44 and 46). Defensin inactivation by iso- or hypertonic ASL (i.e., [NaCl] > 100 mM) in CF is postulated to reflect the Cl impermeability of CF epithelial cells (38 and 10). The second theory, the “isotonic volume transport/mucus clearance hypothesis,” predicts that airway epithelia regulate the volume (height) of ASL by isotonic ion and water transport to optimize mucus clearance (Boucher 1994a). In CF, the rate of isotonic ion and water (volume) transport is abnormally high, which is predicted to reduce ASL volume, concentrate mucus, and lead to abnormal mucus transport and retention of tenacious mucus masses (plaques) in airways that serve as the nidus of infection (14 and 5).
… By measuring ASL ion composition, we tested key predictions of the hypotonic (low salt) ASL/defensin hypothesis: (1) that normal airway epithelia generate and maintain hypotonic (or low salt) solutions on airway surfaces, and (2) that CF airway surface liquid is isotonic (Joris et al. 1993) or hypertonic (with excess salt) (Gilljam et al. 1989). A second series of experiments tested key aspects of the isotonic hypothesis: (1) that normal airway epithelia are isotonic volume-absorbing epithelia that produce an isotonic ASL; (2) that CF airway epithelia absorb volume isotonically at abnormally high rates; and (3) that mucus transport is deranged by depletion of the ASL through excessive isotonic volume absorption. (強調のため一部太字 引用元:Cell 95(7):1005-1015のイントロダクションの一部を抜粋)

Good science would pit theory A against theories B, C, D and E with an experiment where each theory gave different predictions. (引用元:Nakagawa and Cuthill. Effect size, confidence interval and statistical significance: a practical guide for biologists. Biol. Rev. (2007), 82, pp. 591–605. doi:10.1111/j.1469-185X.2007.00027.x

いずれにせよ、仮説の提示→検証結果の報告という流れにするのが典型的な論文の書き方です。しかし、実験科学ではそもそもうまくいくはずの実験が最初のステップで躓いたり、予想に反したことが結果が得られることも多いので、実験データが何も得られていない段階で仮説を立てることに抵抗感がある人もいるかもしれません。その点に関しては、Whitesides博士のアドバイスが参考になります。

当初は仮説Aを検証すべく始めた研究だが、実際のデータを眺めてみると、仮説Bのほうがよりよく説明できるようだ――仮にこうなってしまっても、心配はい らない。すべての事項を書き出し、仮説・目的・データの最適たるコンビネーションを選びとればよい。完成した論文上での研究目的と、仕事に取り掛かる理由 付けとしての研究目的は、往々にして異なるものだ。良質な科学といえども、大抵は日和見主義的・修正主義的なものだ。(Whitesides’ Group: Writing a paper 化学者のつぶやき Chemi-station)

このアドバイスは、仮説なしに始めた研究だが実際のデータが出たあとで仮説を考え始める人をも勇気付けます。

参考

  1. David Lindsay, Scientific Writing = Thinking in Words (PDFリンク
  2. (Aug 1, 2009). How to Write a Hypothesis. Retrieved May 23, 2015 from Explorable.com: https://explorable.com/how-to-write-a-hypothesis
  3. 東京大学大学院新領域創成科学研究科情報生命科学専攻 コラム:”仮説の実験的検証にとどまらず、大量データから帰納的に真実を導く素養を持った研究者を養成する計画です。(森下真一) … これまでの仮説駆動型の研究スタイルでは、研究者がそれまで蓄えた知識と深い洞察のもとに仮説をたて、それを巧妙かつ小規模な実験によって検証するという ことで生命科学が進められてきました。一方、データ駆動型では、ハイスループットな測定装置を使って、まずは網羅的に大量データを取得し、それを貯めてお き、解くべき問題に応じて、その中から仮説候補を探し出すということで研究が進められます。(高木利久)”
  4. 東京大学 大学院理学系研究科 生物科学専攻 黒田研究室ウェブサイト:”…これらの手法は、これまでの知識に基づき仮説を立て検証するという仮説駆動型のアプローチです。これまでの生命科学では一般的な方法です。…一方、…これらのアプローチは、大規模データをあるアルゴリズ ムに則り計算機によりアンバイアスに解析するデータ駆動型のアプローチです。最近発展してきているビッグデータの解析と同じコンセプトを持つアプローチで す。”
  5. バイオサイエンスデータベースセンター(NBDC)の進捗と合同ポータルサイトの開設 (ライフサイエンス委員会報告 資料2 平成24年1月26日)(PDF):”仮説駆動型からデータ駆動型(データ中心科学)へ”
  6. Theory vs. Hypothesis vs. Law… Explained!
  7. 良い科学研究論文を能率よくラボから出すために~学生・ポスドクがボスとやるべき協同作業

Leave a Reply

Your email address will not be published.