尿中代謝物によるがん検査の可能性について検討した。その90%以上が水である尿であっても,その中には数千種類にも及ぶ代謝物が存在すると言われ,健常者とがん患者における微妙な代謝物の存在量の変動を計測することは容易ではない。
この解析を行うには,液体クロマトグラフ質量分析計を用いた分析技術だけではなく,健常者に対してがん患者で増減している物質を特定するヒートマップ解析技術,主成分解析技術などの統計解析技術,代謝経路解析技術,未知構造推定技術,定量アッセイ技術など多様な技術が必要となる。まさしく,「代謝物解析の総合力」が要求される。
本稿では,乳がん,大腸がんを例にとり,その解析結果の一部について報告する。
現在,体外診断における検査は血液を用いたものが主流である。一般に,尿は,体内における水分量の調節や,血液中の老廃物(代謝物)の体外への排出が大きな役割となっている。ここで,老廃物(代謝物)とは,栄養素を利用した際に発生する小分子であり,健康状態によって生体内における存在量が変動していることが知られている。この性質を利用し,尿中グルコースによる糖尿病,コレステロールによる動脈硬化,尿酸による痛風,高尿酸血漿(しょう)などの検査がそれぞれ行われているが,血液と比較すると検査項目ははるかに少ない。
この報告では乳がん,大腸がんを例に,血液によるがん検査の研究が主流の中で,尿を用いたがん検査が可能であるか,尿中代謝物を徹底的に解析してその可能性を検討した結果を述べる。
尿中代謝物解析でのポイントは,1検体の解析で,できるだけ多くの代謝物を検出することである。そのために,液体クロマトグラフの分離条件,質量分析計における正負イオン測定の最適化を行うことが重要である。
解析に必要な尿検体を入手するには,大きく2つの方法がある。
今回の解析では,検体を健常者(15名),がん患者(乳がん15名,大腸がん15名)に設定し,入手時間を大幅に短縮するために(2)の方法を取った。具体的には,ドイツのバイオバンク企業であるIndivumed社,米国のBioOptions社から尿1検体当たり約10 mlを購入し,凍結保存されたものを入手した。これらのバイオバンク企業は,医療従事者から高い評価を得ていることを確認している。
尿中代謝物を網羅的に解析するには,液体クロマトグラフ質量分析計(LC/MS:Liquid Chromatograph/Mass Spectrometer)が適している。質量分析法(MS:Mass Spectrometry)におけるイオン化法はエレクトロスプレーイオン化(ESI:Electrospray Ionization)法の正負イオン化モードを用いた。また,代謝物構造情報を得るために質量分析/質量分析法(MS/MS)を用いることは,構造未知代謝物の構造を推定するうえで大変有用である。
一方,尿中代謝物がどのような性質を持つ物質か(親水性,疎水性,溶液中で電荷を有しているかどうかなどの性質)が分からない段階では,1つの分離モードに限定できないため,幅広い極性を有する代謝物が分析対象となるように,複数の分離モードを用いることとした。
尿中代謝物の解析は,分子量が数百程度の安定的な小分子を計測するため,血液中の蛋(たん)白質などに比べて計測しやすいとされているが,それでも数千種類が存在すると言われ,その解析には多様な技術が必要となる。図1に,尿中代謝物の網羅的解析スキームを示す1),2)。
健常者,がん患者の尿中代謝物を,LC/MSを用いて網羅的に解析する[同図(2)参照]。この解析には複数の分離モード(逆相液体クロマトグラフィーと親水性相互作用クロマトグラフィー)と正負のエレクトロスプレーイオン化を組み合わせ,超高分解能LC/MSを用いることで,親水性,疎水性両方の代謝物を幅広く高感度に検出する。その後,公共代謝物データベースなどと検出ピークとの照合を行い,候補となるバイオマーカーを効率的に選定する。
健常者尿に対して,がん患者尿で有意に増減した代謝物を選別するヒートマップ解析を行う[同図(3),(4)参照]。
ヒートマップ解析の結果を踏まえて,多変量解析の一つである主成分解析を行い,健常者,がん患者の識別ができる条件を探索する。すなわち,バイオマーカー候補となる複数の代謝物を特定し,これらの代謝物から多変量解析の一つである主成分解析によって新しい概念の変数を2個ないし3個導入し,健常者とがん患者を識別する条件を検討する。また,機械学習の一つであるランダムフォレスト法を適用し,各代謝物の貢献度を評価することでバイオマーカー候補となる代謝物群を選定する。
ランダムフォレスト解析により評価されたバイオマーカー候補の貢献度リストに従って,公共データベースなどと照合し,その構造が既知か未知かを明らかにする[同図(5)参照]。
データベース検索の結果,構造が既知の代謝物はその代謝経路解析を行い,がんの分子メカニズムとの関連性を検証する。その結果が妥当であれば,バイオマーカー候補となる。一方,構造が未知の代謝物は,まず,取得されているMSスペクトル,あるいはMS/MSスペクトルから構造推定を行う[同図(6)参照]。
MS/MSスペクトルとは,最初のMSで測定されたイオンをヘリウムとの衝突によって解裂させ,生成したフラグメントイオンの測定を再度MSで測定して得られたMSスペクトルであり,測定した物質の構造情報が豊富に含まれる場合が多い。しかし,構造既知の有機化合物の構造を推定する研究は進んでいるものの,その逆のMSスペクトル,MS/MSスペクトルから有機化合物の構造を推定することは難しく,公共データベースなどを駆使したとしても,それまでの経験に大きく左右される。
以上の検討結果を踏まえ,検査に向けた最終的な解析プロトコルを検討した[同図(7)参照]。すなわち,測定対象を,定量すべきバイオマーカー候補の代謝物に絞り,できるだけ簡単な分析条件でその代謝物を定量する条件を求める。その分析条件で計測した多数の検体結果を踏まえて,再度主成分解析を行い,新規検体の主成分解析の計算値がどの領域に入るかによって,健常者,がん患者の識別を行うことになる。したがって,分析法の開発に加え,「多数の検体の質(健常者が本当に健常者かどうか,がん患者のがんステージが確認できているか)」が非常に重要となることは言うまでもない。
主成分解析について,もう少し詳しく述べる。ここでは,ヒートマップ解析結果を基に,分散共分散行列主成分解析法による主成分解析を行った。従来の腫瘍マーカー検査と異なり,バイオマーカーは複数の代謝物の組み合わせと予想されるため,多変数の情報をより少ない変数に集約する主成分解析は非常に有効である。
この主成分解析結果の例を図2,図3に示す。図2はバイオマーカー候補を10種程度用いた場合の計算結果で3つの主成分(貢献度:主成分1は74.28%,主成分2は18.09%,主成分3は7.63%)を用いた場合であるが,健常者とがん患者(乳がん,大腸がん)が識別されていることが分かる。一方,図3は,主成分の組み合わせごとに二次元表示したものである。貢献度の高い主成分1が入ると識別度が上がるため,このような二次元表示だけで十分な場合もあるが,実際のがん検査では,このような二次元解析のほうがやりやすい。例えば,同図において主成分1と2の解析結果を用いると,健常者とがん患者の閾(しきい)値を容易に設定できる。
以上の結果は,尿中代謝物を用いても健常者とがん患者を識別できることを示しており,尿によるがん検査の可能性を示すものである。これまでの体外診断におけるがん検査は,主に血液中の蛋白,糖などのバイオマーカーを測定するものであるが,尿による検査が可能になれば,検体採取が飛躍的に容易になり,がん検査における社会システムそのものが変革される可能性が生まれる。
一方,これまでの血液中におけるバイオマーカーは,1つの検査に対して1つの物質が対応するという考え方であるが,尿中におけるバイオマーカーは,1つの検査に対して複数のバイオマーカー(代謝物)が対応するという考え方に変わる点には,今後の検査法の開発にあたって注意を要する。ただしこれによって,従来の腫瘍マーカーのように,腫瘍以外の要因で値が変動してしまうという欠点は緩和されるのではないかと期待している。
尿中代謝物によるがん検査の可能性について検討した。実用化に向けては,今後さらなる臨床データの積み上げが重要となるが,これまでの腫瘍マーカーと異なりマルチバイオマーカーという概念を導入することによってその可能性を確認することができた。多様ながん種検出の可能性を含め,関係医療機関と協力しながら研究を進めていく。
本研究は,2015年度国立研究開発法人日本医療研究開発機構(AMED)の医療分野研究成果展開事業,産学連携医療イノベーション創出プログラムの支援によって実施されたものである。