大型放射光施設 SPring-8

コンテンツへジャンプする
» ENGLISH
パーソナルツール
 

タンパク質構造の詳細な可視化法を発見 -大量データの統合による高解像度・高精度の実現-(プレスリリース)

公開日
2025年01月17日
  • BL32XU(理研 ターゲットタンパク)

2025年1月17日
理化学研究所

理化学研究所(理研)放射光科学研究センター生命系放射光利用システム開発チームの平田邦生専任技師は、大型放射光施設「SPring-8」[1]を活用し、タンパク質のX線結晶構造解析[2]において高い解像度と精度を実現する新たなデータ収集・統合方法を開発しました。
この方法はどのような試料にも適用できるため、タンパク質のメカニズムをより詳細に理解するための基礎研究から創薬応用までの幅広い分野の構造研究に貢献すると期待されます。
生命活動に必須の分子であるタンパク質の立体構造の解明は病気の原因解明や新薬開発に直結します。SPring-8の理研ターゲットタンパクビームライン(BL32XU)では、これまで解析困難だった膜タンパク質[3]の構造解析を次々に実現してきました。
その過程で、同じタンパク質由来のより多くの結晶から得た回折データを多数(数百〜数千データ)統合することで、電子密度図[4]の分解能が向上し、構造解析の精度が大幅に改善されることを発見・確認しました。特に、統合によって回折強度の観測回数を増やすことで細部の構造情報が明瞭化し、高分解能構造解析が可能になることを見いだしました。大量データの統合の際にはデータの品質や構造がばらつく可能性もありますが、事前に機械学習[5]を併用することで結晶の品質や構造が似たデータをグループ化し、少ない工程数でより目的に合ったデータを選定することができるようになりました。
本研究は、科学雑誌『Acta Crystallographica Section D Structural Biology』(1月1日付)に掲載されました。

データ統合数の増加により増え続けるタンパク質の構造情報



論文情報
雑誌名: Acta Crystallographica Section D Structural Biology
題名 :Useful experimental aspects in Small Wedge Synchrotron Crystallography for accurate structure analysis of protein molecule
著者:Kunio Hirata
DOI:10.1107/S2059798324011987

背景

タンパク質の機能を理解することは、病気の原因解明や新薬開発に直結する重要なテーマです。その機能を理解するためには、タンパク質の立体構造を明らかにすることが必要となり、タンパク質構造を解明する主要な手法の一つにX線結晶構造解析があります。タンパク質の構造を詳しく見るためには、良質な結晶を50マイクロメートル(μm、1μmは100万分の1メートル)以上に成長させる必要がありますが、放射光ビームライン(研究装置)の技術革新に伴って小さな結晶でも構造解析が可能となりました。SPring-8の放射光ビームラインの一つ、理研ターゲットタンパクビームライン(BL32XU)では、10µm未満の小型結晶でもデータ収集と解析が可能になっています。さらに、X線照射によって結晶が損傷するという根本的な問題に伴う限界を打破するため、複数の結晶から部分的なデータを収集し統合することで、これまで解析困難だった膜タンパク質の構造解明を次々と実現してきました注1、2、3)。平田専任技師はこの経験を通し、統合する結晶数(データ数)が多いほど構造解析の空間分解能が向上する可能性があることに気付き、そのメカニズムと限界点を解明する調査を行いました。

注1)2019年09月26日東京大学プレスリリース「新型の光応答性タンパク質であるヘリオロドプシンの構造を解明」
  http://www.spring8.or.jp/ja/news_publications/press_release/2019/190926/
注2)2023年4月3日岡山大学プレスリリース「尿路結石形成を防ぐ腸内細菌で働く鍵分子・シュウ酸輸送体の立体構造解明」
  https://www.okayama-u.ac.jp/tp/release/release_id1074.html
注3)2022年8月25日プレスリリース「細胞膜の中ではたらく特殊なタンパク質分解酵素の構造を解明」
  https://www.riken.jp/press/2022/20220825_3/

研究手法と成果

本研究では、3種類のタンパク質の結晶を大量に用いて測定した後、少数の結晶データと多数の結晶データを統合した構造情報を定量的に比較しました。その結果、以下の知見が得られました。
1)分解能向上:より多数の結晶データを統合することで、分解能(電子密度図の解像度)が向上することを確認しました。単なる数値の向上だけでなく、細かい実質的な構造情報が増えていることも証明しました(図1)。このことは、ぼんやりした写真でも同じ画角のものを繰り返し撮像し、その画像を重ねることでより明瞭な画像を得ることができる現象と似ています。
2)構造決定力の改善:統合した結晶数の増加に伴い電子密度図の質が改善され、構造解析(初期構造決定)も容易になりました。
3)データ精度向上の限界:約8,000個もの結晶データを収集し統合しましたが、少なくともこの範囲では分解能向上は限界に到達しませんでした(図1)。特に、非常に観測しづらい微弱な電子密度が統合データ数の増加とともに明瞭に観察できることが分かりました(図2)。

図1 本研究のデータ収集・統合方法の分解能と精密化
(左)データをより多く統合することでデータの分解能が向上した。最良データ群:機械学習でデータを分類した結果、最も品質の良かったデータ群。
(右)冗長度(結晶学的に等価な反射強度が観測された回数)が増えることでより高分解能なデータ(右に行くほど高分解能)の情報が増えている(精密化の信頼度因子が小さくなるほど、信頼度が高い)。

図2 観測回数が増えることで解釈しやすくなった電子密度図
多角体タンパク質(ポリヘドラタンパク質)に含まれるグアノシン三リン酸(GTP)分子の電子密度図は観測回数(冗長度)が増える(17→5,638)ほど、結合電子密度図が詳細に分かるよう変化した。
オレンジ◯:リン原子、ピンク◯:酸素原子、丸を結ぶ線は化学結合を示す。図の白いメッシュは、それぞれGTPの存在を仮定せずに計算した電子密度図(観測された結晶構造因子(Fo)と分子モデルから計算された結晶構造因子(Fc)との差(Fo-Fc)とモデルの位相から計算した電子密度図:コントアレベル2.5σ(「コントアレベル」は電子密度図の信頼性の指標で、通常、2~3で信頼性が満たされ、モデル構築可能とされている))。

本研究では階層的クラスタリング[6]などの機械学習を利用して、大量データを結晶間の微妙な構造の違いによってグループ分けした後に統合することの重要性についても検討しました。例えば、大量のデータには不良データが含まれることもあれば、異なる構造のものが混じる場合もあります。それらを構造の似たもの同士でグループ分けすることによって検討すべきデータセットを絞り込み、効率的に構造解析を進めることができます。実際、この方法で低品質のデータグループを排除できました。
これらの結果は、今回発見したデータ収集・統合方法が、大量にデータ収集を行うことで、より解像度の高いタンパク質の構造解析を実現できることを示しており、これはどのような結晶にも適用可能な方法と見られます。

今後の期待

この手法のエッセンスは結晶にX線を照射して得られる回折データを多数収集して統合することです。適用対象は広範にわたる上、実現する分解能の向上は、例えば、タンパク質の機能理解に重要な水素原子の可視化など、タンパク質の機能構造相関を明らかにするための重要な情報取得につながります。
2024年のノーベル化学賞は「コンピュータを用いたタンパク質の構造予測」に対して授与されました。受賞者のデイビッド・ベイカー博士も述べていたようにその受賞の成果には、構造生物学者が長年精度の高い構造解析を積み重ね、その構造情報をタンパク質構造データバンク(Protein Data Bank:PDB)に蓄積・公開し、自由にアクセスできるようにしたことが大きく貢献しました。
そのPDBには、現在、結晶構造解析で決定された190,534構造が登録されており、その平均分解能は2.12オングストローム(Å、1Åは100億分の1メートル)(標準偏差0.59Å)です(2024年12月22日調査)。しかし、タンパク質の構造と機能の関係を深く理解できる水素原子の可視化が期待できる1.5Åより高い分解能で決定された構造は約10%に過ぎません。
本研究でも一部の水素原子が明瞭に見えるようになりました。実験構造解析や予測構造の分解能や精度をさらに大きく向上できれば、水素原子の可視化がもっと簡単にできるようになる可能性があります。この手法により得られる高精度・高分解能の構造データは、タンパク質構造生命科学を次のステージへ進化させる鍵となるでしょう。
大型放射光施設では近年、自動測定・解析技術が進化し測定の効率化が進んでいます。SPring-8で開発した自動データ収集システムZOO[7]、注4)の利用による超効率的データ測定、さらにSPring-8の次世代計画「SPring-8-Ⅱ」による光源性能の向上は、回折データ収集速度の劇的向上と直結しており、これらと本研究の知見・手法を組み合わせることで、次世代のタンパク質の精密構造研究を推進する基盤になると期待されます。本研究は、放射光施設と先端技術のシナジー(相乗効果)を活用し、科学の最前線における新たな発見を支える重要な一歩になると思われます。

注4)2019年2月7日プレスリリース「タンパク質結晶から自動でデータ収集する『ZOOシステム』を開発」
https://www.riken.jp/press/2019/20190207_1/

研究支援

本研究は、日本学術振興会(JSPS)科学研究費助成事業基盤研究(C)「人工知能を有する自動回折データ収集システムの開発(研究代表者:平田邦生)」、科学技術振興機構(JST)研究成果展開事業研究成果最適展開支援プログラム(A-STEP)産学共同(本格型)「迅速微量多検体構造解析を可能とする無細胞タンパク質結晶化技術の開発(研究責任者:上野隆史)」、日本医療研究開発機構(AMED)生命科学・創薬研究支援基盤事業(BINDS)「創薬等ライフサイエンス研究のための相関構造解析プラットフォームによる支援と高度化(SPring-8/SACLAにおけるタンパク質立体構造解析の支援および高度化)(領域代表:山本雅貴)」による助成を受けて行われました。


【用語解説】

※1. 大型放射光施設「SPring-8」
理研が所有する、兵庫県の播磨科学公園都市にある世界最高性能の放射光を生み出す施設。SPring-8(スプリングエイト)の名前はSuper Photon ring-8 GeVに由来する。放射光(シンクロトロン放射)とは、電子を光とほぼ等しい速度まで加速し、電磁石によって進行方向を曲げたときに発生する細くて強力な電磁波のこと。SPring-8では、遠赤外線から可視光線、軟X線を経て硬X線に至る幅広い波長域で放射光が得られるため、原子核の研究からナノテクノロジー、バイオテクノロジー、産業利用や科学捜査まで幅広い研究が行われている。

※2. X線結晶構造解析
対象とする分子などの結晶を作製し、その結晶にX線を照射して得られる回折データを解析することで、物質内部の原子の立体的な配置を調べる方法。この方法によって、タンパク質などの複雑な分子の立体構造を詳細に知ることができる。

※3. 膜タンパク質
細胞膜を構成しているタンパク質で、全ゲノムがコードするタンパク質の3分の1を占める。細胞膜の表面にあるタンパク質と内部に埋もれたタンパク質がある。細胞外のシグナルを捕える受容体、細胞膜を介して物質の出入を担うチャネルやポンプ、細胞同士の結合に関わる接着分子など、生命活動に重要な役割を果たす。疾病に関連しているものも多く創薬の重要なターゲットとされる。

※4. 電子密度図
回折強度データを解析することで得られる原子の位置を3次元の電子密度で表現した図。結晶構造解析では、電子密度図に原子モデルを当てはめて分子構造を解釈する。

※5. 機械学習
データを基に、コンピュータにその特徴やパターンを学習させること。機械学習は学習する手順のアルゴリズムを組み立てて、コンピュータにプログラミングして実行する。

※6. 階層的クラスタリング
教師なし機械学習に分類される、データ分類手法の一つ。X線回折データの分類においても利用されてきた。正解ラベルやいくつのデータのグループが存在するかをあらかじめ仮定する必要はなく、データ同士の類似度を総当たり的に調べることで、類似しているデータと遠縁のデータを分類する。

※7. 自動データ収集システムZOO
SPring-8で開発したX線結晶構造解析のための自動データ収集システム。実験結果を判断材料としてビームラインの装置群を制御し、実験者が事前に準備した測定条件表に従って、タンパク質結晶や低分子結晶からの無人自動測定を遂行できる。



<発表者>
理化学研究所 放射光科学研究センター 生命系放射光利用システム開発チーム
 専任技師 平田邦生(ヒラタ・クニオ)

<機関窓口>
理化学研究所 広報室 報道担当
Tel: 050-3495-0247
Email: ex-pressml.riken.jp

(SPring-8 / SACLAに関すること)
公益財団法人高輝度光科学研究センター 利用推進部 普及情報課
TEL:0791-58-2785 FAX:0791-58-2786
E-mail:kouhou@spring8.or.jp

ひとつ前
結晶・非晶質によらず選んだ元素まわりの構造可視化に成功 ~蛍光X線ホログラフィー・X線異常散乱複合計測装置を開発~(プレスリリース)
現在の記事
タンパク質構造の詳細な可視化法を発見 -大量データの統合による高解像度・高精度の実現-(プレスリリース)