深層学習を用いた自動結晶センタリングプログラムの開発 -タンパク質の全自動結晶構造解析を可能に-(プレスリリース)
- 公開日
- 2019年06月03日
- BL26B2(理研 構造ゲノムII)
2019年6月4日
理化学研究所
株式会社リガク
日本医療研究開発機構
理化学研究所(理研)放射光科学研究センター生命系放射光利用システム開発チームの上野剛専任技師、山本雅貴チームリーダー、株式会社リガク応用技術センター単結晶解析グループの伊藤翔研究員の共同研究チームは、深層学習[1]を用いた画像解析により、X線結晶構造解析[2]においてタンパク質結晶試料を自動的に検出するプログラム「DeepCentering」を開発しました。 論文情報 |
図 DeepCenteringによる結晶検出(赤線で囲まれた部分が結晶と認識された)
※研究支援
本研究は、日本医療研究開発機構(AMED)創薬等ライフサイエンス研究支援基盤事業「創薬等ライフサイエンス研究のための相関構造解析プラットフォームによる支援と高度化(SPring-8/SACLAにおけるタンパク質立体構造解析の支援および高度化)(研究開発代表者:山本雅貴)」による支援を受けて行われました。
背景
タンパク質の構造情報は、そのタンパク質の機能を理解する上で非常に重要です。とりわけ、放射光施設における高輝度X線を利用した結晶構造解析は、これまで多くのタンパク質の構造を明らかにし、その機能を理解するために重要な役割を果たしてきました。
X線結晶構造解析では、結晶センタリングと呼ばれる、ゴニオメーター[6]上にマウントされた結晶をどの方向に回してもX線の光路上に位置させる作業が必要です。従来、この作業はビームライン利用者が目視で行うか、強度を弱めたX線を結晶に照射することで結晶の位置を検出して行うのが主流でした。
今回、共同研究チームは、結晶センタリングを自動化するために、深層学習を用いた画像処理技術を応用することを試みました。
研究手法と成果
共同研究チームは、深層学習を用いて、クライオループおよび結晶を認識するプログラム「DeepCentering」を開発しました。この際、クライオループを認識するための教師データ[1]としては、これまでに大型放射光施設「SPring-8」のタンパク質結晶構造解析ビームライン(BL26B2)で取得した約6,000枚のクライオループ画像を利用しました。次に、結晶を認識するための教師データとしては、実際のタンパク質結晶画像では外形があいまいな例が数多く含まれるため、単純な多角形の画像を約400枚自動生成して利用しました。その結果、学習が効率良く進み、精度の高い検出結果を得ることに成功しました(図1)。
図1 DeepCenteringによる結晶検出
タンパク質結晶をマウントしたクライオループ。赤色の長方形で囲まれている箇所が結晶と認識された範囲。クライオループの大きさは、約200-600マイクロメートル(µm、1µmは1,000分の1mm)。
これまでも画像処理技術を用いた結晶検出プログラムは開発されてきましたが、試料観察カメラのコントラストなどが変わると検出精度が低下するなどの問題がありました。DeepCenteringでは、そのような場合でも正確にクライオループや結晶を検出し、これまで開発されてきた画像処理ベースでの結晶検出プログラムの問題を解決しました。
DeepCenteringと、既に研究チームが開発しているビームライン制御ソフトウェア、回折データ自動処理プログラム、および自動構造解析プログラムを用いて、データ取得および構造解析の自動化に成功しました。
また、DeepCenteringの機能の一部を利用して、自動センタリングした試料に対し、目視によるセンタリング結果との画像比較による自動位置修正を行うことで、より高精度な結晶位置決めも可能となります。この機能は、ビームラインでのメールインデータ収集[7]に利用されています。
今後の期待
DeepCenteringの開発により、X線照射を必要とすることなく試料検出の自動化が可能となりました。これにより、特に放射線損傷の影響を受けやすい試料や室温での自動回折データ収集での活用が期待できます。
また、ビームラインでのデータ収集と構造解析の全自動化により、特定のタンパク質と化合物の複合体構造解析を大量に実施する化合物スクリーニングや、既に類似構造が明らかになっているタンパク質の結晶化条件を探索する結晶回折スクリーニングや構造解析など、大量の結晶試料を取り扱う実験の効率化が推進されると考えられます。
補足説明
[1] 深層学習、教師データ
深層学習は、ニューラルネットワークと呼ばれる、一般に4層以上の層からなる数理モデルと学習データを用いて、音声、言語、画像処理などの問題をコンピュータに学習させる機械学習の手法の一種。特に入力と出力をセット(例:入力画像に結晶、クライオループなどのラベルを事前に与える)にした学習データを、教師データと呼ぶ。多くの深層学習は教師データを使用しており、これらを用いて適切に重み付けされたさまざまなニューラルネットワークが、近年の人工知能(AI)の発展を支える技術となっている。
[2] X線結晶構造解析
タンパク質の結晶を作製し、その結晶にX線を照射して得られる回折データを解析することにより、タンパク質の内部の原子の立体的な配置を調べる方法。この方法によって、タンパク質の立体構造や内部構造を知ることができる。
[3] 大型放射光施設「SPring-8」
理研が所有する、兵庫県の播磨科学公園都市にある世界最高性能の放射光を生み出す施設。SPring-8の名前はSuper Photon ring-8 GeVに由来。放射光(シンクロトロン放射)とは、電子を光とほぼ等しい速度まで加速し、電磁石によって進行方向を曲げたときに発生する細くて強力な電磁波のこと。SPring-8では、遠赤外から可視光線、軟X線を経て硬X線に至る幅広い波長域で放射光を得ることができるため、原子核の研究からナノテクノロジー、バイオテクノロジー、産業利用や科学捜査まで幅広い研究が行われている。
[4] クライオループ
強力なX線を利用する放射光施設においては、X線照射によるタンパク質結晶試料の損傷を抑えるために、-170℃程度の低温で凍結した状態でデータ収集を行うことが一般的である。クライオループは、結晶と同程度の大きさ(数十~数百マイクロメートル)のナイロンもしくはポリイミド製のループで、結晶化母液ごとすくい取って凍結される。
[5] 放射線損傷
X線の持つエネルギーによって、X線と相互作用した分子が壊れること。X線との相互作用で分子が壊れる場合だけでなく、分子が壊れる過程で生じる電子や、壊れた分子から生成する反応性の高い分子が観察対象の分子と化学反応する場合もある。一般的にタンパク質結晶の放射線損傷は、X線と水の相互作用をきっかけに、X線照射後ピコ秒(1ピコ秒は1兆分の1秒)の時間スケールで、水から生成する反応性の高い分子がタンパク質と化学反応することで起きる。
[6] ゴニオメーター
微小なタンパク質結晶試料をマウントしてX線ビームに照射するための高精度位置決め装置。通常、結晶の方位を1,000分の1°以下の精度で制御する回転軸と、0.1マイクロメートル以下の精度で位置決めを行う三次元並進軸の組み合わせで構成される。ビームライン制御系により回転速度と並進速度を制御して、X線の照射や検出器の動作と同期させてX線回折実験を行う。
[7] メールインデータ収集
ビームライン遠隔利用実験の一つで、利用者は自動データ収集により放射光施設に出張することなくデータ収集ができる。凍結したタンパク質結晶を専用容器に入れて宅配サービスなどで送付し、インターネットを利用して試料情報やデータの送受信を行う。SPring-8におけるメールインデータ収集では、従来通り目視による結晶位置決めでX線試験照射を行い結晶を選別したのち、良質な試料についてのみ結晶位置を自動再現し、連続自動データ収集を行うデータ収集法を実施している。
発表者・機関窓口 <発表者> ※研究内容については発表者にお問い合わせ下さい 株式会社リガク 応用技術センター 単結晶解析グループ <機関窓口> 株式会社リガク 広報宣伝課 <AMED事業について> (SPring-8 / SACLAに関すること) |
- 現在の記事
- 深層学習を用いた自動結晶センタリングプログラムの開発 -タンパク質の全自動結晶構造解析を可能に-(プレスリリース)