触ってみた: Chroma
#創薬アドベントカレンダー (dry) 2日目記事。 #souyakuAC2023
先日発表されていた、
Ingraham, J.B., Baranov, M., Costello, Z. et al.
Illuminating protein space with a programmable generative model.
Nature 623, 1070–1078 (2023).
https://doi.org/10.1038/s41586-023-06728-8
拡散モデルでタンパク質構造を生成するやつ。
1/n: We are excited to share that our paper on Chroma, a general purpose diffusion model for proteins, is out today in @Nature! https://t.co/FwvQ15UaHc
— Andrew Beam (@AndrewLBeam) 2023年11月15日
A couple of my favorite highlights in the 🧵below 👇 pic.twitter.com/hk4TtkstDJ
Chroma と名付けられている。
3/n: We also have open-sourced the code behind Chroma and provided free access to models weights to academic and non-profit researchers.
— Andrew Beam (@AndrewLBeam) 2023年11月15日
You can find links to the code, the model weights, and example notebooks on the @generate_biomed Chroma page:https://t.co/CGfSnsMFF1
デモ版が Colab で用意されているので触ってみた。
Colab のノートブックは こちら 。
モデルのウェイトを利用するための API key が必要なので、まず こちら で登録する必要がある。キーを取得したら API key 入力欄に入力。
8つのパターンの使い方が用意されている。
#Chroma has also generated a protein model in the shape of Japanese character!
— 叢雲くすり (創薬ちゃん) 💊創薬アドベントカレンダー OPEN💊 (@souyakuchan) 2023年11月16日
アルファベット以外でもいけるようだ。
文字形状の点群への変換を経由しており、任意の文字でできるのかもしれない。
Colab Notebook:https://t.co/4NPybWL4gz https://t.co/fsNrhEKX6i pic.twitter.com/arhUL4msIw
これは "Shape" 機能を使って平仮名の形に合わせたタンパク質構造を生成してみたもの。
ぬ為転変🤞#Chroma pic.twitter.com/89wb8ov2gF
— 叢雲くすり (創薬ちゃん) 💊創薬アドベントカレンダー OPEN💊 (@souyakuchan) 2023年11月16日
※ ただし構造を生成できると言っても、それが実際に発現・精製できてフォールドするものとは限らない。
なお論文中に書いてあるように、生成したタンパク質モデルが実際に精製・構造分析できて上手くいった(?)のは 3% 程度らしいのでモデルを生成できたからといってリアルに作れるフォールドとは限らない。
— 叢雲くすり (創薬ちゃん) 💊創薬アドベントカレンダー OPEN💊 (@souyakuchan) 2023年11月16日
特に面白そうに思ったのは "Natural language" 機能で、プロンプトでどういうタンパク質かを記述して構造を生成させることができる。
実際にフォールドしてタンパク質として希望通りに機能するかどうかは別として、近いことはできるようになったと言えるかもしれない。ゴリゴリ発現・精製・分析できるラボはこれから楽しいかもしれない。
— 叢雲くすり (創薬ちゃん) 💊創薬アドベントカレンダー OPEN💊 (@souyakuchan) 2023年11月16日
プロンプト: "Highly thermostable, water-soluble protease"#Chromahttps://t.co/kLLjMZrgoX pic.twitter.com/9Cst68NBYa
「安定な可溶性タンパク質」などと入力して生成させるとそれっぽいものが出る。
とは言うものの、タンパク質の機能や構造など具体的な指定をすると全然反映されていない結果が返ってくることのほうが多い印象。画像生成 AI 同様、欲しい絵が出るまでガチャを回し続けることが必要といった性質のものかもしれない。
配列や構造データそのものを入力してそれを元にして更にこの機能を付与して~~などといった処理も今のところできない(?)のでタンパク質設計に実用するのは現状なかなか難しい気はするが、そのうち img2img のような使い方などが実装されてきたりするようだと有用な使い道も出て来るかもしれない。
みなさんも面白い使い方を見つけたら是非教えて欲しい。
BLOOD 115. Self-Phlebotomy
創薬(wet)アドベントカレンダー 2021 8日目記事。
自分でワクチン接種後の抗体価の推移を観測できる機会はなかなか無く、せっかくなのでひたすらセルフ採血した記録。
・初回接種後しばらくはまだ免疫はついていないから気を緩めてはいけない
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年5月21日
・2回接種で抗体価は何倍にもなる(のでやはり2回打ちしたほうがいい)
というのが分かるように身体を張って何十回もセルフ採血してグラフで可視化した(n=1だが)ので周りへの説明や説得に使ってくれていいぞ!#コロナワクチン pic.twitter.com/HMkZ5ZKRlQ
身体を張るとバズるらしい。
#COVIDVaccination#FullyVaccinated#day_70
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年5月28日
2回目接種後7週間経過。体調かわりなし。
初回接種後デイリー採血 70 回目実施。
10 週間、毎日欠かさず採血した!
そろそろ抗体価のカーブの傾きが寝てきたのでここからはとりあえず3日に1回の採血としてみる。
→ 70 回穿刺した痕 pic.twitter.com/Kv8NbIWvMQ
ひたすら左の肘窩で採血。血清分離し、Chemiluminescence immunoassay (CLIA) で抗体価を定量測定している。(試薬)
2回目の接種時から原則8ヶ月以上あけてブースター接種をすることとされているので、ちょうどその8ヶ月経過時点ということで久しぶりに抗体価グラフの直近アップデート版を置いておこう。今や抗体価は2回目接種後のピーク値の 20 分の 1 未満となっている。ブースター接種後にはまた毎日採血してみようと思う。
引き続き出来る限りの感染対策を!
#ChemTwitter
創薬(dry)アドベントカレンダー 7日目記事。
タイムラインで見かけた構造式、そのまま自分でイチから描き直すのは面倒。
構造式を手描きして、そのまま続けて構造を編集可能な形でシェアできるようにツイートボタン付き。逆合成ちゃん @retrosynthchan にそのまま投げることもできるぞ。
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年3月8日
構造式のアイデアをちょっとメモしたりシェアしたりするのに使ってみよう! #ChemicalSpace_Editorhttps://t.co/UO1nZtcXHT pic.twitter.com/OjJUdL0UQ2
そのまま構造式を編集可能な状態でシェアできるツールなので使ってみてほしい。
パープル・ヘイズ・トランスフェクション
創薬(wet)アドベントカレンダー 2021 7日目記事。
今年は LNP 製剤の活躍が目立っていたが、核酸の導入と言えば AAV も引き続きホット。
指向性進化法で筋組織にデリバリーできるAAVカプシドを取得。Arg-Gly-Aspモチーフでインテグリン経由で入るとのこと。
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年9月10日
AAVによる遺伝性筋疾患治療開発への端緒的業績となるか?
Cell: 筋肉指向性遺伝子送達を可能とするアデノ随伴ウイルスカプシドを指向性進化法により取得https://t.co/aoch7CSN0T
一昨年 承認された "億超え" 新薬もインパクトがあった。
特許情報: WO2019094253A1 "Means and method for preparing viral vectors and uses of same"
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2019年6月11日
Assignee: Avexis Inc.
AAV9 ウイルスベクターの製法および利用法 ——すなわち Onasemnogene abeparvovec (脊髄性筋萎縮症 (SMA) の遺伝子治療薬; 先月米国にて認可) の作り方だ。https://t.co/WqX3y30VpT
この遺伝子治療の DDS 的な意味でのブレイクスルーはこちらの報告だろうか。アデノ随伴ウイルス AAV9 が経静脈投与で血液脳関門を越えて中枢神経系に届くことの発見
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2019年6月11日
Intravascular AAV9 preferentially targets neonatal neurons and adult astrocytes. Nat Biotechnol. 2009 https://t.co/PEhGkkNtDT
AAV9 の capsid タンパク質の構造はこちら (3UX1.PDB)。
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2019年6月11日
60-mer でウイルス粒子を構成する。https://t.co/Pm8F1v2mn8
本邦で製造に強みを見せる企業はどこになるだろうか。
EXA 初号機
創薬(dry)アドベントカレンダー 6日目記事。
世界で初めて exaFLOPS (10¹⁸ FLOPS) の演算性能を持つ計算機になったのは、分子動力学計算機だった。
Folding@home で SARS-CoV-2 の構成タンパク質を片っ端から分子動力学計算した結果のまとめ。シミュレーション時間は延べ 0.1 秒相当に。
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年5月24日
nature chemistry: SARS-CoV-2 simulations go exascale to predict dramatic spike opening and cryptic pockets across the proteomehttps://t.co/RKoW0URRws
とはいえ通常のスパコンのような1台のマシンというわけではなく、
コロナ禍で世界が一致団結したのもあってか、Folding@home のピーク性能は 1.01 エクサフロップスに到達していたようだ。(富岳が 0.5 エクサフロップス程度)
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年5月24日
Folding@home による分散コンピューティングである。奇しくもパンデミックに立ち向かうために世界中の人々が一致団結して自宅の電力を提供した結果であり、さながらヤシマ作戦であった。
Folding@home でシミュレーションされた SARS-CoV-2 スパイクタンパク質の「口が開く」モーションの動画。圧倒のミリ秒オーダーの時間スケールとなっている。https://t.co/zNX4t0L1PT
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年5月25日
今はコロナ関連の計算は一段落しているが何かしらの疾患関連の計算は降って来るので、自宅の計算リソースに余力のある人は貢献してみてもいいだろう。 foldingathome.org
第21話 キルア vs. ジョネス
創薬(wet)アドベントカレンダー 2021 6日目記事。
目的化合物の合成は、基本的には「断片を繋いでいく」作戦が普通だが、それとは違った Skeletal Editing (骨格編集) という括りの反応が今年になって何度か報告されていたのでまとめ。
2級アミンから窒素を引き抜いてそのまま C-C 結合を作る反応、Nature。
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年5月13日
C-H に官能基を付ける "peripheral editing" ではなく骨格自体を改変する "skeletal editing" の手法として提案。
当該反応試薬 1c は Sigma-Aldrich (製品番号 919799) から売り出す予定とのこと。https://t.co/t94x77Hx6e https://t.co/0kOv4S3koF pic.twitter.com/7Pn1Q9EBM8
ピロール/インドールの五員環部分にクロロジアジリン試薬で1炭素挿入して六員環化する "skeletal editing" 法の報告。 https://t.co/31a4CLOZfA
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年7月21日
光化学反応で飽和ヘテロ環から窒素を引き抜く skeletal editing 手法、Science。 https://t.co/1Ah8M5W903
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年8月13日
原子を引き抜くもしくは差し込むことによって元の骨格自体をいじってしまう。使いどころがあるのかというとまだよく分からないが、SAR 展開のバリエーションを増やすのにも役立ったりはするだろうか。
The I in the Alphabet.
創薬(dry)アドベントカレンダー 5日目記事 (ポエム)。
この小説は読んだことはあるだろうか? www.kadokawa.co.jp
軽くネタバレになるが、「標的を与えると計算によって完璧な治療薬を創製する」無敵の創薬ソフトウェアが登場する。アミノ酸配列から立体構造を生成する end-to-end の構造予測を実現した AlphaFold2 の薬版のようなものと言えるかもしれない。
はっきりそういうものを目指したものかどうか現時点では不明だが、DeepMind 社から今度は創薬を目指した会社が立ち上げられた。
ちなみに会社のロゴは Game of Life のセルオートマトンを表しているようだ。
ゲーム開発者としてキャリアをスタートし、神経科学を経て AI 開発によって各分野で無双しているハサビス氏がここで情報科学と生物学の同型性 (isomorphism) を見出すことを企図して IsomorphicLabs 社を立ち上げ会社ロゴに (Conway's) Game of Life を採用しているのは正に集大成といった感があるな! https://t.co/7oCPsgSLq8
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年11月5日
正しいセル配置はこっちかもしれない。 pic.twitter.com/tOk0Gdpeoe
— 叢雲くすり(創薬ちゃん) (@souyakuchan) 2021年11月4日
もし無敵の創薬ソフトウェアが誕生したら喜ばしいことではあるが、技術的にはまだだいぶ距離があるとは思う。AlphaFold2 にしても、生物が長い進化の過程で最適化してきたような相互作用の型を有する構造に当てはまらないものについてはあまりまともな構造を出してこないし、点変異や翻訳後修飾などといった細部の考慮もまだできない。あらゆる化合物についてウェットのデータを新たに爆発的に生産・蓄積していくような体制を組めれば無敵の創薬ソフトの創出もワンチャンあるかもしれないが、いずれにしろ現時点で人類が持ち得ている情報だけでは恐らく足りないだろう。機械学習だけでなく ab initio な物理化学計算も組み込めばなんとかなったりする可能性も一応あるのだろうか?
お金が無限にかかったとしても投げ出さずに頑張ってほしいところではある。