触ってみた: Chroma

#創薬アドベントカレンダー (dry) 2日目記事。 #souyakuAC2023

先日発表されていた、

Ingraham, J.B., Baranov, M., Costello, Z. et al.

Illuminating protein space with a programmable generative model.

Nature 623, 1070–1078 (2023).

https://doi.org/10.1038/s41586-023-06728-8

拡散モデルでタンパク質構造を生成するやつ。

Chroma と名付けられている。

デモ版が Colab で用意されているので触ってみた。

Colab のノートブックは こちら

Chroma on Google Colaboratory

モデルのウェイトを利用するための API key が必要なので、まず こちら で登録する必要がある。キーを取得したら API key 入力欄に入力。

Features of Chroma

8つのパターンの使い方が用意されている。

これは "Shape" 機能を使って平仮名の形に合わせたタンパク質構造を生成してみたもの。

※ ただし構造を生成できると言っても、それが実際に発現・精製できてフォールドするものとは限らない。

特に面白そうに思ったのは "Natural language" 機能で、プロンプトでどういうタンパク質かを記述して構造を生成させることができる。

「安定な可溶性タンパク質」などと入力して生成させるとそれっぽいものが出る。

とは言うものの、タンパク質の機能や構造など具体的な指定をすると全然反映されていない結果が返ってくることのほうが多い印象。画像生成 AI 同様、欲しい絵が出るまでガチャを回し続けることが必要といった性質のものかもしれない。

配列や構造データそのものを入力してそれを元にして更にこの機能を付与して~~などといった処理も今のところできない(?)のでタンパク質設計に実用するのは現状なかなか難しい気はするが、そのうち img2img のような使い方などが実装されてきたりするようだと有用な使い道も出て来るかもしれない。

みなさんも面白い使い方を見つけたら是非教えて欲しい。