CGBVSによる化合物スクリーニングソフトウェア「CzeekS」のマシンラーニングベース予測モデルが更新されました。主な更新内容は以下となります。
- データソースはChEMBL34とTIMBAL v.2 DBを利用しています
- 全モデルで標的タンパク数は1645個になりました
モデルの内容については以下のテーブルをご確認ください。モデルはStandard (STD)とHigh Activity (HA)の2種があり、活性値のPositiveとNegativeの基準は下記の通りです。
- STD:Positive <= 10uM, Negative >= 30uM
- HA:Positive <= 1uM, Negative >= 3uM
モデル | Standard Activity (STD) | High Activity (HA) | タンパク ファミリー (一部) |
||
タンパク数 | 学習データ数 | タンパク数 | 学習データ数 | ||
Cytochrome P450 | 40 | 43,683 | 31 | 14,990 | Cytochrome P450, Aromatase |
Esterase | 177 | 109,828 | 151 | 48,771 | Phosphodiesterase, Phosphatase |
GPCR | 263 | 183,007 | 259 | 192,503 | ClassAα, ClassAβ, ClassAδ, ClassAγ, ClassB, ClassC |
Ion channel | 190 | 62,039 | 177 | 42,857 | Voltage-gated, Ligand-gated |
Kinase | 505 | 201,148 | 496 | 225,864 | AGC, CAMK, CMGC, STE, TK, TKL |
Nuclear receptor | 44 | 40,410 | 43 | 27,362 | NR1, NR2, NR3, NR4, NR5 |
PPI | 53 | 44,655 | 50 | 24,662 | Integrins, Bcl2, MDM |
Protease | 246 | 113,609 | 228 | 79,614 | Endopeptidase, Exopeptidase |
Transporter | 127 | 45,758 | 104 | 21,301 | Electrochemical, ATPase, ATP-binding casette |
今回は、以下のタンパク質がStandardモデル(STD)の対象タンパクリストに追加されました。
UniProt ID | Protein Name | Model Name |
---|---|---|
PPP6_HUMAN | Serine/threonine-protein phosphatase 6 catalytic subunit | Esterase |
SHIP1_HUMAN | Phosphatidylinositol 3,4,5-trisphosphate 5-phosphatase 1 | Esterase |
SLN12_HUMAN | Ribonuclease SLFN12 | Esterase |
SCNNB_HUMAN | Amiloride-sensitive sodium channel subunit beta | Ion Channel |
SCNNG_HUMAN | Amiloride-sensitive sodium channel subunit gamma | Ion Channel |
SENP3_HUMAN | Sentrin-specific protease 3 | Protease |
UBP24_HUMAN | Ubiquitin carboxyl-terminal hydrolase 24 | Protease |
計算可能タンパクリストはこちらのリンクからご確認できます。
Category: CGBVS/CzeekS