パトコアの技術ブログ
https://tech.patcore.com/
化学情報管理・創薬支援のためのケモインフォマティクス製品を扱うパトコアです。本ブログは技術チームにより運営されており、各種ツールを使うとどんなことができるの?という観点から、技術情報をお届けします。
フィード
理想的なケミカルドローイングツール
パトコアの技術ブログ
化学と化学的アイデアのコミュニケーションと共有は、化学構造図という世界共通の共通言語があることで容易になります。 潜在的な化学構造の数は1060と推定され[1]、興味深いサブセットは、Mcule 1.4x108からeMolecules 7.0x1012までの「オンデマンド・ビッグ・ケミカル・スペース」として市販されていたり、Eli Lilly 1011をはじめGSK 1026[2]までにおよぶ製薬会社によって作成されたライブラリがあります。 では、理想的な化学描画ツールとはどのようなものでしょうか? このブログでは、完璧なアプリケーションの特徴や機能をすべて列挙するのではなく、構造描画ツールの…
9日前
創薬プロジェクトを最適化する「カンバン」とは?
パトコアの技術ブログ
カンバンは日本語で「看板」や「信号」を意味します。1950年代にトヨタ自動車が生産の効率化と品質向上を目指して初めて導入しました。 これはワークフロー管理の視覚的な表現で、アジャイルな環境でよく使われるため、時に「アジャイルタスクボード」とも呼ばれます。 今日、カンバンは現代のプロジェクト管理において重要な役割を果たしています。 カンバンボード上に作業項目を可視化することで、プロジェクトチームはワークフローを簡単に管理し、ボトルネックを特定し、プロセスを最適化できるため、より効率的な作業、生産性向上、他チームとのコラボレーションが可能になります。 カンバンの実践活用 作業の視覚化は通常、ワーク…
6ヶ月前
関連する特徴のみを使用した自動モデル構築
パトコアの技術ブログ
創薬の各段階で機械学習モデルを活用することにより、より迅速かつ洞察に満ちたデータ主導型の意思決定が可能になります。 モデル生成時には、データセットに対して利用可能な全ての記述子が生成されるのが一般的ですが、これらの記述子の重要性は最初からは明らかでないことがあります。 得られた学習済みモデルは、新規化合物の設計や既存化合物の最適化に有用な特性を予測するために使用されます。 計算化学者やケムインフォマティクスの専門家は、通常、これらの記述子のフルセットに基づいて多数のモデルを生成し、その後、望ましい化合物の特性を最も正確かつ頑健に予測できるモデルを選択します。 モデル構築における課題 業界では、…
6ヶ月前
DMTAリード最適化: 科学とプロジェクト管理の統合
パトコアの技術ブログ
理論上、生成が可能な有望であろう化合物の数は、実際に合成して評価が可能な化合物の数をはるかに上回ります。 これにより、ヒット化合物の同定とリード化合物の最適化は、創薬プロセスにおいて高度に複雑な課題となります。 この複雑さを解消するためには、進行中の活動に対して優先順位を設定し、チームを臨床候補化合物の到達へと導くための効率的なプロジェクト管理が不可欠です。 ヒット化合物の同定からリード化合物の最適化まで: このプロセスは複数の複雑なステップから構成され、各ステップがヒット化合物から実用的な医薬品候補への転換において重要な役割を果たします。 ヒット化合物が特定されると、研究者はその化合物の特性…
6ヶ月前
ChEMBL vs. GOSTAR -データの多様性と化合物の網羅性
パトコアの技術ブログ
Patcore, Inc. ADMEデータによる予測モデリング 医薬品候補の2つに1つは有効性が不十分であるために臨床試験段階で失敗し、5つに2つは毒性が原因で失敗したことがあると言われています。*1*2 規制当局や研究者は、薬理特性に加えて、吸収(Absorption)・分布(Distribution)・代謝(Metabolism)・排泄(Excretion)(ADME)試験が医薬品候補の成功に不可欠であることを認識しています。10年以上前から、製薬会社はリピンスキーの法則(Lipinski's rule of five)のようなルールベースのフィルターを使用して、望ましくないADMEプロフ…
1年前
DMTA(Design-Make-Test-Analize)サイクル内のCROとの協業
パトコアの技術ブログ
CROとの協業時の重要な要素 薬剤探索会社がディスカバリー・プロセスの一部を契約研究機関(CRO)に委託することは、ますます一般的になっています。 これにより、プロジェクトリーダーには社内および外部の活動を追跡する必要があります。データや進行中の活動の状況、内部および外部のプロジェクトメンバーの今後の計画など、すべてのプロジェクト関連情報を1つの場所に集約することは、概観とコミュニケーションを容易にします。 適切に制限されたプロジェクトデータの共有 多くの場合、薬剤探索会社は、CROとの間で内部のプロジェクト関連情報の共有を必要最低限に制限したいと考えています。 プロジェクト内でのさまざまな協…
1年前
薬物設計における主要な特性 | 親油性、pKa、および溶解度の予測
パトコアの技術ブログ
物理化学的特性は、薬物設計における重要な記述子です 親油性、pKa、および溶解度は、薬物設計において重要な記述子です。これらの特性は、薬物の薬物動態学的な曝露(ADME)と薬力学的な応答(標的および非標的への効果)の両方においての重要性が、文献で詳しく研究され、説明されています(図1参照)。 ほとんどの薬物探索会社は、これらの特性を高スループットな方法で測定しており、薬物設計者は化合物の合成の優先順位を決定する前に、頻繁にこれらの特性を予測しています。 図1a:薬物のpKaは直接的にそのイオン化状態に影響を与え、親油性、溶解度、タンパク質への親和性(標的と非標的)、および膜を通過する透過性と関…
1年前
低分子の物性を予測するためのローカルモデルとグローバルモデル
パトコアの技術ブログ
最も成功するためには、どのようなタイプのモデルを構築すべきか 明白な答えは、前向きに予測できるすべてのモデルです。また、特性が改善された新規化合物の設計を容易にするために、モデルが解釈可能であれば、非常に価値があります。 もう一つの重要なパラメータは、適用領域の大きさです。ドメインが大きいと、入力化合物が非常に多様であっても、モデルによって認識され、正しく予測されるため、より有望な化学空間に外挿することができます。 薬学者や計算化学者は、どのようなタイプのモデルを構築すれば最も成功するのか、どのように判断するのでしょうか? ローカルモデルとグローバルモデルの選択 通常、適用範囲と予測力の間には…
1年前
科学的仮説の構築-化合物の最適化のために
パトコアの技術ブログ
科学的仮説の創出 科学的仮説は、新薬の設計・開発において中心的な役割を果たします。厳密な仮説は、既存のデータを系統的に分析することで構築され、分子の化学構造と生物活性の関係を理解するための予測的な枠組みとして機能します。仮説は、新薬の設計や試験の指針となり、最も有望な研究手段にリソースを振り向けることができるため、創薬プロセスの成功に不可欠なものです。 良い科学的仮説の定義とは? 新薬の設計を容易にする優れた科学的仮説とは... 徹底したSAR分析に基づいている 理解しやすく、チーム全体が最初のアイデアに貢献し、反復することができる 設計された化合物の次の反復が常に良いものであることを保証する…
1年前
pKaや溶解度の予測値は、現実と比較してどうなのか?
パトコアの技術ブログ
pKa予測ツールの精度を創薬セットで評価した結果、RMSEは1.11、ピアソン相関係数は0.88となりました。また、希少元素、多成分構造、4級窒素原子を含むデータセットで溶解度予測ツールを評価した結果、RMSEは1.16、ピアソン相関係数は0.84を達成しました。適用領域外の構造をフィルタリングするためにリガンドプレパレーションを実施した結果、6,886件のサブセットでより高い精度を達成しました。本研究は、ユーザーコミュニティに透明性を提供し、議論のきっかけを作るとともに、未知の化学空間に対するトレーニングによってモデルを改善することを目的としています。著者らは、実験的に決定された物理化学デー…
1年前
特許でクレームされる構造とは?- 特許文献解析へのMMP変換の応用例
パトコアの技術ブログ
特許文献に見る医薬化学的変換 新薬の設計と最適化には、創造性と知識の両方が必要です。Matched Molecular Pairs法の使用は、このプロセスをサポートする方法の1つです。 一般的にMMPは、薬物分子の構造変化と、それに対応するアッセイ結果の変化量を結びつけるために用いられます(図1)。 図1 MMP法を用いて、特許データベースSureCHEMBLに掲載されている合成可能な変換をすべて抽出しました。 その結果、最適化パラメータに関係なく、医薬化学者が特定の変換をどれだけ頻繁に使用しているかを概観することができます(表1)。 SureChEMBLは、特許文献の全文、画像、添付ファイル…
1年前
EXCELRA社の臨床薬理スペシャリストの一日
パトコアの技術ブログ
臨床薬理学者は、医薬品開発が複雑で時間のかかる活動であることを理解しています。目標は野心的で、病気を治したり症状を和らげたりする薬を開発したり、リポジショニングにより再利用したりすることです。しかし、その成功率は低い。医薬品開発の旅は、それぞれ大きな不確実性を伴って始まり、進行するにつれて、重要な発見ができる可能性はさらに低下していきます。分子を薬に変え、患者の手に渡るまでに10億ドル以上[i]、15年以上かかると推定する報告もあります[ii]。 しかし、ビッグデータの登場は、バイオ医薬品業界に新たな息吹を吹き込みました。データは、これまで臨床試験の負担によって隠されていた発見への扉を開いてく…
1年前
Trainer Engine : データから予測モデルへの翻訳
パトコアの技術ブログ
Patcore, Inc. Ákos Tarcsay, Calculators製品マネージャー, Wendy Warr氏(Wendy Warr & Associates Home Page)による、2022年Chemaxonユーザー会レポートより ※Trainer Engineの詳細はこちらをご参照ください。 機械学習(ML)のライフサイクルは、データの収集、標準化、トレーニング、可視化、トリアージを含む実験、モデルの展開と再トレーニングを経て行われます。Chemaxonは、データの取り込みから前処理、モデリング、レビュー、予測までをサポートするプロセスを開発しました。Ákosは、Java M…
1年前
卓越したデータをGOSTARで
パトコアの技術ブログ
Patcore, Inc. AI/MLを用いた製薬では、データの品質が重要です。予測モデルはデータに依存し、データが良ければ良いほど、予測精度は高くなります。 GOSTARは、アルゴリズムの学習、モデルの設計、結果の検証のために、高品質で一貫した構造、包括的な注釈付きデータセットを提供します。 GOSTARのデータは、製薬会社やバイオテクノロジー会社がAI/MLモデルを構築し、創薬の新たなフロンティアを探索することを支援します。 「GOSTARは様々な種類の情報やデータを提供しています。異なる種類の予測を作成することができます。薬剤探索において、多様な予測オプションを持つことは確かに役に立ちま…
1年前
Marvin Sketchダウンロード方法(更新:2023/4/13)
パトコアの技術ブログ
Patcore, Inc. 今回は、ChemaxonのMarvin Sketchのダウンロード方法について、解説します。 この記事をきっかけに、これからMarvin Sketchをご利用いただくお客様のお手伝いができればいいなと思います。 Mavin Sketchについて ダウンロード方法 サイトからのダウンロード Chemaxonサイトに登録 登録を完了 メールを確認 パスワード設定 Marvin Sketchをダウンロード Marvin Sketchご利用にあたってのライセンスについて アカデミックライセンス 非商用ライセンス 最後に Mavin Sketchについて Marvin Ske…
1年前
最新の構造活性相関データを迅速に入手するには
パトコアの技術ブログ
構造活性相関データ(構造式VS活性などの特性データ)は創薬研究において、ドラッグデザインやパテンタビリティーの調査、AI/MLモデルの構築などに不可欠です。 過去に広く研究されたターゲットや適応症については、使用できる既存のデータが大量に存在します。 多くの企業で用いている公的データベースや自社で長い間収集されたデータセットが用いられていますが、これらの古いデータセットには、最近公開された特許情報や最新の論文データがなど、研究科学の進展に関する情報が含まれていないという課題があります。 近年はデータ処理の技術が飛躍的に向上し、所定のサイトからデータを抽出して、データのクレンジングや、同一の情報…
2年前
類似構造検索について
パトコアの技術ブログ
icon by twemoji / CC-BY Yuichiro Abe 分子が似ているということは性質も似ている可能性が高く、創薬研究の場合ではリード化合物の最適化、ケミカルスペースの探索等の用途に類似構造検索によるスクリーニングが欠かせないツールとなっています。一般的に構造類似度が0.7を超えると構造が似ていると判断できますが、この値は使うパラメータや計算方法により変わってきます。また、構造が似ていると計算された場合でも、実際に似ているかどうかの判断は評価する人や目的により変わりますので、正しい計算ができているか明確にわからない点も特徴です。部分一致検索や完全一致検索のように正解・不正解が…
3年前
KNIMEでChemAxonノードを使ってみる
パトコアの技術ブログ
Patcore, Inc. 非プログラマーがデータ処理を行う上で便利なツールとしてワークフローツールがあります。有名なものはKNIMEとPipeline Pilotです。この内KNIMEについては無償のオープンソースソフトウェアとして提供されており、気軽に使える点が便利ですね。 KNIMEではデータ処理を「ノード」の単位で自由に組み合わせることができるため、計算化学を専門としないメドケムの方々の間でも創薬研究のデータ処理ツールとして広く使われています。KNIMEの大きな特徴はそのコミュニティの強さでしょうか。日本の総代理店であるインフォコム様1のセミナーが定期的に開催されている他、TeachO…
3年前
Instant JChemによる化合物のクラスタリングと可視化
パトコアの技術ブログ
Patcore, Inc. 化合物のライブラリーサイズが増加していることに伴い、類似の性質・構造を持つ化合物群に分類する手法が発達してきました。化学構造のフィンガープリントを使った構造類似度に基づく分類法(ウォード法、k平均法)や、部位構造に着目した分類法(MCS、BMF)が挙げられます。この目的でChemAxonからはJKlusterというパッケージが提供されています。 分析方法は置いておいて、本記事ではある化合物ライブラリーから目的の骨格を持つ化合物レコードを探し出して可視化するための方法について紹介します。可視化のためにはInstant JChem1という化学データ閲覧・可視化アプリケー…
3年前
ステレオ表記の取り扱い
パトコアの技術ブログ
Yuichiro Abe 創薬研究開発の過程では不斉中心を持つ化合物が多く合成されるため、立体異性体(ステレオアイソマー)の化合物情報を管理するための表記方法、構造検索のオプションが用意されています。立体異性体は化学的にいくつかの種類があり、システム上の取り扱いについても複雑です。ChemAxon社のサイトにMOL V3000形式(※)の解説記事が投稿されましたので、Marvin SketchやJChem Baseにおけるステレオ表記についてまとめてみました。 今回取り扱うのは、立体ボンド(Wedgeボンド:Up / Down, Wiggly)で下記の図に描画されている様な、正四面体不斉中心を…
3年前
ペプチドの配列情報を使ったSAR解析
パトコアの技術ブログ
Patcore, Inc. 創薬研究の現場において、低分子化合物をターゲットとした研究開発以外にも、ペプチド・核酸・抗体(抗体薬物複合体)などの新たなモダリティに対する関心が高まっています。それらバイオポリマーに関する情報は配列として保存され、ケモインフォマティクス同様、バイオインフォマティクスの手法により創薬リードの探索が進められています。 バイオポリマーの薬理作用を最適化する場合、配列中のアミノ酸残基、核酸を置換(変異)、欠損、修飾する操作が行われます。生化学的技法の発展により配列の操作は実用的な難易度で可能になりました。しかし、どの様な配列を設計すれば薬理活性を上げることができるか、とい…
3年前
各種化学計算がMarvinで可能になりました!
パトコアの技術ブログ
Patcore, Inc. 2021年の1QにMarvin Sketchのアップデートがあり、Marvin Sketch上で各種化学計算を行えるようになりました。これまでCalculator Pluginsのライセンスを持っていないと正規版として利用できなかったのですが、その制限がなくなったため、Marvin Sketchのライセンスを持っているだけで利用可能になります。つまり、アカデミックライセンスをお持ちの場合は無料で利用できます。Marvin 21.x以降のバージョンが対応していますので、古いバージョンをお使いの方は最新化をお願いします。 この変更により、化学構造を描画すると同時に物理化…
3年前
構造検索の種類
パトコアの技術ブログ
Yuichiro Abe 既知有機化合物の数が1880 年から1960 年にかけて約12,000 化合物から100 万化合物に急増したように、有機化学は20 世紀に急速に発展しました。今日では、ハイスループットスクリーニングやコンビナトリアルケミストリーなどの新たな手法を用いた大規模化合物ライブラリーに対する探索が行われています。また、計算機上で標的構造を特定するために仮想化合物ライブラリーの重要性も増しており、ケミカルスペースは拡大し続けています。 ケミカルスペース1 大量の化学データを扱うための手法も同時に進化しており、化学構造検索エンジンとしてChemAxon社のJChemなどのテクノロ…
3年前
JavaScriptで動く化学構造式描画ツール
パトコアの技術ブログ
Patcore, Inc. 化学構造式を描画するツールとして、技術ブログ第一回でデスクトップアプリケーションであるMarvinSketchを紹介しました。今回はWebブラウザで動くMarvin JSについての記事となります。 Webブラウザ上で動くMarvin JSは、多くのウェブアプリケーションで採用されています。公的化学データベース、ELN等にも採用されていますが、皆さまが目にする機会が多いのは試薬会社の商品検索ページでしょうか。国内ですとTCI様、関東化学様、ナミキ商事様などに採用されていますし、海外ですとEnamine社やChemSpace社などで採用されています。 Marvin JS…
3年前
誘導体の構造を生成する
パトコアの技術ブログ
Patcore, Inc. 構造活性相関(QSAR・QSPR)の分析を行う上で、主骨格が決まっているが、側鎖の結合位置や種類を変えた多数の構造が欲しい、と思うことがあるかもしれません。また、単に化学的に妥当であるランダムなケミカルスペースがモデルとして必要となる場合もあることでしょう。PubChemのデータや、GDB-131のような利用可能なデータベースを使っても良いですが、Marvin Sketchを使うと簡単に構造を生成(enumeration)できるので、紹介したいと思います。 今回作ったテンプレート(約20万通りの構造が生成される) 目次 目次 今回使うもの Atom List Bon…
3年前
分子構造の表記方法
パトコアの技術ブログ
Yuichiro Abe パトコア技術チームの安倍と申します。普段はプリセールス寄りのお仕事をしています。 技術ブログができたということで、せっかくなので年末の休暇中に読んだ面白い論本について、(だいぶ時間が経ちましたが。。)記事にしたいと思います。分子構造の様々な表記方法についてまとめた総説になっており、大変勉強になりました。 Molecular representations in AI-driven drug discovery: a review and practical guide David et al., J Cheminform 12, 56 (2020). DOI: ht…
3年前
化合物データベースを作成する(JChemBase編)
パトコアの技術ブログ
Patcore, Inc. 数百万の化合物構造と構造情報に紐づくデータを安定して管理する方法としてリレーショナルデータベース(以下DB)が広く用いられています。今回は、そのDBのバックエンドで動作し、構造検索などの化学に特化した機能を利用できるようにするJChem Base1について紹介します。 化学情報をDBで管理する検索エンジンはChemAxon社の「Heart beat」テクノロジーに位置付けられており、様々なChemAxon製品の基盤となっています。現在、JChem EnginesシリーズとしてRDBMS(Oracle, PostgreSQL, etc.)に最適化されたもの、ウェブサー…
3年前
化合物データベースを作成する(Excel編)
パトコアの技術ブログ
Patcore, Inc. 化学構造情報と物性値・アッセイデータ・スペクトルデータなどを紐づけたデータベースは多数存在しており、公的・私的な様々な目的で利用されています。特に製薬企業では保有する化合物データベースはR&Dの要であり、数百万もの化合物情報が情報資産として厳重に管理されています。最近ではAstraZenecaとBayerのパートナーシップの事例のように、オープンイノベーションの動きを受けて保有するデータを相互に参照可能とする動きがあるようですね。 本格的な化合物データベースを作ろうとした場合、データベース管理システム(DBMS)の専門知識と共に、構造正規化ルールやステレオ情報・塩・…
3年前
化合物設計プラットフォームのプラグインについて
パトコアの技術ブログ
Patcore, Inc. ChemAxon社は化合物検索エンジンや化学構造形式変換・名前変換サービスなど、ケモインフォマティクスに関する多くの要素技術を持っています。これらのツールは単体の機能として使われることを想定しており、モジュールとして利用や、コマンドラインツールなどのインターフェースで利用できます。一方で、機能群を統合させた製品はアプリケーションと呼ばれ、顧客の抱える課題を解決することや、業務ワークフローを円滑にする目的で利用されます。 最近ChemAxon社からリリースされたDesign Hubというアプリケーションは、化合物設計のプロジェクトで使ってもらいたい製品です。複数人のチ…
4年前
ケモインフォマティクスツールのコンソールからの利用
パトコアの技術ブログ
Patcore, Inc. 前回の投稿ではGUIで操作する化学構造描画ツールの紹介をしました。GUIでの操作は直感的でわかりやすく、人間にとって親切なインターフェースを提供してくれます。一方で、数百-数千の化学情報を一度に変換したい、バッチ処理をしたい、他のツールと連携させたい、といった場合は、コマンドで操作できると便利です。 そこで、今回はコマンドラインで操作するツールについて紹介いたします。 molconverter 化学情報を変換する。 mview MarvinViewを呼び出して、構造の確認をする。 cxcalc Calculator Pluginsを使った物性計算を行う。 目次 目次…
4年前