2025 年 3 月 28 日,諾獎得主、蛋白質設計先驅?David Baker?教授在?Nature Methods?期刊發(fā)表了題為:Atomic context-conditioned protein sequence design using LigandMPNN?的研究論文。
該研究開發(fā)了一種新型深度學習方法——LigandMPNN,該方法明確地對生物分子系統(tǒng)中的所有非蛋白質成分進行了建模,預計 LigandMPNN 將在設計新的結合蛋白、傳感器和酶方面得到廣泛應用。
?
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

蛋白質的從頭設計,能夠創(chuàng)造出具有新功能的新型蛋白質,例如催化作用、與 DNA、小分子和金屬的結合以及蛋白質間的相互作用。

在生物信息學領域,傳統(tǒng)純生信研究依賴大量實驗,成本高、周期長,限制了研究進展。而隨著人工智能技術飛速發(fā)展,機器學習算法展現(xiàn)出強大的數(shù)據(jù)處理與分析能力,為純生信研究開辟新路徑。將機器學習引入純生信,有望突破實驗瓶頸,高效挖掘生物數(shù)據(jù)價值,助力科研人員更深入理解生命奧秘,在疾病篩查、藥物研發(fā)等方面發(fā)揮關鍵作用,這一融合趨勢成為科研界關注焦點。

2025年熱門專題,助您發(fā)頂刊

1.AI蛋白質設計

2.合成生物與基因電路設計

3.CADD計算機輔助藥物設計

4.AIDD人工智能藥物設計與發(fā)現(xiàn)

5.機器學習代謝組學

6.深度學習基因組學

7.?機器學習生物醫(yī)學

8.CRISPR-Cas9基因編輯技術

9.?AI智慧醫(yī)療影像技術

10.多模態(tài)醫(yī)療 AI 大模型?

特惠福利:報一送一可額外送的回放課件資料ppt

01.機器學習微生物組學

02.單細胞測序與空間轉錄組學

03.深度學習解析宏基因組學

04.蛋白晶體結構解析

05.深度學習質譜蛋白組學

獲取資料方式(掃描下方二維碼)

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

以下為具體課程內容安排

01AI蛋白質設計

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第一天:導論?+ 工具資源 + Baker組設計流程

課程導論與AI在生物醫(yī)藥領域的應用

課程內容、目標和安排介紹

AI在現(xiàn)代生物學和醫(yī)學研究中的革命性作用

蛋白質設計與藥物發(fā)現(xiàn)的基本概念

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

重要的工具和資源網(wǎng)站

蛋白質結構數(shù)據(jù)庫:?PDB, AlphaFold DB

序列數(shù)據(jù)庫:?UniProt, GenBank

計算工具平臺:?Google Colab, PyMOL, ChimeraX

在線服務:?Robetta, SWISS-MODEL

Baker諾獎實驗室的蛋白質設計哲學與流程

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

介紹David Baker教授和IPD(蛋白質設計研究所)

核心思想:從功能出發(fā),設計全新的蛋白質結構。

Rosetta軟件:蛋白質設計的基石,從序列到結構,再從結構到序列。

設計流程:確定問題:識別需要解決的生物學問題(如,中和病毒、靶向癌細胞)。結構設計:在計算機上設計能夠實現(xiàn)該功能的蛋白質三維結構。序列反向設計:找到能夠折疊成目標結構的氨基酸序列。實驗驗證:通過濕實驗(wet lab)合成并驗證設計的蛋白質。

實例:講解利用Rosetta設計新冠病毒中和蛋白或自組裝納米籠的案例。

第二天:深度學習基礎

NumPy與PyTorch入門

NumPy:學習多維數(shù)組(Tensor)的操作,?PyTorch:介紹其基本概念,如張量、自動求導(autograd)和計算圖。實例:使用NumPy進行矩陣運算,使用PyTorch搭建一個簡單的線性回歸模型。

神經(jīng)網(wǎng)絡基礎模型

全連接網(wǎng)絡?(DNN):基本結構和原理。卷積神經(jīng)網(wǎng)絡?(CNN):在圖像識別中的應用,以及如何應用于結構生物學(如:將蛋白質結構視為3D圖像)。循環(huán)神經(jīng)網(wǎng)絡?(RNN/LSTM):處理序列數(shù)據(jù)的利器,及其在蛋白質序列分析中的應用。

展望深度學習在生物醫(yī)藥中的應用基因組學,醫(yī)學影像蛋白質組學

實踐使用Google Colab,加載一個簡單的生物數(shù)據(jù)集(如,根據(jù)蛋白質序列判斷其是否為膜蛋白)。利用PyTorch搭建一個簡單的CNN或RNN模型,對數(shù)據(jù)進行分類,并理解其基本訓練過程。

第三天:AlphaFold系列預測模型

蛋白質折疊問題與AlphaFold的誕生

“Levinthal’s paradox”和蛋白質折疊問題的復雜性。

CASP競賽和AlphaFold 1的突破。

AlphaFold 2的核心思想:

Evoformer模塊:融合多序列比對(MSA)和蛋白質結構信息。Attention機制的應用。端到端的結構預測。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

AlphaFold 2的結構與原理詳解

輸入特征:MSA和氨基酸對的幾何關系。輸出:每個殘基的精確三維坐標和pLDDT置信度分數(shù)。PAE(Predicted Aligned Error)圖的解讀和應用。

AlphaFold-Multimer 和 AlphaFold 3

AlphaFold-Multimer:從單體到復合物的結構預測。

AlphaFold 3:預測范圍擴展到蛋白質、DNA、RNA、配體等多種分子類型,及其在藥物設計中的巨大潛力。

第四天:RFdiffusion系列生成模型 + MPNN?

生成式AI與蛋白質設計

“預測”到“創(chuàng)造”的范式轉變。

介紹擴散模型(Diffusion Model)的基本原理(加噪和去噪過程)。

RoseTTAFold Diffusion (RFdiffusion) 詳解

RFdiffusion如何從隨機噪聲中生成全新的蛋白質骨架。無條件生成(Unconditional generation)基于骨架的生成(Scaffolding)功能位點限定生成(Inpainting)

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

ProteinMPNN

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

功能:在給定的蛋白質骨架上設計出合理的氨基酸序列(Inverse Folding)。

MPNN如何與RFdiffusion協(xié)同工作:RFdiffusion生成骨架,MPNN填充序列。

任務:使用RFdiffusion的Colab notebook,嘗試生成一個具有特定對稱性(如C3對稱)的蛋白質骨架。將生成的骨架輸入到ProteinMPNN中,獲得氨基酸序列。使用AlphaFold 2驗證生成的序列是否能折疊成預期的結構。

第五天:ESM語言模型和抗體/多肽藥物和酶設計全流程

蛋白質語言模型?(Protein Language Models, PLM)

將蛋白質序列視為“語言”,氨基酸視為“單詞”。

ESM (Evolutionary Scale Modeling) 系列模型:

ESM-1b, ESM-2: 從海量序列中學習蛋白質的語法和語義。ESM-IF1 (Inverse Folding): 結構到序列的預測。ESMFold: 無需MSA的快速結構預測。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

抗體/多肽藥物設計全流程

靶點發(fā)現(xiàn)與驗證:確定要靶向的抗原;傳統(tǒng)方法:噬菌體展示、雜交瘤技術;親和力與特異性優(yōu)化:通過計算模擬和定點突變進行優(yōu)化成藥性評估:穩(wěn)定性、溶解度、免疫原性預測。

深度學習輔助的酶工程

介紹如何利用機器學習和深度學習來指導和加速酶的定向進化。并掌握利用計算模型優(yōu)化酶性能的前沿方法。

基礎知識講解:酶、能量與適應性景觀酶催化與過渡態(tài)理論?(Transition State Theory);Theozyme與計算酶設計:適應性景觀 (Fitness Landscape);

從諾獎工作看酶的定向進化Frances H. Arnold定向進化領域的先驅傳統(tǒng)定向進化實驗流程機器學習指導的定向進化

02合成生物與基因電路設計

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第一天

合成生物學基礎概念與應用領域剖析

1.深度解讀合成生物學精準定義,系統(tǒng)闡述其涵蓋研究內容,沿著發(fā)展歷程脈絡回溯,展望未來趨勢,全方位掃描應用領域。

2.通過詳實案例分析,將合成生物學在醫(yī)藥、農業(yè)、工業(yè)等實際場景的應用具象化,讓學員感知其變革力量。

生物元件功能精講與標準化設計準則

1.聚焦生物元件,如啟動子精準調控轉錄起始、終止子界定轉錄終點、RBS 驅動核糖體結合開啟翻譯。

2.結合 BioBrick 元件設計范式與應用實例,傳授生物元件模塊化設計黃金法則,助力學員掌握構建標準化生物模塊的精髓。

第二天

基因線路邏輯架構搭建與實例演練

1.開啟基因線路邏輯世界大門,詳細拆解與、或、非基本邏輯門運作原理及設計技巧。

2.引入 iGEM 競賽中經(jīng)典邏輯門線路應用案例,手把手指導學員實踐操作,使其能獨立構思簡單基因線路并洞悉其功能。

復合元件整合與電路深度設計

以前兩天所學生物元件、基因線路知識為基石,引導學員梳理合成生物學核心玩法。親手設計、搭建、分析經(jīng)典電路,實現(xiàn)知識融會貫通,掌握復雜電路中各模塊協(xié)同運作奧秘。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第三天

代謝途徑精細構建與優(yōu)化策略

1.深入講解代謝途徑搭建步驟,剖析定向進化、代謝工程等優(yōu)化策略。

2.以青蒿素生物合成途徑優(yōu)化為典型案例,傳授從理論到實踐的代謝途徑設計方法,助力學員提升生物合成效率。

基因組合成與編輯技術前沿

1.系統(tǒng)講解基因組合成底層原理、多元方法,深度剖析 CRISPR/Cas9 等基因組編輯技術原理。

2.結合海量案例,呈現(xiàn)基因組合成與編輯技術在定制生物、精準醫(yī)療等前沿領域的實際應用。

第四天

底盤生物特性解析與應用

1.引入底盤生物概念,剖析常見底盤生物(如大腸桿菌、酵母菌等)特性。

2.講解其在基因線路搭載、基因表達中的關鍵作用,結合實例探討如何依據(jù)項目需求選擇適配底盤生物,實現(xiàn)高效基因操作。

合成生物系統(tǒng)搭建與優(yōu)化實踐

1.全方位講解合成生物系統(tǒng)定義、分類,通過案例剖析系統(tǒng)構建流程,傳授優(yōu)化策略。

2.組織實踐操作,讓學員親身體驗合成生物系統(tǒng)的構建與優(yōu)化全過程,學會依據(jù)反饋調控系統(tǒng)參數(shù)。

第五天

合成生物學數(shù)學建模與性能分析

1.開啟生物系統(tǒng)數(shù)學建模之旅,介紹常微分方程、邏輯模型等常用建模方法。

2.結合基因線路動力學模擬案例,指導學員運用數(shù)學模型精準分析生物系統(tǒng)性能,為系統(tǒng)設計與優(yōu)化提供量化支撐。

合成生物學全景總結與未來瞻望

1.回溯課程所學知識,通過多領域案例分析,展現(xiàn)合成生物學應用廣度與深度。

2.組織學員熱烈討論未來發(fā)展趨勢、潛在影響,著重介紹倫理、生物安全與生物安保等關鍵議題,培養(yǎng)學員全面視角。

03CADD計算機輔助藥物設計

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第一天

1.CADD藥物設計概論

1.1計算機輔助藥物設計的發(fā)源和基本概念

1.2計算機輔助藥物設計中常用的計算方法

2.??基于結構的藥物設計方法

1.1?基于結構的藥物設計方法概論

1.2?蛋白質數(shù)據(jù)庫的介紹:uniprot、PDB、AlphafldDB

3. 高質量畫圖軟件pymol 使用詳解

1.1 蛋白小分子相互作用、蛋白-蛋白相互作用繪制等

1..2?蛋白及小分子表面圖、靜電勢表示

第二天

1.蛋白質結構處理方法

1.1蛋白質結構預測方法理論介紹及使用

1.2蛋白質缺失殘基處理、殘基質子態(tài)確定、單點突變等處理方法

2.小分子結構處理方法

1.1常用的小分子數(shù)據(jù)庫介紹:zinc,chembl、pubchem、神農Alpha等

1.2Chemdraw的使用及小分子性質計算

第三天

1. 蛋白-小分子對接的基本流程與技巧

1.1 分子對接的原理

1.2 基于autudock和autodock vina的分子對接步驟詳解

1.3 對接結果的分析與挑選技巧

第四天

1.特殊的分子對接的基本流程與技巧

1.1蛋白-小分子柔性對接步驟詳解

1.2蛋白-蛋白/DNA/RNA,小分子-小分子對接方法詳解

2. 基于分子對接的虛擬篩選詳解

1.1 虛擬篩選的流程與處理

1.2 虛擬篩選的結果分析與技巧

第五天

1.Openbael的使用

1.1小分子不同的表示形式、文件格式介紹

1.2Openbabel的文件格式轉換、分子結構生成介紹

2.ADMET介紹和反向找靶介紹

3.QSAR模型介紹及操作

1.1 QSAR模型的基本原理

1.2 3DQSAR–COMFA和COMSIA模型的構建與結果分析

第六天

1.Linux系統(tǒng)操作

1.1Linux系統(tǒng)介紹

1.2Linux常用命令操作

2.分子動力學模擬介紹

1.1分子動力學模擬理論介紹

1.2常用軟件和一般流程介紹

第七天

1.MD實踐

1.1溶劑化下蛋白質分子動力學模擬

1.2?溶劑化下蛋白質-配體的分子動力學模擬

1.3 ?MD結果分析

2. 答疑:

1.1 課程知識答疑

1.2 學員實際課題思路答疑

04AIDD人工智能藥物發(fā)現(xiàn)與設計

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

1天:環(huán)境搭建與深度學習基本知識講解

1.AIDD概述:從CADDAIDD

2.軟件安裝與環(huán)境搭建

(1)anaconda

(2)vscode

(3)環(huán)境變量的配置

(4)切換pipconda鏡像源

(5)虛擬環(huán)境的創(chuàng)建

3.RDKIT工具包的使用

(1)基于RDKit的分子讀寫

(2)基于RDKit的分子繪制

(3)基于RDKit的分子指紋與分子描述符

(4)基于RDKit的化合物相似性與子結構

4.藥物綜合數(shù)據(jù)庫的獲取方法

(1)基于requests的基本爬蟲操作

(2)小分子數(shù)據(jù)庫PubChem數(shù)據(jù)獲取pubchempy / requests

(3)蛋白質數(shù)據(jù)庫PDBUniProt數(shù)據(jù)獲取

5.深度學習輔助藥物設計

(1)神經(jīng)網(wǎng)絡基本概念與sklearn工具包介紹

(2)圖神經(jīng)網(wǎng)絡與消息傳遞機制基本知識

(3)Transformer模型基本知識:分詞、位置編碼、注意力機制、編碼器、解碼器、預訓練微調框架、huggingface?生態(tài)介紹

(4)模型的評估與驗證:準確率、精確率、召回率、F1分數(shù)、ROC曲線、AUC計算,平均絕對誤差、均方差、R2分數(shù)、可釋方差分數(shù),交叉驗證等

2天:頂刊復現(xiàn)專題1——分子與生化反應的表示學習與性質預測助力藥物發(fā)現(xiàn)

培訓背景:在人工智能輔助藥物發(fā)現(xiàn)(AIDD)中,分子與生化反應的表示學習與性質預測是整個研究流程的基石。分子的結構決定其功能,如何將復雜的分子結構和生化反應過程有效地表示為計算模型能夠理解的形式,是實現(xiàn)高效預測和優(yōu)化的前提。通過構建合理的分子表示(如圖神經(jīng)網(wǎng)絡、SMILES編碼、指紋等),我們可以讓AI模型捕捉關鍵的化學特征,進而用于預測分子的物理化學性質、生物活性、毒性等,為后續(xù)的虛擬篩選、分子生成與反應設計提供可靠基礎。因此,本專題不僅奠定了AIDD中建模與預測能力的核心能力框架,也為整個藥物發(fā)現(xiàn)過程中的智能決策打下了堅實基礎。

培訓內容1:

Nature Machine Intelligence|基于注意力的神經(jīng)網(wǎng)絡在化學反應空間映射中的應用《Mapping the space of chemical reactions using attention-based neural networks

1.數(shù)據(jù)集

1.1.Pistachio數(shù)據(jù)集:包含260萬化學反應,來自專利數(shù)據(jù),涵蓋792個反應類別。數(shù)據(jù)經(jīng)過去重和有效性過濾(使用RDKit)。

1.2.USPTO 1k TPL數(shù)據(jù)集:基于USPTO專利數(shù)據(jù),包含44.5萬反應,通過原子映射和模板提取生成1,000個反應模板類別。

1.3.Schneider 50k數(shù)據(jù)集:公開數(shù)據(jù)集,包含5萬反應,50個類別,用于與傳統(tǒng)指紋方法對比。

2.模型。研究對比了兩種Transformer架構:

2.1.BERT分類器:基于編碼器的模型,通過掩碼語言建模預訓練后,在分類任務上微調,使用[CLS]標記的嵌入作為反應指紋(rxnfp)。

2.2.Seq2Seq模型:編碼器解碼器結構,將分類任務分解為超類、類別和具體反應的層級預測。兩者均采用簡化版BERT(隱藏層256維),輸入為未標注的SMILES序列,無需反應物試劑區(qū)分或原子映射。

3.訓練。模型訓練分為兩步:

3.1.預訓練:BERT通過掩碼SMILES令牌預測任務進行自監(jiān)督學習,學習反應通用表示。

3.2.微調:在分類任務上優(yōu)化模型,使用交叉熵損失,學習率2×10??,序列長度512。評估采用混淆熵(CEN)和馬修斯相關系數(shù)(MCC)以處理數(shù)據(jù)不平衡。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

培訓內容2:

TOP期刊|基于深度學習的生化反應產量預測《Prediction of chemical reaction yields using deep learning》?

1.數(shù)據(jù)。研究使用了三類數(shù)據(jù):

1.1.Buchwald-Hartwig HTE數(shù)據(jù)集:包含3955Pd催化C-N偶聯(lián)反應,涵蓋15種鹵化物、4種配體、3種堿和23種添加劑組合,產率通過統(tǒng)一實驗測量,數(shù)據(jù)質量高。 ?

1.2.Suzuki-Miyaura HTE數(shù)據(jù)集:包含5760個反應,涉及15對親電/親核試劑、12種配體、8種堿和4種溶劑的組合,產率分布均勻。 ?

1.3.USPTO專利數(shù)據(jù)集:從公開專利中提取,包含不同規(guī)模(克級與亞克級)的反應產率,數(shù)據(jù)噪聲大且分布不一致,需通過鄰近反應產率平滑處理以提升模型表現(xiàn)。

2.模型。核心模型基于預訓練的rxnfp(反應指紋)BERT架構,新增回歸層構成Yield-BERT。輸入為標準化反應SMILES,通過自注意力機制捕捉反應中心及關鍵試劑的上下文信息。模型無需手工特征(如DFT計算描述符),直接端到端預測產率。實驗表明,其性能優(yōu)于傳統(tǒng)方法(如隨機森林和分子指紋拼接),尤其在HTE數(shù)據(jù)上接近化學描述符的預測水平,且參數(shù)魯棒性高(超參數(shù)調整影響?。?。

3.訓練。訓練分為兩步:

3.1.預訓練:BERT通過掩碼語言任務學習SMILES的通用表示。 ?

3.2.微調:采用簡單Transformers庫和PyTorch框架,以MSE損失優(yōu)化回歸層,學習率(2×10??)和dropout率(0.1–0.8)為主要調參對象。HTE數(shù)據(jù)采用隨機/時間劃分驗證,USPTO數(shù)據(jù)通過鄰近反應產率平滑緩解噪聲影響。小樣本實驗(5%訓練數(shù)據(jù))顯示模型能快速篩選高產反應,指導合成優(yōu)化。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

培訓內容3:

TOP期刊|基于T5Chem模型的生化反應表示學習與性質預測:?Unified Deep Learning Model for Multitask Reaction Predictions with Explanation

1.數(shù)據(jù)來源和處理。通過自監(jiān)督預訓練與PubChem分子數(shù)據(jù)集進行訓練,以實現(xiàn)對四種不同類型的化學反應預測任務的優(yōu)異性能。模型處理包括反應類型分類、正向反應預測、單步逆合成和反應產率預測。

2.模型架構和原理T5Chem模型是基于自然語言處理中的“Text-to-Text Transfer Transformer”(T5)框架開發(fā)的統(tǒng)一深度學習模型,該模型通過適應T5框架來處理多種化學反應預測任務。T5Chem模型包含編碼器解碼器結構,并根據(jù)任務類型引入了任務特定的提示和不同的輸出層,如分子生成頭、分類頭和回歸頭,以處理序列到序列的任務、反應類型分類和產品產率預測。

3.訓練過程和細節(jié)。

3.1.T5Chem模型首先在PubChem97 million分子上進行自監(jiān)督預訓練,使用BERT類似的“masked language modeling”目標。

3.2.在預訓練階段,源序列中的tokens被隨機掩蔽,模型的目標是預測被掩蔽的正確的tokens。

3.3.預訓練完成后,模型在下游的監(jiān)督任務中進行微調,使用不同的任務特定提示和輸出層。

3.4.模型在測試階段通過生成分子token by token的方式進行預測,直到生成句子結束標記或達到最大預測長度。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

通過培訓可以掌握的內容:

1.分子與化學反應的表示方法。學習如何將分子和化學反應編碼為機器可處理的格式,如SMILESSimplified Molecular-Input Line-Entry System)和反應SMILES。理解分子指紋(如Morgan指紋)和反應指紋(如rxnfp)的構建方式,以及它們在化學信息學中的應用。掌握Transformer架構(如BERT)如何用于化學反應的特征提取,并生成具有化學意義的向量表示。

2.深度學習在化學反應預測中的應用。了解如何利用序列到序列(Seq2Seq)模型和BERT進行化學反應分類(如反應類型識別)和產率預測。學習如何通過自注意力機制分析化學反應的關鍵部分(如反應中心、試劑影響),提高模型的可解釋性。掌握如何利用預訓練+微調策略,使模型在少量標注數(shù)據(jù)下仍能取得良好性能。

3.數(shù)據(jù)驅動的化學研究范式。認識不同數(shù)據(jù)來源(如高通量實驗HTE、專利數(shù)據(jù)USPTO)的特點及其對模型訓練的影響。學習如何處理數(shù)據(jù)噪聲,并通過數(shù)據(jù)平滑、鄰近分析等方法優(yōu)化模型表現(xiàn)。了解小樣本學習在化學中的應用,例如如何用5%-10%的訓練數(shù)據(jù)篩選高產率反應,指導實驗優(yōu)化。

3天:頂刊復現(xiàn)專題2——蛋白質的表示學習與性質預測助力藥物發(fā)現(xiàn)

培訓背景AIDD中,蛋白質是藥物作用的主要靶標,其結構與功能的復雜性決定了藥物設計的成敗。蛋白質的表示學習與性質預測是理解分子靶點相互作用、發(fā)現(xiàn)候選藥物的重要環(huán)節(jié)。蛋白質,尤其是酶,作為藥物的主要作用靶點,其功能、結構與動力學性質直接影響藥物的設計與效果。本專題通過兩篇前沿研究工作展開講解:*Enzyme function prediction using contrastive learning展示了如何利用對比學習從蛋白質序列中提取高質量的功能表征,實現(xiàn)對酶功能的精確預測;CatPred*則提出了一個整合性深度學習框架,用于體外酶動力學參數(shù)(如Km、kcat等)的預測,這對于建立藥效模型與優(yōu)化先導化合物至關重要。這些方法顯著提升了蛋白質建模的準確性與泛化能力,為AI驅動的靶點發(fā)現(xiàn)、機制理解及候選藥物篩選提供了強有力的支持。

培訓內容1:?

Nature Communication|體外酶動力學參數(shù)深度學習的綜合框架《CatPred: a comprehensive framework for deep learning in vitro enzyme kinetic parameters

CatPred?提出了一種全面的深度學習框架,用于預測體外酶動力學參數(shù)(kcat、KmKi),以解決實驗測定成本高、數(shù)據(jù)稀疏和泛化能力差的問題。該方法不僅提供了準確的預測,還引入了對預測不確定性的量化,支持對訓練集外(out-of-distribution)酶序列的穩(wěn)健預測。此外,作者還構建了新的標準化數(shù)據(jù)集(CatPred-DB),并對多種酶表示方法進行了系統(tǒng)比較。

1.數(shù)據(jù)CatPred?使用的數(shù)據(jù)集來自?BRENDA?和?SABIO-RK?數(shù)據(jù)庫,作者構建了?CatPred-DB,包括:23197?條?kcat,41174?條?Km11929?條?Ki?數(shù)據(jù),每條記錄都包含酶的氨基酸序列、AlphaFold?或?ESMFold?預測的結構、底物的?SMILES?表達式。數(shù)據(jù)經(jīng)過清洗和標準化處理,去除缺失值和重復值,并對參數(shù)取對數(shù)轉換以符合正態(tài)分布。

2.模型CatPred?采用模塊化設計,酶和底物分別通過不同的神經(jīng)網(wǎng)絡模塊進行表征學習,并采用 概率回歸 輸出(高斯分布形式的均值和方差),允許進行 不確定性估計(aleatoric + epistemic)。

3.訓練

3.1.所有模型采用負對數(shù)似然損失函數(shù)(NLL)訓練,以同時預測參數(shù)均值和不確定性。

3.2.使用訓練驗證測試三分法(80%-10%-10%),并設立訓練集外的測試子集用于泛化能力評估。

3.3.為了評估不確定性,CatPred?使用?10個模型的集成,通過不同初始參數(shù)訓練,以此量化?epistemic uncertainty。

3.4.模型訓練時考慮了不同相似性(序列identity<99%、80%60%、40%)的測試集,體現(xiàn)其魯棒性。

培訓內容2:

Science|基于對比學習的蛋白質分類屬性預測Enzyme function prediction using contrastive learning

1.數(shù)據(jù)來源和處理:?CLEAN模型的訓練基于UniProt數(shù)據(jù)庫中的高質量數(shù)據(jù),該數(shù)據(jù)庫收錄了約1.9億個蛋白質序列。CLEAN模型以氨基酸序列作為輸入,輸出按可能性排序的酶功能列表(以EC編號為例)。為了驗證CLEAN的準確性和魯棒性,作者進行了廣泛的in silico實驗,并將CLEAN應用于內部收集的未表征的鹵酶數(shù)據(jù)庫(共36個)進行EC編號注釋,隨后通過案例研究進行體外實驗驗證。

2.模型架構和原理:?CLEAN模型采用了對比學習框架,目標是學習一個酶的嵌入空間,其中歐幾里得距離反映了功能相似性。嵌入是指蛋白質序列的數(shù)值表示,它由機器可讀,同時保留了酶攜帶的重要特征和信息。在CLEAN的任務中,具有相同EC編號的氨基酸序列具有較小的歐幾里得距離,而具有不同EC編號的序列則具有較大的距離。

3.訓練過程和細節(jié):

3.1.在訓練過程中,CLEAN模型使用對比損失函數(shù)進行監(jiān)督訓練,通過優(yōu)先選擇與錨點(anchor)嵌入具有小歐幾里得距離的負序列,以提高訓練效率。

3.2.模型使用語言模型ESM1b獲得的蛋白質表示作為前饋神經(jīng)網(wǎng)絡的輸入,輸出層產生細化的、功能感知的輸入蛋白質嵌入。

3.3.預測時,通過計算查詢序列與所有EC編號聚類中心之間的成對距離來預測輸入蛋白質的EC編號。

3.4.CLEAN還開發(fā)了兩種方法來從輸出排名中預測自信的EC編號:一種是貪婪方法,另一種是基于P值的方法。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

通過培訓可以掌握的內容:

1.?蛋白質表示學習的基本方法:理解蛋白質序列、結構信息如何被編碼為適用于深度學習模型的向量表示,包括基于序列的預訓練模型(如ESMProtBERT)和結構感知模型的原理與應用。

2.?對比學習在生物功能預測中的應用:深入學習對比學習策略,掌握如何通過正負樣本構建來提升蛋白質功能分類模型的判別能力。

3.?酶動力學參數(shù)預測建??蚣埽簩W員將理解如何結合序列、結構及輔助特征,利用深度學習模型預測關鍵的酶學參數(shù)(如Km、kcat),并掌握模型架構設計與性能評估的思路。

4.?評估與可解釋性分析方法:學習如何分析模型預測結果,評估性能指標,并探索特征重要性等可解釋性技術,幫助理解模型的決策依據(jù)。

5.?應用于真實藥物研發(fā)場景的思維框架:建立從蛋白質建模到下游任務(如藥物篩選、作用機制分析)的系統(tǒng)性理解,增強將AI方法應用于實際生物醫(yī)藥問題的能力。

4天:頂刊復現(xiàn)專題3——基于深度學習的分子生成助力藥物發(fā)現(xiàn)

培訓背景分子生成是化學、生物學和材料科學等領域的關鍵技術,對于新藥開發(fā)、新材料設計和化學反應預測具有重要意義。傳統(tǒng)的分子生成方法依賴于專家知識和試錯實驗,耗時且成本高昂。隨著人工智能技術的發(fā)展,特別是自然語言處理和擴散模型在分子生成中的應用,我們現(xiàn)在能夠利用計算模型來加速這一過程。本課程將介紹從NLP到擴散模型的設計模式,這些模型能夠理解和生成分子結構,從而提高分子設計的效率和準確性。通過本課程的學習,參與者將能夠掌握分子生成的最新技術和方法,以及如何將這些技術應用于實際問題。

培訓內容1

Nature Communication基于端到端的圖生成框架的分子生成Retrosynthesis prediction using an end-to-end graph generative architecture for molecular graph editing

1.數(shù)據(jù)來源和處理:Graph2Edits模型使用了公開可用的基準數(shù)據(jù)集USPTO-50k,包含50016個反應,這些反應被正確地原子映射并分類為10種不同的反應類型。數(shù)據(jù)集被分為40k、5k、5k的反應用于訓練、驗證和測試集。

2.模型架構和原理:Graph2Edits模型是一個端到端的圖生成架構,基于圖神經(jīng)網(wǎng)絡(GNN)預測產品圖的編輯序列,并根據(jù)預測的編輯序列順序生成中間體和最終反應物。該模型將半模板方法的兩階段過程(識別反應中心和完成合成子)合并為一鍋學習,提高了在復雜反應中的適用性,并使預測結果更易于解釋。模型的核心是圖編碼器和自回歸模型,用于生成編輯序列,并應用這些編輯來推斷中間體和反應物。

3.訓練過程和細節(jié):

3.1.Graph2Edits模型使用有向消息傳遞神經(jīng)網(wǎng)絡(D-MPNN)作為圖編碼器,以獲取原子表示和全局圖特征,并預測原子/鍵編輯和終止符號。

3.2.模型訓練使用教師強制策略,即使用真實的編輯序列作為模型輸入。在每個編輯步驟中,模型會計算所有可能的編輯的概率,并選擇最高分的k個編輯,將這些編輯應用于輸入圖以獲得k個中間體。

3.3.在生成過程中,如果達到最大步驟數(shù)或圖表示指示終止,則生成分支將停止。

3.4.最終,根據(jù)可能性對前k個編輯序列和圖進行排名,收集為最終預測結果。

培訓內容2

Nature Computational Science|基于等變擴散模型的分子生成網(wǎng)絡《Structure-based drug design with equivariant diffusion models

1.簡單介紹。這篇文獻提出了一種基于結構的藥物設計方法(SBDD),利用SE(3)-等變擴散模型(DiffSBDD)生成與蛋白質結合口條件匹配的新穎小分子配體。該方法通過將SBDD問題建模為三維條件生成任務,能夠一次性生成所有原子位置,克服了傳統(tǒng)自回歸方法因順序生成而丟失全局上下文的局限性。DiffSBDD不僅支持從頭分子設計,還能通過屬性優(yōu)化、負向設計和分子局部修飾(inpainting)等多種任務靈活應用。

2.數(shù)據(jù)總結。該研究使用了CrossDockedBinding MOAD兩個數(shù)據(jù)集進行訓練和評估。

2.1.CrossDocked數(shù)據(jù)集包含40,344個訓練蛋白配體對和130個測試對,驗證集規(guī)模為246個,確保不同集合中的蛋白質來自不同的酶分類主類以避免過擬合。

2.2.Binding MOAD數(shù)據(jù)集經(jīng)過篩選后用于測試,分析限于所有方法均能生成樣本的78CrossDocked119Binding MOAD目標。此外,數(shù)據(jù)集處理涉及移除損壞條目,并通過Zenodo公開提供處理后的數(shù)據(jù)和采樣分子,確保研究可重復性。

3.模型總結。DiffSBDD是一個SE(3)-等變擴散模型,以蛋白質結合口為條件生成三維分子結構,采用3D圖表示(原子坐標和類型),避免了傳統(tǒng)方法中從密度圖回推分子結構的復雜后處理。模型設計尊重三維空間的旋轉和平

通過培訓可以掌握的內容:

1.自然語言處理(NLP)在分子生成中的應用:掌握如何使用NLP技術來理解和生成分子結構。學習如何將自然語言描述轉換為分子結構(SMILES字符串)。

2.擴散模型在分子生成中的應用:理解擴散模型的基本原理及其在分子生成中的優(yōu)勢。學習如何使用擴散模型來優(yōu)化分子生成過程。

3.數(shù)據(jù)預處理和特征工程:學習如何處理和準備用于訓練分子生成模型的數(shù)據(jù)集。掌握如何從原始數(shù)據(jù)中提取有用的特征以提高模型性能。

4.模型架構和原理:深入理解MolT5,TGM-DLMGraphEdits模型的架構和工作原理。學習如何設計和實現(xiàn)這些模型以處理復雜的分子生成任務。

5.訓練過程和細節(jié):掌握模型訓練的全過程,包括預訓練和微調。學習如何調整模型參數(shù)和訓練策略以優(yōu)化性能。

6.評估和驗證:學習如何使用各種指標(如BLEU分數(shù)、Tanimoto相似性等)來評估生成的分子。掌握如何驗證模型生成的分子的有效性和準確性。

7.模型解釋和可視化:學習如何解釋模型的預測結果,以及如何使用可視化工具來理解分子生成過程。

8.最新研究進展和技術趨勢:了解分子生成領域的最新研究進展和技術趨勢。學習如何將最新的研究成果應用于實際工作。

5天:頂刊復現(xiàn)專題4:?結合分子動力學的蛋白質配體復合物相互作用動態(tài)預測

培訓背景:蛋白質配體相互作用的預測是現(xiàn)代藥物發(fā)現(xiàn)和生物工程領域的核心任務之一,其重要性不言而喻。在藥物開發(fā)過程中,準確預測蛋白質與小分子配體的結合位點、三維結構以及親和力,不僅能夠揭示分子間相互作用的機制,還能顯著加速候選藥物的篩選與優(yōu)化,降低研發(fā)成本和時間。傳統(tǒng)實驗方法如X射線晶體學和核磁共振雖然精確,但耗時長、成本高,且難以應對大規(guī)模篩選需求。而隨著深度學習和人工智能技術的快速發(fā)展,計算方法在蛋白質配體預測中展現(xiàn)出巨大潛力。

研究內容1:?

Nature Communication|交互作用感知的蛋白質配體對接和親和力預測模型《Interformer: an interaction-aware model for protein-ligand docking and affinity prediction

1.簡要介紹:本研究提出了一種名為Interformer的基于Graph-Transformer架構的統(tǒng)一模型,用于蛋白配體對接和親和力預測。針對現(xiàn)有深度學習模型忽略蛋白與配體原子間非共價相互作用建模的不足,Interformer引入了交互感知混合密度網(wǎng)絡(MDN)來明確捕捉氫鍵和疏水相互作用,并結合負采樣策略和偽Huber損失函數(shù),通過對比學習優(yōu)化相互作用分布,提升對接姿勢的準確性和親和力預測的魯棒性。

2.數(shù)據(jù)集:研究使用了PDBBind時間分割測試集(333個樣本)評估對接準確性,Posebusters基準測試驗證物理合理性,以及內部真實世界數(shù)據(jù)集測試泛化能力。訓練數(shù)據(jù)來源于PDBBind晶體結構數(shù)據(jù)庫。

3.模型Interformer基于Graph-Transformer架構,包括:(1)?圖表示模塊,將原子作為節(jié)點、鄰近關系作為邊;(2)?掩碼自注意力(MSA)機制,通過Intra-BlocksInter-Blocks分別捕捉配體/蛋白內部及兩者間的相互作用;(3)?交互感知MDN,融合四種高斯分布模擬常規(guī)力、疏水作用和氫鍵;(4)?邊緣輸出層整合節(jié)點和邊特征預測能量;(5)?姿勢評分和親和力模塊基于虛擬節(jié)點預測正確姿勢和實驗親和力值。

4.訓練細節(jié):訓練分兩階段:首先基于晶體結構訓練能量模型生成負樣本,隨后聯(lián)合正負樣本訓練姿勢評分和親和力模型。采用負對數(shù)似然損失優(yōu)化MDN,二元交叉熵損失優(yōu)化姿勢評分,偽Huber損失(σ=4)優(yōu)化親和力預測(單位IC50、KdKI,經(jīng)負對數(shù)歸一化)。蒙特卡洛采樣生成候選姿勢,

研究內容2:

Nature Communication分子動力學驅動的蛋白質配體復合物結構動態(tài)預測DynamicBind: predicting ligand-specific protein-ligand complex structure with a deep equivariant generative model

1.簡單介紹:本研究提出了一種名為DynamicBind的深度學習方法,用于預測配體特異性的蛋白配體復合物結構。傳統(tǒng)分子對接方法通常將蛋白視為剛性或僅部分柔性,難以處理蛋白的大尺度構象變化,而分子動力學模擬雖然能捕捉動態(tài)構象,但計算成本高昂。DynamicBind通過等變幾何擴散網(wǎng)絡構建平滑的能量景觀,高效模擬蛋白從無配體(apo)狀態(tài)到配體結合(holo)狀態(tài)的構象轉變,無需依賴holo結構或大量采樣。

2.數(shù)據(jù)集:研究基于PDBbind2020數(shù)據(jù)庫(19,443個蛋白配體復合物晶體結構),按時間劃分:2019年前的數(shù)據(jù)用于訓練和驗證,2019年的數(shù)據(jù)用于測試。額外構建了Major Drug Targets (MDT)測試集(599對),聚焦激酶、GPCR等主要藥物靶點,要求AlphaFold預測結構與晶體結構的pocket RMSD>2?,確保測試難度。訓練中通過AlphaFold預測結構與晶體結構插值生成蛋白部分的樣本。

3.模型DynamicBind是一個基于圖神經(jīng)網(wǎng)絡的等變生成模型,使用粗?;硎荆ǖ鞍滓?/span>節(jié)點和側鏈二面角表示,配體以重原子節(jié)點表示),輸出包括蛋白和配體的平移、旋轉、扭轉角更新,以及結合親和力和cLDDT置信度評分。模型通過學習從apoholo“morph-like”變換,優(yōu)化能量景觀,包含63.67百萬參數(shù)。

4.訓練細節(jié):訓練在8Nvidia A100 80GB GPU上進行5天,輸入為添加morph變換的蛋白decoy構象和加高斯噪聲的配體構象,目標是去噪操作。損失函數(shù)包括八項(配體和蛋白的平移、旋轉、扭轉等),通過Kabsch算法對齊apoholo結構,結合擴散噪聲調整構象過渡。推理時迭代20次更新初始結構。

通過培訓可以掌握的內容:

1.蛋白質配體復合物結構預測:學員將學習如何利用深度學習方法(如NeuralPLexer)從蛋白序列和配體分子圖預測復合物的三維結構,理解多尺度幾何建模和擴散過程在捕捉原子級分辨率結構及構象變化中的作用,并掌握其在盲對接和柔性結合位點恢復中的應用。

2.對接姿勢生成與優(yōu)化:掌握基于Graph-Transformer架構和蒙特卡洛采樣生成對接姿勢的技術,學習如何通過姿勢評分和對比學習(如偽Huber損失)優(yōu)化姿勢選擇,提升對接準確性(如RMSD<2?的成功率)。

3.親和力預測的計算方法:學員將了解如何從對接姿勢預測實驗親和力值(如IC50、Kd、KI),掌握基于虛擬節(jié)點和對比學習的姿勢敏感性訓練策略,以提高親和力預測的魯棒性和實際應用價值。

4.模型評估與基準測試:熟悉常用基準數(shù)據(jù)集(如PDBBind)和評價指標(如RMSD、lDDT-BS、TM-score)的使用,理解如何通過時間分割測試集和物理合理性檢查評估模型的泛化能力和性能。

5.實際藥物設計的應用:通過案例分析(如Interformer篩選出高親和力小分子),學習如何將這些預測技術應用于酶工程和藥物發(fā)現(xiàn),加速候選分子的篩選和優(yōu)化過程。

05機器學習代謝組學

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第一天

A1 代謝物及代謝組學的發(fā)展與應用

(1) ?代謝與生理過程;

(2) ?代謝與疾病;

(3) ?非靶向與靶向代謝組學;

(4) ?空間代謝組學與質譜成像(MSI);

(5) ?代謝組學與藥物和生物標志物;

(6) ?代謝流與機制研究。A2 代謝通路及代謝數(shù)據(jù)庫

(1) ?幾種經(jīng)典代謝通路簡介;

(2) ?三大常見代謝物庫:HMDB 、METLIN 和 KEGG;

(3) 代謝組學原始數(shù)據(jù)庫:Metabolomics Workbench 和 Metabolights. A3 參考資料推薦

A4 代謝組學實驗流程簡介

A5 色譜 、質譜硬件與原理解析

(1) ?色譜分析原理與構造;

(2) ?色譜儀和色譜柱的選擇;

(3) ?色譜的流動相:梯度洗脫法;

(4) ?離子源、質量分析器與質量檢測器解析;

(5) ?質譜分析原理及動畫演示;

(6) ?色譜質譜聯(lián)用技術(LC-MS);

第二天

B1 代謝物樣本處理與抽提

(1) 各種組織、血液和體液等樣本的提取流程與注意事項;

(2) 代謝物抽提流程與注意事項;

(3) 樣本及代謝物的運輸與保存問題;

B2 LC-MS 數(shù)據(jù)質控與搜庫

(1) LC-MS 實驗過程中 QC 和 Blank 樣本的設置方法;

(2) LC-MS 上機過程的數(shù)據(jù)質控監(jiān)測和分析;

(3) 代謝組學上游分析原理——基于 Compound Discoverer 與 Xcms 軟件;

(4) Xcms 軟件數(shù)據(jù)轉換、提峰、峰對齊與搜庫;

B3 R 軟件基礎

(1) R 和 Rstudio 的安裝;

(2) Rstudio 的界面配置;

(3) R 中的基礎運算和統(tǒng)計計算;

(4) R 中的包:包,函數(shù)與參數(shù)的使用;

(5) R 語言語法,數(shù)據(jù)類型與數(shù)據(jù)結構;

(6) R 基礎畫圖;

B4 ggplot2

(1) ggplot2 簡介

(2) ggplot2 的畫圖哲學;

(3) ggplot2 的配色系統(tǒng);

(4) ggplot2 數(shù)據(jù)挖掘與作圖實戰(zhàn);

第三天

機器學習

C1 有監(jiān)督式機器學習在代謝組學數(shù)據(jù)處理中的應用

(1) 人工智能、機器學習、深度學習的關系;

(2) 回歸算法:從線性回歸、Logistic 回歸與 Cox 回歸講起;

(3) PLS-DA 算法:PCA 降維后沒有差異的數(shù)據(jù)還有救嗎?

(4) VIP score 的意義及選擇;

(5) 分類算法:決策樹,隨機森林和貝葉斯網(wǎng)絡模型;

C2 一組代謝組學數(shù)據(jù)的分類算法實現(xiàn)的 R 演練

(1) 數(shù)據(jù)解讀;

(2) 演練與操作;

C3 無監(jiān)督式機器學習在代謝組學數(shù)據(jù)處理中的應用

(1) 大數(shù)據(jù)處理中的降維;

(2) PCA 分析作圖;

(3) 三種常見的聚類分析:K-means、層次分析與 SOM

(4) 熱圖和 hcluster 圖的 R 語言實現(xiàn);

C4 一組代謝組學數(shù)據(jù)的降維與聚類分析的 R 演練

(1) 數(shù)據(jù)解析;

(2) 演練與操作;

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第四天

D1 在線代謝組分析網(wǎng)頁 Metaboanalyst 操作

(1) 用 R 將數(shù)據(jù)清洗成網(wǎng)頁需要的格式;

(2) 獨立組、配對組和多組的數(shù)據(jù)格式問題;

(3) Metaboanalyst 中的上游分析(原始數(shù)據(jù)峰提取、峰對齊與搜庫)

(4) Metaboanalyst 的 pipeline 以及參數(shù)設置和注意事項;

(5) Metaboanalyst 的結果查看和導出;

(6) Metaboanalyst 的數(shù)據(jù)編輯;

(7) 全流程演練與操作。

D2 代謝組學數(shù)據(jù)清洗與 R 語言進階

(1) 代謝組學中的 t、fold-change 和響應值;

(2) 數(shù)據(jù)清洗流程;

(3) R 語言 tidyverse;

(4) 數(shù)據(jù)預處理:數(shù)據(jù)過濾與數(shù)據(jù)標準化(樣本的 Normalization 和代謝物的 Scaling);

(5) 代謝組學數(shù)據(jù)清洗演練;

第五天

E1 文獻數(shù)據(jù)分析部分復現(xiàn)(1 篇)

(1) 文獻深度解讀;

(2) 實操:從原始數(shù)據(jù)下載到圖片復現(xiàn);

(3) 學員實操。

E2 機器學習與代謝組學頂刊解讀(3 篇);

(1) Signal Transduction and Targeted Therapy 一篇有關饑餓對不同腦區(qū)代謝組學影響變

化的小鼠腦組織代謝圖譜類的文獻;(數(shù)據(jù)庫型)

(2) Cell 一篇代謝組學孕婦全程血液代謝組學分析得出對孕周和孕產期預測的代謝標志物

的文獻;(生物標志物型)

(3) Nature 一篇對胰腺癌患者腸道菌群的代謝組學分析找到可以提高化療效果的代謝物的

文獻。(機制研究型)

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

06深度學習基因組學

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第一天

理論部分

深度學習算法介紹

1.有監(jiān)督學習的神經(jīng)網(wǎng)絡算法

1.1 全連接深度神經(jīng)網(wǎng)絡 DNN 在基因組學中的應用舉例

1.2 卷積神經(jīng)網(wǎng)絡 CNN 在基因組學中的應用舉例

1.3 循環(huán)神經(jīng)網(wǎng)絡 RNN 在基因組學中的應用舉例

1.4 圖卷積神經(jīng)網(wǎng)絡 GCN 在基因組學中的應用舉例

2.無監(jiān)督的神經(jīng)網(wǎng)絡算法

2.1 自動編碼器 AE 在基因組學中的應用舉例

2.2 生成對抗網(wǎng)絡 GAN 在基因組學中的應用舉例

基因組常用深度學習框架

1. 介紹深度學習工具包 tensorflow, keras,pytorch

2. 在工具包中識別深度學習模型要素

2.1.數(shù)據(jù)表示

2.2.張量運算

2.3.神經(jīng)網(wǎng)絡中的“層”

2.4.由層構成的模型

2.5.損失函數(shù)與優(yōu)化器

2.6.數(shù)據(jù)集分割

2.7.過擬合與欠擬合

基因組學基礎

1. 基因組數(shù)據(jù)庫

2. 表觀基因組

3. 轉錄基因組

4. 蛋白質組

5. 功能基因組

實操內容

1.Linux 操作系統(tǒng)

1.1 常用的 Linux 命令

1.2 Vim 編輯器

1.3 基因組數(shù)據(jù)文件管理, 修改文件權限

1.4 查看探索基因組區(qū)域

2.Python 語言基礎

2.1.Python 包安裝和環(huán)境搭建

2.2.常見的數(shù)據(jù)結構和數(shù)據(jù)類型

3.?安裝深度學習工具包 tensorflow, keras,pytorch,在工具包中識別深度學

習模型要素

第二天

理論部分

1. 介紹 keras_dna 平臺,搭建基因組學常用深度學習應用案例2. 深度學習模型 DeepG4 從 Chip-Seq 及 DnaseSeq 中識別基序特征 G4

實操內容

1.基因組數(shù)據(jù)處理搭建深度學習模型

1.1 安裝并使用 keras_dna 處理各種基因序列數(shù)據(jù)如 BED、 GFF、GTF、BIGWIG、

BEDGRAPH、WIG 等

1.2 使用 keras_dna 設計深度學習模型

1.3 使用 keras_dna 分割訓練集、測試集

1.4 使用 keras_dna 選取特定染色體的基因序列等

2.使用 keras_dna 平臺復現(xiàn) DeepG4 模型,從 Chip-Seq 中識別 G4 特征

第三天

理論部分

深度學習在基因調控預測中的應用

1. selene_sdk 預測 DNA 甲基化及轉錄調控因子等 DeepSEA

2. 循環(huán)神經(jīng)網(wǎng)絡 RNN 從 RNA 序列中預測 pre-miRNA,dnnMiRPre

實操內容

復現(xiàn)卷積神經(jīng)網(wǎng)絡 CNN 識別基序特征 DeepG4、基因調控因子 DeepSEA,

1. 安裝 selene_sdk,復現(xiàn) DeepSEA 預測 DNA 甲基化,非編碼基因變異等基因調

控因子

2. 復現(xiàn)循環(huán)神經(jīng)網(wǎng)絡 RNN 工具 dnnMiRPre,從 RNA-Seq 中預測 pre-miRNA

第四天

理論部分

深度學習在預測疾病表型及生物標志物上的應用

1. 從高維基因表達數(shù)據(jù)中識別乳腺癌分型的自動編碼機深度學習工具

DeepType

2. 深度學習在識別拷貝數(shù)變異 DeepCNV 模型

實操內容

1. 復現(xiàn) DeepType,從 METABRIC 乳腺癌數(shù)據(jù)中區(qū)分乳腺癌亞型

2. 解析 DeepType 中新的乳腺癌亞型的標志基因

3. 復現(xiàn) DeepCNV 利用 SNP 微陣列聯(lián)合圖像分析識別拷貝數(shù)變異

第五天

理論部分

深度學習在預測藥物反應機制上的應用

1. 聯(lián)合腫瘤基因標記及藥物分子結構預測藥物反應機制的深度學習工具 SWnet

實操內容

1. 預處理藥物分子結構信息

2. 計算藥物相似性

3. 在不同數(shù)據(jù)集上構建 self-attention SWnet

4. 評估 self-attention SWnet

5. 構建多任務的 SWnet

6. 構建單層 SWnet

7. 構建帶權值層的 SWnet

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

07機器學習生物醫(yī)學

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
第一天
機器學習及生物醫(yī)學中應用簡介

機器學習基本概念介紹

常用機器學習模型介紹(GLM,RF,SVM)
主成分分析(PCA)
一致性聚類分析
ROC曲線和時間依賴的ROC曲線
生存分析基本概念介紹(生存曲線)
預后模型介紹(單因素,多因素cox回歸,lasso回歸)
午休
R語言簡介
R語言概述
R軟件及R包安裝
R語言語法及數(shù)據(jù)類型
條件語句
循環(huán)
函數(shù)
常用的機器學習相關的R包介紹

第二天

機器學習在生物醫(yī)學中的應用案例分享

利用機器學習方法篩選疾病相關的生物標志物
機器學習+生存分析預測樣本類型
機器學習+生存分析預測患者預后
機器學習+蛋白組學+代謝組學分析
機器學習+單細胞數(shù)據(jù)分析
午休
常用生物醫(yī)學公共數(shù)據(jù)庫介紹
TCGA數(shù)據(jù)庫介紹
TCGA數(shù)據(jù)庫下載RNAseq,miRNA-seq數(shù)據(jù)
TCGA臨床數(shù)據(jù)下載
合并TCGA表達譜數(shù)據(jù)
GEO數(shù)據(jù)庫介紹
GEO數(shù)據(jù)庫檢索
GEO數(shù)據(jù)下載
單細胞數(shù)據(jù)庫介紹

第三天

機器學習應用于TCGA轉錄組數(shù)據(jù),構建預后模型

差異表達分析
主成分分析(PCA)
火山圖,熱圖繪制
GO和KEGG富集分析,柱形圖,氣泡圖繪制
生存分析,生存曲線繪制
一致性聚類分析(ConsensusClusterPlus)
訓練集,測試集拆分
午休
單因素,多因素cox分析
Lasso回歸分析
風險評估模型構建
riskscore計算
Nomogram模型構建
時間依賴ROC曲線(Time-dependent ROC)
矯正曲線,決策曲線繪制

第四天

機器學習應用于GEO表達譜數(shù)據(jù),構建分類模型

差異表達分析
主成分分析(PCA)
構建預測模型(SVM,RF,GLM)
特征篩選及重要性評估
模型評估(ROC曲線繪制)
午休
構建nomogram模型
Nomogram模型評估
矯正曲線繪制
決策曲線繪制
一致性聚類分析
GSEA分析

第五天

機器學習應用于代謝組學+蛋白組學數(shù)據(jù),復現(xiàn)cell文章

代謝組學+蛋白組學數(shù)據(jù)處理,差異表達分析
火山圖,分組熱圖,多組箱型圖展示差異表達分析結果
構建Random Forest模型
重要代謝物+蛋白篩選
繪制ROC曲線
獨立測試集檢測模型表現(xiàn)
午休
機器學習應用于單細胞數(shù)據(jù)分析
數(shù)據(jù)質控及歸一化
線性降維和非線性降維(PCA, tSNE, UMAP)
聚類分析(cluster)
鑒定細胞marker基因
細胞亞群注釋(手動和機器學習自動注釋)

部分模型案例圖片

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

08CRISPR-Cas9基因編輯技術

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第一天

緒論

1.課程簡介與學習目標

2.基因編輯技術概述

2.1 基因編輯的定義、核心原理與技術分類

2.2 基因編輯與合成生物學的交叉

3.技術應用領域全景圖

3.1基礎研究

3.2農業(yè)育種

3.3疾病治療

3.4生物制造

4.倫理與安全問題初探

4.1 脫靶效應與基因驅動

4.2 人類胚胎編輯的倫理邊界

第二天

基因編輯技術發(fā)展簡史

1.1 ZFN

1.2 TALENs

1.3 局限性CRISPR技術的革命性突破

2.1 原核生物免疫機制的發(fā)現(xiàn)歷程

2.2 Cas9系統(tǒng)在真核細胞的應用驗證

2.3里程碑事件與諾貝爾獎解讀

2.4中國科學家在基因編輯領域的突出貢獻

第三天

CRISPR常用工具與實操

CRISPR-Cas系統(tǒng)

1.1 CRISPR系統(tǒng)的起源與機制

1.2 主要工具酶的特征與選擇(實操)

1.3 sgRNA的設計與優(yōu)化(實操)

1.4 CRISPR 篩選(CRISPR Screnning)

1.5 CRISPR-Cas系統(tǒng)在模式生物中的應用

1.6 CRISPR-Cas系統(tǒng)與CAR-T細胞治療

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

堿基編輯器(Base Editing)

2.1 腺嘌呤堿基編輯器(ABE)

2.2 脫氨酶的活性優(yōu)化及對脫靶效應的控制

2.3 胞嘧啶堿基編輯器(CBE)

2.4 C-to-T編輯的特異性與效率平衡

2.5 利用堿基編輯器構建動物模型

2.6 單核苷酸突變矯正

先導編輯(Prime Editing)

3.1 逆轉錄酶的特點與選擇

3.2 pegRNA的設計與優(yōu)化(實操)

3.3 雙pegRNA編輯系統(tǒng)

3.4 PM359治療慢性肉芽腫病

CRISPR激活與抑制系統(tǒng)(CRISPRa/i)

4.1 dCas9

4.2 dCas9與轉錄激活因子、轉錄抑制因子的融合

4.3 CRISPRa在干細胞重編程中的應用

4.4 CRISPRa/i研究癌癥相關基因的功能網(wǎng)絡

其他基因編輯工具

5.1 大片段DNA精準操縱工具

5.2 Cre-loxP系統(tǒng)在模式動物中的應用

第四天

遞送系統(tǒng)

CRISPR遞送系統(tǒng)概述

1.1 CRISPR技術的基本原理和發(fā)展歷程

1.2 CRISPR遞送系統(tǒng)的重要性和挑戰(zhàn)

病毒載體遞送系統(tǒng)

2.1 病毒載體的類型和特點(如腺相關病毒AAV)

2.3病毒載體的構建和優(yōu)化

2.3 病毒載體在CRISPR遞送中的應用和案例分析

非病毒遞送系統(tǒng)

3.1 納米顆粒(如脂質納米顆粒LNP)的設計與應用

3.2 電穿孔技術的原理和應用

3.3 非病毒遞送系統(tǒng)的優(yōu)缺點分析

植物病毒遞送系統(tǒng)

4.1 植物-彈狀病毒在CRISPR遞送中的應用

4.2 植物病毒遞送系統(tǒng)的優(yōu)化和挑戰(zhàn)

第五天

CRISPR應用

CRISPR在基礎研究中的應用

1.1 CRISPR在基因功能研究中的應用

1.2 CRISPR在疾病模型創(chuàng)建中的應用

1.3 CRISPR在基因調控研究中的應用

CRISPR在遺傳病治療中的應用

2.1 遺傳病數(shù)據(jù)庫的建立和應用

2.2 CRISPR治療遺傳病的案例分析

2.3FDA批準的CRISPR療法介紹(鐮狀細胞貧血、杜氏肌肉營養(yǎng)不良、癌癥的免疫療法)

小結與展望

基本內容小結+當前技術瓶頸分析

1.1 遞送效率與組織靶向性難題

1.2復雜性狀的多基因協(xié)同編輯

新興技術發(fā)展方向

2.1 DNA 聚合酶編輯器

2.2 CRISPR 引導的重組酶和轉座子

2.3 表觀基因組編輯

2.4 RNA編輯

2.5 AI與基因編輯

新型CRISPR工具

臨床轉化路線圖

3.1 體內編輯與體外編輯的產業(yè)化路徑

3.2 基因編輯療法監(jiān)管體系的國際比較

基因編輯的道德考量和安全性

09AI智慧醫(yī)療影像技術

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第一天

智慧醫(yī)療中的圖像處理與分析概論

1、闡述智慧醫(yī)療定義,回溯其發(fā)展歷程,剖析當下智慧醫(yī)療多元應用場景,如遠程診斷、智能輔助決策等,展望未來在精準醫(yī)療、個性化治療方面的潛力。

2、深入講解醫(yī)療圖像在智慧醫(yī)療體系里的重要性,從輔助診斷、治療規(guī)劃到療效評估全流程解析,明確課程知識、技能雙目標,梳理學習計劃,強調結合實際案例的實踐導向。

醫(yī)療圖像的基本類型和獲取方法

1、詳細科普醫(yī)療圖像主要類型,簡要介紹X射線成像原理、CT斷層掃描機制、MRI磁共振成像特色、超聲成像的聲波利用,每種類型搭配實際應用場景,如X射線在骨折檢測,MRI在腦部病變診斷的應用。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第二天

圖像處理和分析的基本技術和算法

1、實操演示圖像預處理技術,展示去噪算法應用、增強視覺效果手段、對比度調整技巧的實際效果,如使用OpenCV進行高斯模糊去噪、中值濾波去除椒鹽噪聲,直方圖均衡化增強對比度,每種方法結合具體醫(yī)學圖像案例,如去除X光圖像中的噪聲,增強CT圖像的對比度,展示實際的OpenCV代碼示例。

2、簡要講解邊緣檢測原理,對比常用邊緣檢測算子如Sobel、Canny算子的效果,解讀形態(tài)學操作如腐蝕、膨脹在圖像處理中的功效,展示如何用OpenCV實現(xiàn)這些操作。

3、拆解圖像分割技術,簡要介紹閾值分割法、區(qū)域分割策略、邊緣分割原理,結合醫(yī)學圖像案例,如用閾值分割法分離MRI圖像中的腦組織,用區(qū)域生長算法標記腫瘤區(qū)域,用邊緣分割勾勒器官輪廓,展示如何用Python和OpenCV實現(xiàn)這些分割方法,提供相關的代碼示例和實際的圖像處理結果。

深度學習在醫(yī)療圖像分析中的應用

1、從基礎概念入手,介紹深度學習框架,簡要講解CNN卷積神經(jīng)網(wǎng)絡架構,說明卷積層、池化層、全連接層的作用,結合醫(yī)學圖像識別中的應用案例,講解如何用深度學習模型實現(xiàn)圖像分類、目標檢測和分割。

2、結合實際案例,剖析深度學習在圖像分類、目標檢測、分割中的應用流程,實操演示常用深度學習模型YOLOv5在醫(yī)療圖像里的調用與優(yōu)化,提供實際的模型定義和訓練代碼示例,如用YOLOv5檢測X光圖像中的肺結節(jié),展示如何配置模型參數(shù)、加載預訓練模型、訓練和優(yōu)化模型,實現(xiàn)醫(yī)學圖像的目標檢測任務。

第三天

Transformer 技術在醫(yī)療圖像分析中的應用

1、講解Transformer基本原理,簡要介紹架構里自注意力機制運作邏輯,說明自注意力機制如何捕捉圖像中不同區(qū)域之間的長距離依賴關系,提升模型對上下文的理解。

2、分享Transformer在醫(yī)療圖像分析中的前沿應用案例,如基于Transformer的模型在醫(yī)學圖像分割、分類和目標檢測中的應用,講解如何利用Transformer架構的全局特征提取能力提升診斷準確性,以腦腫瘤分割為例,演示Transformer如何更準確地識別腫瘤邊界。

3、指導學員動手實踐,使用Transformer模型進行醫(yī)療圖像分析任務,提供相關的代碼示例和開源項目鏈接,如用Vision Transformer(ViT)實現(xiàn)醫(yī)學圖像分類,展示如何將醫(yī)學圖像分割成patches并輸入到Transformer中,實現(xiàn)端到端的分類任務。

多模態(tài)數(shù)據(jù)融合在醫(yī)療圖像分析中的應用

1、闡述多模態(tài)數(shù)據(jù)概念,列舉常見類型,如影像、文本報告、生理數(shù)據(jù)融合,講解多模態(tài)數(shù)據(jù)在醫(yī)學診斷中的互補優(yōu)勢,如影像數(shù)據(jù)提供組織結構信息,文本報告包含癥狀和病史,生理數(shù)據(jù)反映身體機能狀態(tài)。

2、介紹多模態(tài)數(shù)據(jù)融合方法,如特征級融合、決策級融合技術,結合實際案例,如融合CT圖像和臨床指標對疾病分期,演示如何用Python實現(xiàn)特征級融合,將不同模態(tài)的數(shù)據(jù)拼接成多維特征向量,輸入到機器學習模型中進行分類或回歸任務。

3、分析多模態(tài)融合在提升醫(yī)療圖像分析準確性上的作用,展示實際的多模態(tài)數(shù)據(jù)融合代碼示例,如用Keras或PyTorch實現(xiàn)多個神經(jīng)網(wǎng)絡分支分別處理不同模態(tài)的數(shù)據(jù),最后在決策層進行融合。

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO

第四天

醫(yī)療圖像分析在疾病診斷和治療中的實際案例

1、以肺結節(jié)篩查診斷為切入點,展示圖像分析輔助醫(yī)生精準定位、良惡性判斷流程,通過超聲、CT、MRI 等檢查手段對病情進行綜合評估和診斷,提供實際的肺結節(jié)檢測代碼示例和數(shù)據(jù)集,講解如何用深度學習模型在胸部CT圖像中自動檢測肺結節(jié),并根據(jù)結節(jié)特征判斷良惡性。

2、延伸至腫瘤識別與分割,講解如何利用圖像處理技術勾勒腫瘤邊界,探討心血管疾病診斷評估,通過血管影像分析病情,展示實際的心血管疾病診斷代碼示例和數(shù)據(jù)集,如用U-Net模型分割腦部MRI圖像中的腫瘤區(qū)域,用血管成像技術分析冠狀動脈狹窄程度。

圖像處理工具與實踐與深度學習模型的訓練

1、介紹常用圖像處理工具OpenCV、MATLAB 功能模塊,實操演示圖像處理算法實現(xiàn)與優(yōu)化技巧,提供實際的圖像處理代碼示例和優(yōu)化方法,如用OpenCV實現(xiàn)醫(yī)學圖像的量化、特征分析等功能,用MATLAB進行快速傅里葉變換和小波變換。

2、指導學員使用OpenCV完成圖像預處理和分析任務,上手深度學習框架訓練醫(yī)療圖像分類模型,掌握模型調參方法,提供實際的模型訓練代碼示例和調參技巧,如在ResNet模型的基礎上進行微調,優(yōu)化學習率、批量大小、正則化參數(shù)等。

第五天

醫(yī)療圖像分析項目設計與實施

1、引導學員進行項目需求分析,規(guī)劃項目整體架構,涵蓋數(shù)據(jù)收集、處理、模型選擇到結果評估全流程,強調項目的臨床實用性和快速部署,鼓勵學員結合實際工作中的問題設計項目主題。

2、提供結構化的課程學習計劃,圍繞主題進行拓展學習和實踐,推薦相關書籍、學術論文、在線課程和實操項目資源,輔助學習者深化理解課程知識,提升專業(yè)技能。

10多模態(tài)醫(yī)療AI大模型

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
第一天:醫(yī)學AI與大語言模型基礎
課程目標:讓學員了解大語言模型和醫(yī)療AI的基礎,掌握相關技術的核心概念。
·第1講:醫(yī)學AI的大腦——理解大語言模型的核心技術
o大語言模型的誕生和發(fā)展
o醫(yī)學信息化現(xiàn)狀與痛點分析
o醫(yī)療大模型的誕生和發(fā)展(Med-PaLM ; MedGamma等)?
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
·第2講:自然語言處理NLP基礎
o自然語言處理NLP基本概念和發(fā)展歷程
oRNN,LSTM等基礎深度學習模型介紹
oHuggingface使用
第二天:大模型的微調技術和RAG技術
課程目標:讓學員理解和學習使用微調技術和RAG技術用于醫(yī)學領域。
·第3講:大語言模型LLM基礎
oTransformer之前的時代:大語言模型LLM的發(fā)展
o解構Transformer架構
o解構Mamba架構
·第4講:微調技術與RAG技術
o微調技術(LoRA、QLoRA)
oRAG技術
oOllama介紹
o例子:如何構建一個基于ollama構造自己的第一個語言模型
第三天:多模態(tài)學習與跨模態(tài)應用
課程目標:深入了解多模態(tài)AI的核心技術,掌握跨模態(tài)數(shù)據(jù)融合與實際應用。?
·第5講:多模態(tài)融合核心技術
o多模態(tài)概念
o多模態(tài)核心基礎(表示,融合,對齊,轉換和協(xié)同學習)
o多模態(tài)經(jīng)典模型和核心技術(CLIP和對比學習)
o示例:Google DeepMind開源的MedGamma多模態(tài)醫(yī)學大模型實踐
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
?第四天:智能導診與臨床工作流
課程目標:了解AI在臨床決策支持和工作流中的應用,重點介紹智能導診與自動化文檔生成。?
全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO
第7講:AI賦能的臨床工作流——從自動化文檔到藥物研發(fā)
o自動化文檔與報告生成
o前沿領域:藥物研發(fā)與手術機器人
o案例分析:如何通過AI提高診斷效率,減輕醫(yī)生行政負擔
第五天:倫理、安全、未來展望
課程目標:討論醫(yī)學AI的倫理、安全性、私問題,并展望未來的發(fā)展趨勢。
第8講:數(shù)字時代的希波克拉底誓言——倫理、隱私、安全與法規(guī)
o醫(yī)學數(shù)據(jù)的安全性
o醫(yī)學AI監(jiān)管框架
o商業(yè)化路徑分析(藥企/醫(yī)院)
第9講:創(chuàng)新應用場景
o可穿戴設備
oLLM健康預警(阿里CT檢測胃癌)
o中醫(yī)智能體質辨識研討:抗癌藥物新靶點發(fā)現(xiàn)
第10講:人機協(xié)同的未來——構建值得信賴的臨床AI伙伴
o總結課程核心內容
o探討精準醫(yī)療的發(fā)展趨勢
oAI最終目標是增強醫(yī)生能力、減輕認知負荷、與醫(yī)生無縫協(xié)作

授課時間

1AI蛋白質設計

2025.09.18晚上授課(19:00-22:00)
2025.09.19晚上授課(19:00-22:00)
2025.09.20全天(9點-11點半-1點半-5點)
2025.09.21全天(9點-11點半-1點半-5點)
2025.09.23晚上授課(19:00-22:00)
2025.09.24晚上授課(19:00-22:00)
2025.09.25晚上授課(19:00-22:00)
2025.09.26晚上授課(19:00-22:00)
騰訊會議直播上課課后提供直播回放

2合成生物與基因電路設計

2025.09.27全天(9點-11點半-1點半-5點)
2025.09.28晚上授課(19:00-22:00)
2025.09.29晚上授課(19:00-22:00)
2025.10.10晚上授課(19:00-22:00)
2025.10.12全天(9點-11點半-1點半-5點)
2025.10.13晚上授課(19:00-22:00)
2025.10.14晚上授課(19:00-22:00)
2025.10.15晚上授課(19:00-22:00)
騰訊會議直播上課課后提供直播回放

3CADD計算機輔助藥物設計

2025.09.27全天(9點-11點半-1點半-5點)
2025.09.28晚上授課(19:00-22:00)
2025.09.29晚上授課(19:00-22:00)
2025.10.12全天(9點-11點半-1點半-5點)
2025.10.13晚上授課(19:00-22:00)
2025.10.14晚上授課(19:00-22:00)
2025.10.15晚上授課(19:00-22:00)
2025.10.16晚上授課(19:00-22:00)
2025.10.18全天(9點-11點半-1點半-5點)
2025.10.19全天(9點-11點半-1點半-5點)
騰訊會議直播上課課后提供直播回放

4AIDD人工智能藥物發(fā)現(xiàn)與設計

2025.09.18晚上授課(19:00-22:00)

2025.09.19晚上授課(19:00-22:00)

2025.09.20全天(9點-11點半-1點半-5點)

2025.09.21全天(9點-11點半-1點半-5點)

2025.09.23晚上授課(19:00-22:00)

2025.09.24晚上授課(19:00-22:00)

2025.09.25晚上授課(19:00-22:00)

2025.09.26晚上授課(19:00-22:00)

騰訊會議直播上課課后提供直播回放

5機器學習代謝組學

2025.10.10晚上授課(19:00-22:00)
2025.10.11晚上授課(19:00-22:00)
2025.10.12全天(9點-11點半-1點半-5點)
2025.10.14晚上授課(19:00-22:00)
2025.10.15晚上授課(19:00-22:00)
2025.10.16晚上授課(19:00-22:00)
2025.10.17晚上授課(19:00-22:00)
2025.10.18全天(9點-11點半-1點半-5點)
騰訊會議直播上課課后提供直播回放

6深度學習基因組學

2025.10.12全天(9點-11點半-1點半-5點)
2025.10.18全天(9點-11點半-1點半-5點)
2025.10.19全天(9點-11點半-1點半-5點)
2025.10.25全天(9點-11點半-1點半-5點)
2025.10.26全天(9點-11點半-1點半-5點)
騰訊會議直播上課課后提供直播回放

7機器學習生物醫(yī)學

2025.08.24全天(9點-11點半-1點半-5點)
2025.08.25晚上授課(19:00—22:00)
2025.08.26晚上授課(19:00—22:00)
2025.08.27晚上授課(19:00—22:00)
2025.08.28晚上授課(19:00—22:00)
2025.08.30全天(9點-11點半-1點半-5點)
騰訊會議直播上課課后提供直播回放

8CRISPR-Cas9基因編輯技術

2025.10.16晚上授課(19:00-22:00)
2025.10.17晚上授課(19:00-22:00)
2025.10.18全天(9點-11點半-1點半-5點)
2025.10.19全天(9點-11點半-1點半-5點)
2025.10.20晚上授課(19:00-22:00)
2025.10.21晚上授課(19:00-22:00)
2025.10.22晚上授課(19:00-22:00)
2025.10.23晚上授課(19:00-22:00)
騰訊會議直播上課課后提供直播回放

9AI智慧醫(yī)療影像技術

2025.08.12?全天 (9點-12點-下午2-5點)
2025.08.13?全天 (9點-12點-下午2-5點)
2025.08.14?全天 (9點-12點-下午2-5點)
2025.08.15?全天 (9點-12點-下午2-5點)
2025.08.16全天 (9點-12點-下午2-5點)
騰訊會議直播上課課后提供直播回放

10多模態(tài)醫(yī)學AI大模型

2025.08.20晚上授課:(晚19:00-晚22:00)
2025.08.21晚上授課(晚19:00-晚22:00)
2025.08.22晚上授課(晚19:00-晚22:00)
2025.08.23全天(9點-12點-下午2點-5點)
2025.08.24全天(9點-12點-下午2點-5點)
2025.08.25晚上授課(晚19:00-晚22:00)
2025.08.26晚上授課(晚19:00-晚22:00)
2025.08.27晚上授課(晚19:00-晚22:00)
2025.08.28晚上授課(晚19:00-晚22:00)
騰訊會議直播上課課后提供直播回放

報名費用及福利

AI蛋白質設計

公費價:每人每班¥6380 元 ??

自費價:每人每班¥5880元

CADD計算機輔助藥物設計

AIDD人工智能藥物發(fā)現(xiàn)

機器學習代謝組學

深度學習在基因組學中的應用

合成生物與基因電路設計

CRISPR-Cas9基因編輯技術

公費價:每人每班¥5880

自費價:每人每班¥5480

AI智慧醫(yī)療影像技術

機器學習生物醫(yī)學

多模態(tài)AI醫(yī)療大模型

公費價:每人每班¥4680

自費價:每人每班¥4380

優(yōu)惠一

報二贈一:10880

(贈送課程任選)

優(yōu)惠二

報三贈一:13880

(贈送課程任選)

報四贈二:18880元

(贈送課程任選)

特惠三

全報:25880

兩年內可免費參加本公司舉辦的任何課程(不限次數(shù)及課程,包括之后的新開課)

限時福利:報名成功后轉發(fā)朋友圈或轉發(fā)50人以上群聊即可獲得300元現(xiàn)金紅包(只限前15名)

特惠福利:報名就送往期課程回放(包含全套課程回放和課件資料ppt)

報名費用可開具正規(guī)報銷發(fā)票及提供相關繳費證明、邀請函,可提前開具報銷發(fā)票、文件用于報銷 。報名繳費后即可獲得全套預習資料供大家課前準備

證書:參加培訓并通過考試的學員,可以申請獲得工業(yè)和信息化部工業(yè)文化發(fā)展中心頒發(fā)的“工業(yè)強國建設素質素養(yǎng)提升尚工行動”崗位能力適應評測證書。該證書可在中心官網(wǎng)查詢,可作為能力評價,考核和任職的重要依據(jù)。評測證書查詢網(wǎng)址:www.miit-icdc.org(自愿申請,須另行繳納考試費500元/人)

SIMPLICITY

官方聯(lián)系人

全球炸鍋!國內“天才少年”獨自發(fā)Nature,助力生物醫(yī)藥領域再攀高峰!-肽度TIMEDOO