北京時間2021年4月13日,結構生物學高精尖創(chuàng)新中心薛毅課題組在《核酸研究》Nucleic Acids Research)雜志在線發(fā)表了題為《環(huán)結構元件的特征性化學探測數據模式及其對RNA二級結構預測準確度的改善》Characteristic chemical probing patterns of loop motifs improve prediction accuracy of RNA secondary structures)的研究長文,報道了一個整合了特征性化學探測數據的RNA二級結構預測新方法。該方法在預測的準確度上高于傳統(tǒng)的偽自由能預測模型以及“采樣-選擇”模型。此外,該方法也可以幫助鑒定假結結構以及RNA二級結構的動態(tài)變化。
RNA分子通過錯綜復雜的堿基配對模式折疊成二級結構,這些二級結構是RNA行使催化、配體結合和支架等功能的基礎。準確地測定RNA的二級結構對于理解其生物學功能以及調控機制至關重要。近年來,化學小分子探針被廣泛應用于RNA二級結構的探測,其中,selective 2′-hydroxyl acylation analyzed by primer extension(SHAPE)技術利用親電試劑對不同狀態(tài)堿基(配對或未配對)的修飾活性的差異來實現(xiàn)對RNA二級結構的探測。在SHAPE數據的分析中,如何合理地將SHAPE數據整合進結構預測算法是一個關鍵的問題。常用的工具,如RNAstructure,通常將SHAPE值轉化成每個配對核苷酸各自的偽自由能約束,進而整合進熱力學預測模型中預測出最終的結構。這類整合方法雖然顯著地提升了RNA二級結構預測的準確度,但提升程度仍不能滿足研究者的需求,尤其是對長RNA的結構預測和對結構動態(tài)變化的捕捉。

鑒于使用各種不同偽自由能參數的預測方法在準確度上已經遇到了“瓶頸”,在本項研究中,薛毅課題組從新的角度出發(fā),建立起SHAPE數據特征和環(huán)結構元件信息之間的直接聯(lián)系。通過統(tǒng)計分析,他們發(fā)現(xiàn)對于同一類型(發(fā)卡環(huán)、內環(huán)和凸環(huán))和長度的環(huán)結構元件而言,其通常具有某種特征性的SHAPE模式,即在某些核苷酸位置之間存在保守的SHAPE值高低趨勢。通過對環(huán)元件的三級結構分析,他們發(fā)現(xiàn)特征性SHAPE模式可以反映出核苷酸對糖環(huán)構象的偏好性。為了利用這種特征性SHAPE模式來提升RNA二級結構預測的準確度,他們提出了SHAPELoop方法。該方法通過“評估-替換”的策略對傳統(tǒng)能量模型預測出的結構(稱為“指導結構”)進行改進,以達到SHAPELoop預測出的結構比指導結構更加符合特征性SHAPE模式的目的(圖1)。

結構生物學高精尖創(chuàng)新中心薛毅課題組利用SHAPE數據特征提高了RNA二級結構預測的準確度-肽度TIMEDOO
圖1. SHAPELoop方法框架
利用上述策略,SHAPELoop可以準確地識別出“指導結構”中被錯誤預測的環(huán)元件,并對其進行替換。SHAPELoop在預測的準確度上高于傳統(tǒng)的偽自由能預測模型(RNAstructure-Fold,RNAstructure-MaxExpect和RME)以及“采樣-選擇”模型(SeqFold)(圖2)。此外,SHAPELoop對不同的“指導結構”以及SHAPE數據中的噪聲也具有較好的魯棒性。
結構生物學高精尖創(chuàng)新中心薛毅課題組利用SHAPE數據特征提高了RNA二級結構預測的準確度-肽度TIMEDOO
圖2. A) SHAPELoop及其他五種預測方法在標準RNA測試集上的表現(xiàn);B) SHAPELoop使用不同“指導結構”的表現(xiàn);C) SHAPELoop對數據噪聲的魯棒性。
最后,薛毅課題組還展示了特征性SHAPE模式在幫助鑒定假結結構以及RNA二級結構動態(tài)變化方面的應用。例如圖3中展示的P5abc RNA,他們利用SHAPELoop方法定量地評估了P5c亞結構域的可能的環(huán)結構與特征性SHAPE模式之間的符合程度,并準確地預測出了不同折疊條件下該RNA的真實二級結構。
結構生物學高精尖創(chuàng)新中心薛毅課題組利用SHAPE數據特征提高了RNA二級結構預測的準確度-肽度TIMEDOO
圖3 A) P5abc在沒有Mg2+的折疊條件下的結構及SHAPELoop罰分;B) P5abc在有Mg2+的折疊條件下的結構及SHAPELoop罰分;C) U30C突變體結構及SHAPELoop罰分;D) G39A突變體結構及SHAPELoop罰分。
結構生物學高精尖創(chuàng)新中心薛毅研究員為本文通訊作者,薛毅課題組生命學院博士生曹靜怡為本文第一作者。本研究得到了北京市結構生物學高精尖創(chuàng)新中心和清華-北大生命科學聯(lián)合中心的經費支持。

原文鏈接

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab250/6225227

來源:結構生物學高精尖創(chuàng)新中心