韓國研究團隊開發(fā)出無需外部傳感器的超聲探頭追蹤技術,有望顯著提升3D醫(yī)學成像水平
超聲成像(Ultrasound, US)作為一種實時、無創(chuàng)的成像技術,廣泛應用于各類器官和組織的臨床診斷及醫(yī)療操作中。然而,傳統(tǒng)超聲僅能提供二維視角,對于需要三維結構信息的臨床決策仍存在局限。為解決這一難題,韓國釜山國立大學生物融合工程學院及人工智能研究中心的金敏宇(MinWoo Kim)副教授團隊,開發(fā)出一種全新的深度學習模型“MoGLo-Net”,可在無需外部追蹤傳感器的情況下,實現(xiàn)超聲探頭的精準運動追蹤,并重建高質量的三維圖像。該研究成果已于2025年6月13日發(fā)表于《IEEE Transactions on Medical Imaging》期刊。
在超聲與光聲成像(Photoacoustic, PA)結合而成的PAUS成像系統(tǒng)中,醫(yī)生通過手持探頭發(fā)射激光和超聲波,在體表滑動以獲取目標區(qū)域的圖像。雖然這一方法操作靈活,但每次只能捕捉一個小的二維切片,難以完整呈現(xiàn)器官或組織的三維結構。目前雖然存在一些3D探頭解決方案,但它們價格高昂、視野受限,不適合大范圍推廣。
為此,研究人員提出了一種“自由手持式三維重建”方案,通過將連續(xù)的二維圖像拼接生成三維視圖。但該方法對探頭的運動追蹤精度要求極高,傳統(tǒng)做法依賴外部傳感器(如光學或磁場定位系統(tǒng)),不僅成本高、體積大,而且常常測量不準確。
MoGLo-Net模型通過直接分析超聲圖像中的組織散斑(speckle)模式,自動推斷探頭的運動軌跡,從而徹底擺脫了對外部設備的依賴。該模型由兩個主要部分組成:基于ResNet架構的圖像編碼器和基于LSTM(長短時記憶網(wǎng)絡)的運動估計器。編碼器通過“相關操作”識別連續(xù)圖像之間的差異,能同時捕捉平面內與平面外的探頭位移;同時,研究團隊創(chuàng)新性地引入了“自注意力機制”,在全圖特征的基礎上加強局部區(qū)域的信息提取能力。隨后,LSTM模塊利用其時間記憶能力,進一步優(yōu)化整個運動估計過程。
此外,研究人員還設計了專用的損失函數(shù),顯著提升了模型的精度和穩(wěn)定性。在多個自建和公開數(shù)據(jù)集上的測試結果表明,MoGLo-Net在所有評估指標上均優(yōu)于現(xiàn)有先進方法,所重建出的三維圖像更接近真實解剖結構。
特別值得一提的是,研究團隊首次將該模型應用于超聲與光聲的融合成像中,成功實現(xiàn)血管三維成像,為血流監(jiān)測、腫瘤診斷等臨床場景提供了強有力的工具支持。
“MoGLo-Net技術不僅可以提供更清晰的三維內部視圖,還能輔助醫(yī)生做出更精準的診療決策,”金敏宇教授表示,“更重要的是,它取消了對笨重昂貴的外部傳感器的依賴,有望在基層醫(yī)院和資源有限的環(huán)境中推廣使用,真正實現(xiàn)超聲影像技術的普及和可及性?!?/p>
該成果標志著三維超聲成像邁入智能化、便攜化的新階段,為更精準、高效、低成本的醫(yī)療服務打開了新局面。
參考文獻:SiYeoul Lee et al, Enhancing Free-hand 3D Photoacoustic and Ultrasound Reconstruction using Deep Learning,?IEEE Transactions on Medical Imaging?(2025).?DOI: 10.1109/TMI.2025.3579454
編輯:王洪
排版:李麗


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉載。