
在傳統(tǒng)病理診斷中,一份乳腺癌組織樣本需要經(jīng)歷固定、包埋、切片、染色等十余道工序,從樣本送達(dá)到出具報告,往往需要數(shù)小時甚至更久。而在術(shù)中冰凍切片環(huán)節(jié),患者往往需要處于麻醉等待狀態(tài),這段時間的縮短對于手術(shù)安全至關(guān)重要。
近期發(fā)表于《Scientific Reports》的一項(xiàng)研究,嘗試用一種“無標(biāo)記、無染色”的技術(shù)路徑,并結(jié)合深度學(xué)習(xí)算法,為這一臨床痛點(diǎn)提供了新的解法。
我們熟悉的病理圖像通常是經(jīng)過H&E染色后呈現(xiàn)的藍(lán)紫色調(diào),細(xì)胞核與細(xì)胞質(zhì)邊界清晰。而顯微高光譜成像(MHSI)技術(shù),可以在不進(jìn)行任何染色的情況下,通過掃描組織切片獲取從可見光到近紅外(397-1032 nm)的128個波段的光譜信息。
這種“無染色”狀態(tài)帶來的直接挑戰(zhàn)是:圖像缺乏形態(tài)學(xué)對比度,人眼難以直接判讀。但高光譜數(shù)據(jù)的優(yōu)勢在于,它記錄了每個像素點(diǎn)的連續(xù)光譜曲線,不同的生化成分(如蛋白質(zhì)、脂質(zhì)、核酸)會在特定波長下呈現(xiàn)差異化的反射特征。如何從這種高維、弱形態(tài)的數(shù)據(jù)中提取出具有診斷價值的信息,成為計算病理學(xué)的新課題。

研究團(tuán)隊構(gòu)建了一個包含60名乳腺癌患者、468張組織切片的高光譜數(shù)據(jù)集。不同于傳統(tǒng)方法對局部視野進(jìn)行單點(diǎn)預(yù)測,研究者將病理診斷建模為一個多實(shí)例學(xué)習(xí)(MIL)問題:將一整張組織切片視為一個“包”,從切片上采集的20個不同區(qū)域的光譜立方體則是包中的“實(shí)例”,模型需要綜合所有實(shí)例的信息,輸出整個切片的診斷結(jié)果。
這種方式更貼近病理醫(yī)生的實(shí)際閱片邏輯——先在低倍鏡下全局瀏覽,再聚焦于可疑區(qū)域進(jìn)行綜合判斷。

針對高光譜數(shù)據(jù)的特點(diǎn),團(tuán)隊提出了多尺度層級注意力網(wǎng)絡(luò)(MS-HAN),其核心設(shè)計包含三個關(guān)鍵層次:

1. 多尺度特征提取借鑒了Inception結(jié)構(gòu),在同一空間分辨率下使用不同尺寸的卷積核并行提取特征,以捕捉從細(xì)微光譜差異到局部紋理模式的多粒度信息。
2. 雙注意力機(jī)制首先通過光譜通道注意力,顯式建模波段間的依賴關(guān)系,對信息量更豐富的波段賦予更高權(quán)重;再通過空間注意力生成二維熱力圖,在不依賴像素級標(biāo)注的情況下,定位出細(xì)胞形態(tài)學(xué)上具有診斷價值的區(qū)域。

3. 層級聚合與原型學(xué)習(xí)為了應(yīng)對生物光譜在同類別內(nèi)的高變異性,模型引入了一組可學(xué)習(xí)的“原型向量”,將實(shí)例特征軟分配到這些原型上,并通過約束原型使用分布的熵值來防止模式塌陷。最后,利用自注意力機(jī)制建模切片內(nèi)不同區(qū)域間的依賴關(guān)系,通過注意力池化得到整張切片的表征。
在僅使用切片級別標(biāo)簽的弱監(jiān)督訓(xùn)練下,該模型在獨(dú)立測試集(94張切片)上達(dá)到了86.7%的準(zhǔn)確率和0.92的AUC,相比TransMIL、CLAM等主流MIL基線模型顯示出統(tǒng)計顯著性提升。

這項(xiàng)研究的落腳點(diǎn)并非要替代病理醫(yī)生,而是探索一種“光學(xué)切片”加“AI初篩”的工作流程。省去染色步驟不僅意味著試劑耗材成本的降低,更重要的是 大幅壓縮了從取材到數(shù)字化診斷的時間窗口。對于術(shù)中冰凍等時間敏感場景,這種“即切即掃即分析”的模式有望縮短患者在麻醉狀態(tài)下的等待時長。
當(dāng)然,該研究目前仍處于概念驗(yàn)證階段。60例單中心數(shù)據(jù)集的規(guī)模相對有限,模型在面對制片偽影、低細(xì)胞密度或罕見分子亞型時的表現(xiàn),仍有待多中心、大樣本的外部驗(yàn)證。此外,高光譜成像設(shè)備的硬件成本較高,從實(shí)驗(yàn)室走向常規(guī)病理科仍需工程化與衛(wèi)生經(jīng)濟(jì)學(xué)層面的考量。
