原標題:探尋生物學“金礦”,有了“指南針”
咖啡能提神、四肢被刺痛時會回縮、雙手能輕易抓取物品……
這些平日里司空見慣的事,背后卻隱藏著令無數生物學家嘔心瀝血、窮盡一生都想搞清楚的生命奧秘:咖啡因如何影響大腦?脊髓如何整合并傳導外界刺激信號?抓取東西時涉及哪些腦區,它們又是如何協同“辦公”的?
如今,這些難題或將迎來更準確的解題思路。由我國科學家領銜的研究團隊歷經十余年攻關,提出時空統一生命分子信號分析理論,并結合人工智能等技術,成功研發出一套開源智能計算平臺(AQuA2)。該平臺能幫助研究人員解析生命體內分子信號的復雜時空動態特征,從而揭示生命科學現象的本質。
4月8日,該研究成果發表于國際期刊《細胞》。
拆解復雜信息,提取“基元”特征
“如果將生物學課題的真相看成是一座座金礦,那么AQuA2就像是一枚指南針,能為研究人員找到更快、更短的通往金礦路徑的方向。”文章通訊作者、清華大學自動化系長聘教授于國強在接受科技日報記者采訪時說。
近年來,熒光探針、顯微技術、動物遺傳學改造技術等多項生物技術發展得如火如荼,使神經科學、細胞生物學、病理學及發育生物學等生物學領域,迎來了海量的、高精度的、高保真的科研數據。這些數據既包含空間信息,即“在哪個部位”,也囊括時間要素,即“在什么時候”。
“面對海量且復雜的時空數據,如何提取并刻畫其中的時空模式,抽絲剝繭地還原出生命活動的進程,正成為制約科研取得突破的新瓶頸。”于國強指出,傳統人工分析效率低下,并受已有知識局限,容易漏掉突破性科學發現。現有自動分析技術與方法或因假設過于嚴苛而導致結果失真,或因計算效率不足難以應對空間時間大數據,破解這些難題急需新的理論與手段。這正是于國強團隊研發AQuA2的初衷。
AQuA2的核心工作模式是“拆解復雜事件”,即利用機器學習理論和數字優化技術把復雜海量的跨時空分子活動數據,分解成一個個簡單的基礎事件,并細心提煉出每個“基元”的特征,后期再通過統計學分析工具,評估不同實驗條件下這些“基元”是否發生變化,從而為科學家提供“靠譜”的研究方向。
“假如我們面前是一片汪洋大海,海面上有一些島嶼。AQuA2可以將這些島從無垠的海面上剝離出來,這就是拆解;進而再將小島的信息提取出來,如面積、高度、平整度、沿岸海浪大小等,這些就是‘基元’特征;還可以評估在不同天氣下,這些小島的特征如何變化。”于國強打了個形象的比方,“有了這些信息,人們就可以進一步充分利用這些島嶼,譬如漁民可以尋找合適的避風港。”
簡言之,作為一個稱手的工具,科學家將大量繁雜的生物醫學數據“投喂”給AQuA2,AQuA2用自己的一套計算和統計模式“消化吸收”,最終為科學家提供更接近真相的研究思路。
創新三大方向,“指向”更快更準
后續,團隊進行了相關實驗,以驗證AQuA2的實用價值。
用鑷子碰觸小鼠的爪子、讓小鼠在轉輪上奔跑,在感覺和運動這兩種刺激模式下,小鼠脊髓內的鈣信號傳導模式是否一樣,以往科學家們很難搞清楚。AQuA2則發現,在這兩種刺激下,小鼠脊髓的星形膠質細胞內,鈣信號參與了不同的神經回路。
咖啡因對斑馬魚有何影響?該團隊設置對照組,通過AQuA2分析發現,不攝入咖啡因的正常情況下,斑馬魚體內僅顯示出神經元細胞信號,這可能是魚游泳時的常規傳導信號;而攝入了咖啡因的斑馬魚體內則出現了星形膠質細胞鈣信號,并伴隨著更高強度的神經元細胞信號。
“以上兩個實驗結果表明,星形膠質細胞對于調節小鼠脊髓神經回路活動具有重要意義,咖啡因令斑馬魚大腦動力學發生了顯著變化。這就為生物學家指出了較為明確的研究方向。”于國強說。
是什么讓AQuA2的“指針”如此敏銳?
“我們在三個方向上取得了突破。”于國強說。
一是顛覆了傳統的時間和空間數據“割裂”分析模式,建設了時空統一的理論框架。以小鼠在轉輪上運動為例,傳統的分析模式僅能“看”到小鼠脊髓內的鈣信號被激活,而AQuA2則“看”到鈣信號首先從脊髓靠近背部的一側出現,繼而傳導至靠近腹部的另一側。
二是引入了共識功能單元。以手抓取東西為例,完成這一動作時,大腦的視覺功能區和運動功能區會協同作用,且相關生物分子信號多次出現,這二者就是共識功能單元。給斑馬魚“喂”咖啡因時,AQuA2同時檢測到分別與神經元細胞和星形膠質細胞相關的共識功能單元,表明二者在咖啡因的作用下“同頻共振”。據此,生物學家可進一步有的放矢地研究二者的協同機制。
三是借助了人工智能與機器學習等技術手段。譬如,研究人員利用序統計理論刻畫閾值操作帶來的統計偏差,從而提高低信噪比狀況下的魯棒性,讓結果更準確。研究團隊還開發了雙向推送線性組件操作算法(BILCO)等先進方法,使得AQuA2能夠在不犧牲精度的情況下顯著提高檢測效率——與傳統的機器學習算法相比,它的運行速度提高約2倍,計算機內存使用效率提高約10倍。
“以上理論和技術的加持,讓AQuA2又快又準。”于國強表示,雖然AQuA2已經能夠有效解析鈣、多巴胺、三磷酸腺苷等若干個生物信號,但隨著生物技術的發展,更多的生物信號會涌現,譬如氧氣和電壓信號。“我們希望與全球的科學家們合作,為更多元的生物信號研究、最大化地發揮數據價值而不懈努力。”