代謝組學相關研究可追溯到始于上世紀70年代的代謝譜分析,這類代謝譜分析通常采用氣相色譜質譜聯用技術對患者體液中代謝物進行定性、定量分析及對疾病進行篩選和診斷。這種在臨床上利用代謝譜分析診斷有關疾病的方法一直延用至今。1983年,荷蘭應用科學研究組織在國際上首先采用質譜對尿中代謝指紋進行研究,并陸續有不少科學家開始應用高效液相色譜和核磁共振技術進行代謝譜分析。90年代后,研究目標主要集中在藥物在體內的 代謝等方面。1997年研究人員提出了通過定量分析盡可能多的代謝產物評估酵母基因的遺傳功能及其冗余度的必要性,首次將代謝產物和生物基因的功能聯系起來。1999年,N icholson等提出metabonom ics的概念,將代謝組學定義為生物體對病理生理或基因修飾等刺激產生的代謝物質動態應答的定量測定。2000年,德國馬普所的Fiehn等提出了metabolom ics的概念,將其定義為對限定條件下的 特定生物樣品中所有代謝產物的定性定量分析。在21世紀的前幾年,植物和微生物領域應用色譜質譜技術進行細胞的代謝組學研究,用 metabolom ics的較多,而在藥物研發和疾病研究等領域,用NMR以動物體液或組織樣品為研究對象的,則用metabonomics較多。隨著研究的深入,現在對這兩個名詞的區分已越來越少,基本等同使用。
代謝組學研究一般包括代謝組數據的采集、數據預處理、多變量數據分析、標記物識別和途徑分析等步驟。生物樣品(如尿液、血液、組織、細胞和培養液等)采集后進行生物反應滅活、預處理。運用核磁共振、質譜或色譜等檢測其中代謝物的種類、含量、狀態及其變化,得到代謝譜或代謝指紋,而后使用多變量數據分析方法對獲得的多維復雜數據進行降維和信息挖掘,并研究相關代謝物變化涉及的代謝途徑和變化規律,以闡述生物體對相應刺激的響應機制、發現生物標記物。
樣品采集與制備樣品的采集與制備是代謝組學研究的初始步驟也是最重要的步驟之一,代謝組學研究要求嚴格的實驗設計和合適的分析精度。首先需要采集足夠數量的樣本,從而可有效減少源于生物樣品個體差異對分析結果的影響,得到有統計學意義的分析數據。實驗設計中對樣品收集的時間、部位、種類、樣本群體等應給予充分考慮。在研究人類樣本時,還需考慮飲食、性別、年齡和地域等諸多因素的影響。此外,分析過程要有嚴格的質量控制,需要考察如樣本的重復性、分析精度、空白等。代謝產物的變化對分析結果有較大的影響,在處理生物樣本時要特別注意避免由于殘留酶活性或氧化還原過程降解代謝產物、產生新的代謝產物。通常需對所收集樣品進行快速淬滅。滅活的方法很多,如液氮冷凍、酸處理等。
在代謝組學研究中,根據研究對象、目的和采用的分析技術不同,所需的樣品提取和預處理方法各異。如采用NMR的技術平臺,只需對樣品做較少的預處理即可以分析;采用M S進行“全”成分分析技術時,樣品處理方法相對簡單,但不存在一種普適性的標準化方法。代謝產物通常用水或有機溶劑(如甲醇、己烷等)分別提取,獲得水提取物和有機溶劑提取物,從而把非極性相和極性相分開,以便進行分析。對于代謝輪廓譜或靶標分析,還需要做較為復雜地處理,如常用固相微萃取、固相萃取、親和色譜等預處理方法。用氣相色譜或氣相色譜質譜聯用時,常常需要進行衍生化,增加樣品的揮發性。由于特定的提取條件往往僅適合某些類化合物,目前尚無一種能夠適合所有代謝產物的提取方法。應該根據不同的化合物選擇不同的提取方法,并對提取條件進行優化。
代謝組學是進行生物表型研究的主要手段之一,是系統生物學研究不可或缺的部分。在疾病分型、藥物毒性評價、植物基因功能和表型的研究等方面取得了極大的成功,但從總體來看,它仍然處于發展階段,在方法學和應用兩方面均面臨著的極大挑戰,需要其他學科的配合和交叉。在平臺技術和方法學研究方面,生物樣本的復雜性使得代謝組學研究對分析技術的靈敏度、分辨率、動態范圍和通量提出了更高的要求。代謝組學研究的深入得益于分析技術的不斷發展,如高分辨質譜、超高效液相色譜/質譜、毛細管液相色譜/質譜、多維色譜質譜聯用技術和多維核磁共振技術等的使用。生物標記物的結構鑒定也是目前代謝組學研究的重點和難點問題之一,由于缺乏標準的可通用的質譜數據庫,一定程度上制約了基于LC-MS技術在代謝組學研究中的應用。理論上講,LC-M S、NMR可提供較好的關于組分結構的信息,但儀器復雜,操作繁瑣,靈敏度和通量急需改進和提高。