學習生物資訊學要具備哪些能力?李御賢教授專訪 - 科學月刊
文章推薦指數: 80 %
生物資訊學是一種利用資訊方法分析生物資料,藉以理解生命現象的學問。
它的研究命題範圍相當廣泛,涵蓋了DNA、RNA、蛋白質等3個層次。
Search/搜尋
分類選單
-文章分類-
封面故事
NewsFocus
專訪
專欄
科技報導
評論
精選文章與其他
活動訊息
封面故事2022年628期-生物資訊大解碼(4月號)
文章專區
2022-04-01學習生物資訊學要具備哪些能力?李御賢教授專訪
628期
Author作者
採訪撰稿|林翰佐/銘傳大學生物科技學系副教授,本刊總編輯。
生物資訊學DNARNA序列組裝計算生物學次世代定序臺灣精準醫療計畫基因學基因體學
生物資訊學是一種利用資訊方法分析生物資料,藉以理解生命現象的學問。
它的研究命題範圍相當廣泛,涵蓋了DNA、RNA、蛋白質等3個層次。
DNA層級的研究包括DNA定序(sequencing)、序列組裝(assembly)、基因註解(geneannotation)等;RNA層次的研究有基因表現、基因間的交互作用等;而蛋白質層次則有結構預測、蛋白質表現等,但無論是在DNA、RNA、蛋白質層次,都有一個共同的精神,就是有大量的資料需要進行分析,因此要使用適合的資訊工具與方法來分析生物資料。
《科學月刊》本期邀請李御賢教授,談論生物資訊學的應用與未來,分享他多年來研究生物資訊學的歷程,以及給所有想踏入生物資訊學的莘莘學子們一些學習上的建議。
(林翰佐拍攝)
生物資訊學是什麼?
《科學月刊》(以下簡稱科):網路上常看到「計算生物學」(computationalbiology)這個名詞,計算生物學是生物資訊學(bioinformatics)嗎?
李御賢(以下簡稱李):其實兩者的定義不同。
生物資訊學是分析生物資料的學問,而計算生物學則偏向開發生物資訊的工具或理論。
以次世代定序(nextgenerationsequencing,NGS)而言,生物資訊學是利用序列組裝的工具,分析生物序列;而計算生物學則是改進或發展序列組裝的工具。
科:生物資訊學的研究如何進行?
李:生物資訊學是將生命科學的特徵資訊數位化,再進行分析比較。
實務上可分為3個步驟,分別是「收集資料」、「分析資料」、「預測資料」。
我們以目前臺灣正在進行的「臺灣精準醫療計畫」(TaiwanPrecisionMedicineInitiative,TPMI)為例說明流程。
TPMI的目標是建立臺灣人口基因資料庫的基礎,透過生物資訊學研究體系的建立,希望能在「用藥安全及效能」、「疾病早期診斷」、「預防醫療」等面相提升醫療品質。
首先是收集資料,由中央研究院與32家大型醫院合作,預計收集數百萬個病人與正常人的生物資料(例如DNA序列)。
基因資料的收集有時會使用生物晶片(microarray),在TPMI計畫中,使用單一核苷酸多型性(singlenucleotidepolymorphism,SNP)的基因型鑑定晶片。
這種晶片可一次收集人類樣本中60多萬筆SNP資訊,再加上每個人的臨床資料,使得每份樣本都會產生相當驚人的資料。
以TPMI預計收集每10萬人的數據量來預估,共計約有60Gigabyte(GB)的資料量需要進行儲存。
分析資料是為了找出大量樣本中數據的特徵。
在上述的例子中,我們可以利用孟德爾遺傳學的表達方式,將每份檢體中的某筆SNP資訊簡單表示成AA、Aa、aa的3種可能基因型。
透過簡單的二維矩陣方法,我們便可以分析兩筆資料之間的差異。
但實務上,每份檢體透過基因晶片的檢測會出現60多萬筆的SNP資訊。
光要分析人與人之間SNP的差異,就需要10萬×10萬的二維矩陣進行運算。
除了數據的分析,如何將分析結果簡明而適切的表達出來也是一項重點,這部分也需要資訊學工具的幫忙。
資料視覺化(datavisualization)在生物資訊學領域中也是一門顯學。
預測資料則是利用這些疾病的特徵DNA序列進行疾病預測。
針對60多萬筆SNP,在資訊工具的幫助下,可能會有數十到數百個特徵SNP位點具有統計上的顯著意義。
我們要利用找到的特徵SNP,看看是否能預測疾病的發生。
一般而言,資訊科學家會以預測的成功率來確定特徵SNP是否有效(猜對的機率高),但在臨床醫學的領域,針對疾病的確診,需要注意預測的專一度(猜錯的機率要低,不可以亂指患者有病),而初步篩選,則要注意靈敏度(要能將患者最大程度地從人群中檢出)。
這邊就可以看出來,研究資訊與臨床醫學的科學家在想法上會有不同,需要誇領域的專家合作與充分的討論。
科:看起來「生物資訊學」並不是一門難以理解的科學。
不過,生物資訊學似乎是近20年來才蓬勃發展的學門,這是為什麼呢?
李:基因學(genetics)與基因體學(genomics)有何不同?我的看法是,基因學是針對數個基因所做的研究,而基因體學則以透過基因「全體」的觀點做的研究。
早期因為技術的限制,我們一次只能分析一個基因,但現今的分子生物學技術已有長足的發展,例如使用NGS,僅用數天的時間就可以分析人類樣本的全基因體序列。
或是利用生物晶片技術,可以在一天內分析個人所有基因的表現。
平行化基因測量技術的發展,帶來的大量資料促進了生物資訊學的蓬勃發展。
即使在短短的20年間,生物資訊學自身也有相當顯著的「演化」。
20年前,也就是我剛進行生物資訊學研究時,常會遇到樣本數少的狀況,統計檢定要使用少樣本的檢定法。
10年前則因為平行化的基因測量技術發展,需要計算的特徵資料太多,會遇到多重檢定問題(multipletestingproblem)。
……【更多內容請閱讀科學月刊第628期】
回列表頁
加入收藏
列印
相關推薦
科學月刊4月號/2022第628期:生物資訊大解碼
特別價$237
科學月刊3月號/2022第627期:天涼泡湯趣!
特別價$237
新訂一年方案:《科學月刊》一年12期
售價$2580
新訂兩年方案:《科學月刊》二年24期
售價$4900
TOP
本站使用第三方服務進行分析,以確保使用者獲得更好的體驗。
了解本站隱私權政策
OK
延伸文章資訊
- 1二十一世紀的新興科學-生物資訊學
學。 四、生物資訊學的任務及目標. 簡單來說,生物資訊學是將基因組DNA 序列資訊分析作為源頭,在 ... 應用與發展研究:基因組資訊學的研究成果不但具有重要的理論價.
- 2生物資訊學(Bioinformatics)-下| 科學Online - 國立臺灣大學
為了避免有心人士將這些資訊應用在違反倫理的事情上,例如:製造生化武器、不法藥物等,相關規範的制訂是必要的,當然更需要每個科學研究者的自律,才能免 ...
- 3選才育才輔助系統-生物資訊學類 - ColleGo!
生物資訊學為生物學、電腦科學、數學等學科的結合,由於生物學研究中需要分析極為龐大的資料(如基因定序、基因交互作用等),因此在現今科技發達的 ...
- 4生物資訊(Bioinformatics) 專題(上) - The Investigator Taiwan
生物資訊學(Bioinformatics)是一門結合生物學、計算機科學、應用數學、統計學等學科的跨領域學門,也因為人類基因組計畫(Human Genome Project)的 ...
- 5生物資訊學與植物病毒基因體資料庫之應用 - 行政院農業委員會
何謂生物資訊學(Bioinformatics)?依據舊金山州立大學Dr. R. L. Bernstein的解釋,狹義的定義是使用電腦工具去儲存、應用、分析核酸與胺基酸序列及蛋白質結構 ...