總基因體學小辭典(Glossary of Metagenomics) - 盛夏不等式

文章推薦指數: 80 %
投票人數:10人

在以核酸為基礎的標的基因分析中,OTUs 定義為彼此相似度達特定閾值(例如97%)的序列集合,其含義則因研究目的而定。

以資料處理為例,OTUs 為樣本內具有 ... Home TheDoorintoAstrobiology MetagenomicsandBioinformaticsinMicrobialEcology TheJourneyinResearch 2020年2月6日星期四 總基因體學小辭典(GlossaryofMetagenomics) 為了規範今後寫文章的用詞,我將陸續整理總基因體學常用的詞彙。

Alignment比對比較序列之異同。

Amplicon擴增子 核酸序列經PCR增幅的產物。

Amliconsequencevariants(ASVs) 擴增子序列變異型擴增子當中存在的序列類型。

擴增子各序列的差異來源可分為生物性(例如:基因多型性、遺傳多樣性或群落多樣性)或是非生物性(定序錯誤、增幅錯誤或人工序列等),資料處理的目的便是從原始資料中取得具有生物含意的ASVs。

Community群落/群集 存在相同時地的族群(population)集合。

Coverage覆蓋率映對至參考序列的讀數。

Depthofcoverage(覆蓋深度,簡稱depth)是映對至局部參考序列(包含單獨的鹼基)的讀數,即參考序列片段被定序的次數;breadthofcoverage(覆蓋廣度)是參考序列被讀段所映對的鹼基數,即參考序列被定序的完整程度。

若某序列的一鹼基被定序了一萬次,則該鹼基的覆蓋深度為10000;若該序列的所有的鹼基皆至少被一個讀段映對,則這些讀段的覆蓋廣度為100%。

註:有些文章會以depth或coverage取代depthofcoverage,也有些文章會以coverage取代breadthofcoverage。

鑒於這些歧義的存在,需要視語境解讀coverage的意義。

Library (文)庫 備用物質的集合,例如sequencinglibraries(定序庫,要送諸定序的核酸片段)。

Mapping映對比對(align)讀段與參考序列,獲取讀段所屬的參考序列及所在的段落。

Mapping和alignment的差異在於:mapping是reference-based&supervised;alignment則是reference-free&unsupervised。

Mappingrate映對率成功映對至參考序列的讀數比率。

Mappingrate和coverage之各項指標的差異在於衡量基準,雖然皆指「應對至參考序列的讀數」,但mappingrate的比較基準是既有的讀數;coverage指標的比較基準是參考序列。

Microbiome 微生物體 (1)Micro-biome:環境與其中的微生物相(microbiota)。

(2)Microbi-ome:環境微生物的基因體集合(microbialmetagenome)。

Metagenomics總基因體學 研究個體的特定基因是遺傳學(genetics),研究個體的全數基因是基因體學(genomics),研究群集的基因集合是總基因體學(metagenomics)。

註:除了總(體)基因體學,metagenomics還依據譯者對meta-的詮釋,譯作元基因體學、多源基因體學和宏基因組學。

我認為多源基因體學意思最貼切,只是跟meta-的關聯不大;元基因體學取about的意思則詞不達意;而宏基因組學不是台灣常用的譯名。

簡言之,metagenomics的meta是meta-analysis的meta。

Microbiota微生物相 特定環境的微生物群集(microbialcommunities)以及其狀態(composition,phase,condition,...)。

Operationaltaxonomyunits(OTUs) 操作分類單元 在以核酸為基礎的標的基因分析中,OTUs定義為彼此相似度達特定閾值(例如97%)的序列集合,其含義則因研究目的而定。

以資料處理為例,OTUs為樣本內具有生物意義的正確序列的子集。

Population族群存在相同時地且同屬一物種的個體集合。

Populationsize族群規模族群的個體數量。

Read 讀段 單輪定序獲得的結果,例如:ATCGTACA(DNA)。

讀段與序列(sequences)的區別在於,讀段是定序儀器輸出的數據,而序列還有物質含義。

Readdepth讀深又稱sequencingdepth(定序深度),即參考序列之片段被定序的次數。

Readlength讀長讀段的長度。

Readnumber讀數讀段的數量。

在擴增子總基因體分析(metagenomics)中,因為參考序列與擴增子讀段往往呈一對一關係,所以讀深(readdepth) 的涵義通常與讀數一致 Referencesequence參考序列 欲將讀段與之比對的序列。

回貼讀段、移除汙染、註解物種或建立OTUs皆需要參考序列。

Sequences 序列 (1)核酸、去氧核酸、蛋白質等由單體組成的長鏈。

(2)同reads。

定序儀器的原始輸出,例如:ATCGTACA(DNA)。

於 2月06,2020 以電子郵件傳送這篇文章BlogThis!分享至Twitter分享至Facebook分享到Pinterest 標籤: Metagenomics 沒有留言: 張貼留言 較新的文章 較舊的文章 首頁 訂閱: 張貼留言(Atom) SearchThisBlog AboutMe 超級boy 「我現在,是超級boy。

」 檢視我的完整簡介 Astrobiology Astrobiology Lifeintheuniverse Originoflife Research Bioinformatics Biology Communityecology Datavisualization Metagenomics Microbiome Programming AcademicCareer Career Experience Scientificwriting StudyabroadandScholarship SF,stories,andotherthings Reading Sciencefiction Story Contactme 名稱 以電子郵件傳送 * 訊息 * Pageviews



請為這篇文章評分?