朱文勇,唐 霖,翁權(quán)杰
(南京郵電大學(xué),南京 210023)
科技的發(fā)展促使社會(huì)進(jìn)入了信息化時(shí)代,而在信息化時(shí)代計(jì)算機(jī)科學(xué)已經(jīng)成為被社會(huì)各個(gè)領(lǐng)域所廣泛應(yīng)用的一個(gè)重要學(xué)科,為各行各業(yè)發(fā)展與創(chuàng)新提供了充足的可能。在生物信息學(xué)發(fā)展的過程中,需要涉及到眾多數(shù)據(jù)與信息的收集、整理、儲(chǔ)存、統(tǒng)計(jì)、分析等,若是單純依靠人進(jìn)行計(jì)算與分析,則相關(guān)研究進(jìn)展就過于緩慢。因此,計(jì)算機(jī)科學(xué)的出現(xiàn)在一定程度上為當(dāng)前生物信息學(xué)的進(jìn)一步發(fā)展與研究創(chuàng)造了有力條件,加快了其發(fā)展速度,這也就充分說明會(huì)計(jì)算機(jī)科學(xué)在生物信息學(xué)中的重要性地位。
隨著當(dāng)前生物信息學(xué)的快速發(fā)展,現(xiàn)階段生物信息所采集的信息數(shù)據(jù)已經(jīng)開始采用海量隨機(jī)的短序列拼接,這種方法在實(shí)際應(yīng)用的過程中主要是由具有極高運(yùn)行速度、自動(dòng)化的測(cè)序儀器來完成的,并且可以通過對(duì)生物TCJ排列的測(cè)序來獲得相關(guān)序列信息,然后利用先進(jìn)技術(shù)將這些生物體中的物理化學(xué)信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),使得計(jì)算機(jī)可以自動(dòng)進(jìn)行識(shí)別,然后根據(jù)這些信號(hào)進(jìn)行初步的分析,而這些數(shù)據(jù)均是最為原始的基本實(shí)驗(yàn)數(shù)據(jù)[1]。在此之后需要完成的便是篩選并分析海量生物信息進(jìn)行處理與分析,這就需要高性能、高運(yùn)行效率的計(jì)算機(jī)作為有效支撐,若是缺乏可靠的計(jì)算機(jī)來實(shí)現(xiàn)篩選工作,則生物信息學(xué)方面的研究進(jìn)展就會(huì)相對(duì)緩慢,這也就充分說明了計(jì)算機(jī)科學(xué)在生物信息學(xué)中應(yīng)用的重要性。
在傳統(tǒng)生物學(xué)研究的過程中,大部分的研究結(jié)果主要是在經(jīng)過實(shí)驗(yàn)、觀察,以及多次實(shí)踐,才可以得出最后的結(jié)論,而這個(gè)過程中具有反復(fù)性、長(zhǎng)期性特征,需要經(jīng)過漫長(zhǎng)的研究過程才可以取得一定的研究成果。隨著計(jì)算機(jī)科學(xué)的引進(jìn)在生物學(xué)領(lǐng)域研究的過程中,便可以通過邏輯、事先推演而得出理論,然后再結(jié)合實(shí)際情況在實(shí)踐中對(duì)這一理論進(jìn)行檢驗(yàn),以此來完成相關(guān)的研究工作[2]。這就在一定程度上加快了生物信息學(xué)的研究進(jìn)程,同時(shí)也有效減少對(duì)人力、物力、財(cái)力資源的消耗,為研究的順利進(jìn)行提供充足的保障。除此之外,計(jì)算機(jī)科學(xué)的引進(jìn)還可以實(shí)現(xiàn)對(duì)各種類型設(shè)備的有效控制,因此在研究的過程中可以通過預(yù)設(shè)程序的方式,有效減少實(shí)驗(yàn)的操作難度,同時(shí)也可以減少對(duì)人力資源的消耗,使該項(xiàng)研究工作可以順利進(jìn)行。
數(shù)據(jù)挖掘在完成需要首先對(duì)數(shù)據(jù)進(jìn)行清理集成,然后根據(jù)數(shù)據(jù)的實(shí)際情況對(duì)其趨勢(shì)進(jìn)行預(yù)測(cè)分析,而這種預(yù)測(cè)也被應(yīng)用至生物信息學(xué)的研究中。以蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)為例,在傳統(tǒng)預(yù)測(cè)的過程中,主要是需要依靠各種實(shí)驗(yàn)來完成,然而有關(guān)蛋白質(zhì)分子結(jié)構(gòu)的預(yù)測(cè)卻并不能完全根據(jù)實(shí)驗(yàn)來進(jìn)行確定,為相關(guān)研究工作帶來諸多阻礙[3]。然而,通過將計(jì)算機(jī)科學(xué)應(yīng)用至結(jié)構(gòu)預(yù)測(cè)中,便可以通過使用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),對(duì)構(gòu)成蛋白質(zhì)的不同種類的按計(jì)算進(jìn)行編碼,然后任意選擇一個(gè)奇數(shù)長(zhǎng)度窗口,構(gòu)建起模型,從而實(shí)現(xiàn)有效預(yù)測(cè),為相關(guān)研究工作提供便利。除此之外,利用數(shù)據(jù)挖掘技術(shù)還可以實(shí)現(xiàn)微陣列數(shù)據(jù)分析、蛋白質(zhì)同源等多方面的研究,其研究領(lǐng)域、研究方向被進(jìn)一步拓展,對(duì)于生物信息學(xué)的發(fā)展具有促進(jìn)作用。
通過應(yīng)用計(jì)算機(jī)科學(xué),不僅可以實(shí)現(xiàn)對(duì)理論知識(shí)方面的預(yù)測(cè),同時(shí)還可以實(shí)現(xiàn)對(duì)設(shè)備的控制與優(yōu)化,數(shù)據(jù)挖掘的應(yīng)用更是為結(jié)構(gòu)預(yù)測(cè)提供了便利。在此基礎(chǔ)上,計(jì)算機(jī)科學(xué)還可以實(shí)現(xiàn)結(jié)構(gòu)模擬。計(jì)算機(jī)的應(yīng)用,可以運(yùn)用各種建模軟件針對(duì)特定內(nèi)容進(jìn)行3D建模,這就在一定程度上有效減少了結(jié)構(gòu)模型的搭建時(shí)間與成本,并且可以在軟件窗口直接輸入相關(guān)的數(shù)據(jù)信息,讓計(jì)算機(jī)進(jìn)行結(jié)果演算,為結(jié)構(gòu)假設(shè)的檢驗(yàn)工作提供了便利[4]。在計(jì)算機(jī)3D建模的輔助下,可以實(shí)現(xiàn)基因、蛋白質(zhì)的建模,而其結(jié)構(gòu)也會(huì)更加清晰的展現(xiàn)出來,加快了生物信息學(xué)的研究進(jìn)程。
綜上所述,生物信息學(xué)在實(shí)際發(fā)展的過程中應(yīng)用了計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、生物學(xué)、統(tǒng)計(jì)學(xué)等多門學(xué)科的相關(guān)知識(shí),需要借助計(jì)算機(jī)與網(wǎng)絡(luò)技術(shù)強(qiáng)大的信息計(jì)算、統(tǒng)一、處理能力,若是缺乏計(jì)算機(jī)的有效支撐,則其發(fā)展、研究速度將會(huì)嚴(yán)重降低。計(jì)算機(jī)科學(xué)的應(yīng)用,使得生物信息學(xué)的研究實(shí)現(xiàn)了預(yù)見性,同時(shí)還可以實(shí)現(xiàn)對(duì)各種設(shè)備的有效控制,節(jié)約了大量的人力與物力,并且可以通過數(shù)據(jù)挖掘的方式來進(jìn)一步加強(qiáng)數(shù)據(jù)整理,從而簡(jiǎn)化了生物信息學(xué)研究的工作量,加快了研究進(jìn)度,為其今后的進(jìn)一步發(fā)展奠定良好基礎(chǔ)。