呂俊杰,陳麗娜,何月涵
(生物信息科學與技術學院,黑龍江 哈爾濱 150081)
【探索與實踐】
人工神經(jīng)網(wǎng)絡課程在生物信息學專業(yè)的教學實踐與探討
呂俊杰,陳麗娜,何月涵
(生物信息科學與技術學院,黑龍江 哈爾濱 150081)
人工神經(jīng)網(wǎng)絡是在神經(jīng)生理學、生物學、數(shù)學、計算機學等學科發(fā)展的基礎上提出的,模擬人類大腦的結(jié)構(gòu)和思維方式處理、記憶信息的一門學科。在處理信息方面,相比于傳統(tǒng)人工智能方法具有非線性適應性,目前,在多個領域得到了成功的應用。本文主要根據(jù)人工神經(jīng)網(wǎng)絡在生物信息學相關專業(yè)的教學實踐,從教學方式、教學方法、學科建設等方面進行探討。
人工神經(jīng)網(wǎng)絡;教學實踐;教學方法;生物信息學
人工神經(jīng)網(wǎng)絡是在神經(jīng)生理學、生物學、數(shù)學、計算機學等學科發(fā)展的基礎上提出的,模擬人類大腦的結(jié)構(gòu)和思維方式處理、記憶信息的一門學科。具體來說,早在20世紀40年代,隨著醫(yī)學、生物學家們對人腦神經(jīng)的結(jié)構(gòu)、組成以及信息處理的工作原理的認識越來越充分,有學者提出以數(shù)學和物理方法對人腦神經(jīng)網(wǎng)絡進行抽象,并建立簡化的模型,用以進行信息處理,這種應用類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進行信息處理的數(shù)學模型,稱之為人工神經(jīng)網(wǎng)絡ANN(Artificial Neural Network)[1]。
在人工神經(jīng)網(wǎng)絡中,各種待處理的對象(數(shù)據(jù)、特征、字符、抽象的模式等等)都可用神經(jīng)元處理單元表示。這些神經(jīng)元主要可以分為輸入神經(jīng)元、隱含神經(jīng)元和輸出神經(jīng)元三大類。其作用各不相同,作為輸入神經(jīng)元的處理單元用來與外界產(chǎn)生連接,接收外界的信號輸入;隱含神經(jīng)元處于中間層,為信息處理的不可見層;輸出神經(jīng)元主要實現(xiàn)結(jié)果的輸出。神經(jīng)元之間相互連接,連接的權重反映了各神經(jīng)元之間的連接強度,神經(jīng)元之間的連接關系中蘊含著信息的表示和處理。人工神經(jīng)網(wǎng)絡主要是在不同程度、不同層次上模擬大腦處理信息的風格,具有非程序化、較強的適應性、自組織性、并行分布式等特點,其實現(xiàn)主要是通過網(wǎng)絡的變換和動力學行為,涉及數(shù)學、生物學、人工智能、計算機科學、非線性動力學等多個學科[1]。作為一門活躍的邊緣性交叉學科,在處理信息方面,相比于傳統(tǒng)人工智能方法具有非線性適應性,成功地應用于神經(jīng)專家系統(tǒng)、模式識別、組合優(yōu)化、預測等多個領域,尤其在生物信息學領域得到了廣泛的應用。生物信息學是20世紀末發(fā)展起來的一極具發(fā)展?jié)摿Φ男滦蛯W科。人類的基因中蘊含著大量有用信息,利用神經(jīng)網(wǎng)絡可以對這些海量的信息進行識別與分類,進而進行相關的生物信息學分析。如利用神經(jīng)網(wǎng)絡分析疾病與基因序列的關系,基于神經(jīng)網(wǎng)絡對蛋白質(zhì)結(jié)構(gòu)的預測,基因表達譜數(shù)據(jù)的分析,蛋白質(zhì)互作位點的預測等等,都取得了很好的效果[2]。
因此,在生物信息相關專業(yè)的本科生中開設人工神經(jīng)網(wǎng)絡課程尤為重要。經(jīng)過多年的研究發(fā)展,已經(jīng)提出上百種的人工神經(jīng)網(wǎng)絡模型,這就需要教師針對不同的專業(yè)背景,不同層次的學生,講授不同模型的核心思想、推導過程、實際應用等等。本文主要根據(jù)人工神經(jīng)網(wǎng)絡在生物信息學相關專業(yè)的教學實踐,從以下幾個方面進行探討。
神經(jīng)網(wǎng)絡作為一門偏于理論分析的學科,傳統(tǒng)的教學模式,即首先講解模型的起源,接下來介紹模型的核心思想,然后就是一連串的數(shù)學公式推導,面對滿黑板的公式,學生很難提起興趣去認真學習相應的模型。所以,如何激發(fā)起學生的學習積極性,讓學生重視這門課程,更好地掌握課程內(nèi)容,掌握相關的模型理論基礎、核心思想,更好地服務于本專業(yè),是人工神經(jīng)網(wǎng)絡教學者亟待解決的問題。
首先,在導課的時候要生動,以引起學生對將要學習的內(nèi)容的好奇心,讓學生有興趣投入到課堂學習內(nèi)容中去。布盧姆說過:“最大的學習動機莫過于學生對所學知識有求知的興趣?!敝挥性谶@種動機下的學習,才會提高自身的主動性與自覺性,達到提高教學質(zhì)量的目的[3]。例如,在講解hopfield神經(jīng)網(wǎng)絡的時候,通過舉例對蘋果、橘子的質(zhì)地、形狀、重量等特征的描述,運用“0,1”進行量化描述,然后應用神經(jīng)網(wǎng)絡就可以進行有效地分類;對于旅行商TSP問題,也可以通過hopfield神經(jīng)網(wǎng)絡尋找到最優(yōu)路徑。那么,這些問題是如何解決的呢?就需要大家來一起揭開hopfield神經(jīng)網(wǎng)絡的神秘面紗。其次,由于神經(jīng)網(wǎng)絡涉及大量的數(shù)學公式與數(shù)學方法,學生往往會有畏懼的心理,這就需要教師幫學生澄清思想誤區(qū),現(xiàn)在很多用于數(shù)據(jù)分析與計算的軟件,如matlab工具箱、R軟件里面都有很成熟的人工神經(jīng)網(wǎng)絡軟件包,所以,學生只需要理解其工作原理、核心思想,學會使用現(xiàn)成的人工神經(jīng)網(wǎng)絡軟件包處理數(shù)據(jù),在熟練應用程序包的基礎上,對相應的神經(jīng)網(wǎng)絡模型進行優(yōu)化,改進,并且與其他的人工智能算法相結(jié)合,更好地為本專業(yè)服務。第三,在講授人工神經(jīng)網(wǎng)絡理論內(nèi)容的時候,要摒棄傳統(tǒng)的呆板式的推導過程,以往的神經(jīng)網(wǎng)絡教學方法注重理論分析,通常是一連串的公式推導,公式中又涉及大量的符號,計算起來復雜又煩瑣,學生會覺得索然無趣,厭學情緒嚴重。在教學過程中,教師要精心設計,創(chuàng)設出特定的問題環(huán)境,將所學內(nèi)容與本專業(yè)相結(jié)合起來,多講應用,啟發(fā)和誘導學生選取合適的神經(jīng)網(wǎng)絡模型來解決本專業(yè)的實驗數(shù)據(jù)分析與處理等問題。
除了在理論課堂上將基本的理論知識傳輸給學生,教師還應該安排若干實驗教學內(nèi)容,讓學生以實驗為主,將理論課上所學的知識運用到解決實際問題中來,理論聯(lián)系實際,主動操作思考,觀察,分析,討論,以培養(yǎng)學生解決問題的能力。一旦學生自己動手處理一些問題后,很自然地就會對人工神經(jīng)網(wǎng)絡產(chǎn)生一種親切感,并能強烈激發(fā)起學生繼續(xù)探究下去的興趣。對于同一問題,可以讓學生選取不同的網(wǎng)絡模型,設置不同的參數(shù),甚至可以讓學生自己動手編寫相應的網(wǎng)絡模型程序,并且給予改進,根據(jù)得出的結(jié)果來評價模型在解決實際問題時的好壞,以及模型改進的效果。作為授課教師,需要不斷優(yōu)化實驗教學內(nèi)容,在生物信息學專業(yè)開設人工神經(jīng)網(wǎng)絡課程,實驗教學主要是針對生物信息專業(yè)的海量生物數(shù)據(jù)處理與分析的實際需要,培養(yǎng)學生綜合運用人工神經(jīng)網(wǎng)絡方法和生物信息學知識,進行信息的分析與處理。除了在實驗課堂上給學生最大的自由發(fā)揮空間外,課后作業(yè)也盡量以開放式問題的形式給出,比如,可以讓學生選取相應的網(wǎng)絡模型處理本專業(yè)的一些實際問題,例如,數(shù)據(jù)的分類、聚類等等,其中,數(shù)據(jù)來源可以不同,類型也可自由選取,最后給出相應的模型參數(shù)設置、方法的改進、實驗結(jié)果,也可以安排學生自己查詢文獻進行學習,并安排學生作報告。這樣,學生可以在世界范圍內(nèi)了解神經(jīng)網(wǎng)絡的在本專業(yè)的應用情況,又能提高英語的讀寫能力,還能鍛煉學生做科研報告的能力。
由于生物信息學是一門新興的交叉學科[4],這就要求人工神經(jīng)網(wǎng)絡的授課教師要熟練掌握生物信息相關專業(yè)的知識,教師的業(yè)務水平必須得到充分保證,才能給學生以全面透徹的指導。學院應該本著自主培養(yǎng)與重點引進的原則,優(yōu)化教師隊伍的專業(yè)結(jié)構(gòu)和學歷結(jié)構(gòu),提高教師的自身修養(yǎng)。授課教師要將課堂的理論知識聯(lián)系實際生物問題進行講授,讓學生感受到人工神經(jīng)網(wǎng)絡在本專業(yè)的應用,提高學生的學習效率,同時也需要閱讀大量的專業(yè)文獻,提高編程技巧和數(shù)據(jù)庫應用能力,讓自己成為一名合格的復合型教師。同時,人工神經(jīng)網(wǎng)絡課程的實驗,高度依賴于計算機網(wǎng)絡等設備,因此,相關的軟硬件設施的建設也必不可少,由于,基因組測序技術的發(fā)展,目前生物信息學研究所用的數(shù)據(jù)都是海量的,神經(jīng)網(wǎng)絡訓練起來所需時間太長,不能用普通的電腦完成,需要專門的服務器來處理,學校有關部門應在條件允許的情況下,配備機房,購買服務器,以及相關的軟件,為學生創(chuàng)造良好的環(huán)境,讓學生完成課程內(nèi)容。
最后,人工神經(jīng)網(wǎng)絡涉及數(shù)學、計算機、人工智能和神經(jīng)學等專業(yè)知識,因此,需要授課教師加強與其他相關專業(yè)教師的交流與合作,并滲透到授課過程中去,讓學生在學習人工神經(jīng)網(wǎng)絡網(wǎng)絡時能將各專業(yè)聯(lián)系起來,更好地解決生物信息學中的問題,要想成為一名合格的人工神經(jīng)網(wǎng)絡課程教師,首先要成為一名復合型的教師,不僅要具備教學和科研能力,同時也要具備計算機、生物學、信息學等多學科的知識。
[1]朱大奇,史慧.人工神經(jīng)網(wǎng)絡及其應用[M].北京:科學出版社,2006.
[2]朱偉,史定華,王翼飛.人工神經(jīng)網(wǎng)絡在蛋白質(zhì)二級結(jié)構(gòu)預測中的應用[J].自然雜志,2003,(3):167-171.
[3]趙俊,李曉紅.趣味教學法在預防醫(yī)學教學中的運用[J].現(xiàn)代醫(yī)藥衛(wèi)生,2005,21(15):2089-2090.
[4]張陽德.生物信息學[M].北京:科學出版社,2004.
G642.0
A
1674-9324(2014)17-0208-03
呂俊杰(1982-),女,黑龍江齊齊哈爾人,博士,哈爾濱醫(yī)科大學,講師,主要從事人工神經(jīng)網(wǎng)絡、生物信息類專業(yè)教育教學與研究工作。