張園園
摘要:大數(shù)據(jù)是研究領(lǐng)域的重要輔助工具。分析了心理學(xué)與教育學(xué)的大數(shù)據(jù)特征及獲取方法,闡述了大數(shù)據(jù)環(huán)境下心理學(xué)與教育學(xué)的研究方法及研究的主要特征,為相關(guān)工作人員提供理論參考,發(fā)揮大數(shù)據(jù)的信息整理功能,為心理學(xué)和教育學(xué)的發(fā)展奠定良好的基礎(chǔ)。
關(guān)鍵詞:大數(shù)據(jù);心理學(xué);教育學(xué);研究變革
大數(shù)據(jù)即是海量資料,具有規(guī)模化、多樣性、效率性和價(jià)值密度低等特點(diǎn),能為社會(huì)和學(xué)科的研究提供有效的理論依據(jù)?,F(xiàn)階段,大數(shù)據(jù)涉及的領(lǐng)域有經(jīng)濟(jì)、生產(chǎn)、科技、教育、管理等,打破了傳統(tǒng)學(xué)術(shù)研究的局限性,使研究更為高效和準(zhǔn)確。
一、心理學(xué)與教育學(xué)的大數(shù)據(jù)特征
在價(jià)格不變的前提下每隔一段時(shí)間,大數(shù)據(jù)系統(tǒng)就會(huì)完成一次升級(jí)和優(yōu)化,該理論相似于著名的摩爾定律,與大數(shù)據(jù)時(shí)代的發(fā)展不謀而合。隨著現(xiàn)代化技術(shù)的發(fā)展,計(jì)算機(jī)對(duì)數(shù)據(jù)的儲(chǔ)存和處理能力越來(lái)越強(qiáng)大,為大數(shù)據(jù)的發(fā)掘和應(yīng)用奠定了基礎(chǔ)。
在心理學(xué)和教育學(xué)中,大數(shù)據(jù)的應(yīng)用主要體現(xiàn)在結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化三個(gè)方面。前者屬于現(xiàn)階段研究的主題內(nèi)容,后兩者由于數(shù)據(jù)量大,內(nèi)容復(fù)雜,未來(lái)的發(fā)展前景廣闊。
結(jié)構(gòu)化數(shù)據(jù)主要是利用圖表、數(shù)字以及符號(hào)等內(nèi)容呈現(xiàn)的數(shù)據(jù),表達(dá)類型有縱向、截面和面板三種??v向是以時(shí)間軸為順序縱向排列的數(shù)據(jù),可按照發(fā)展情況統(tǒng)計(jì)數(shù)據(jù)并加以分析;截面是將同一階段的個(gè)體水平截取比較,最終獲得統(tǒng)計(jì)結(jié)果;面板是通過(guò)多個(gè)截面數(shù)據(jù)的分析比較獲得結(jié)果的過(guò)程,其準(zhǔn)確性和客觀性較強(qiáng)。
非結(jié)構(gòu)化數(shù)據(jù)是將文本、視頻、音頻、圖片、文檔等信息搜集整理,掌握數(shù)據(jù)的過(guò)程。非結(jié)構(gòu)化數(shù)據(jù)大體上可分為文字、多媒體及行為幾種,文字是指網(wǎng)上交流互動(dòng)中保存的文字記錄,也可以是留言評(píng)論或文學(xué)作品等;多媒體是使將發(fā)送到互聯(lián)網(wǎng)上的視頻、圖片、音頻等內(nèi)容記錄下來(lái)的過(guò)程,研究人員可基于此對(duì)多媒體中的人物展開(kāi)分析,獲取其狀態(tài)和心理;行為是對(duì)個(gè)人的日常操作、一舉一動(dòng)進(jìn)行監(jiān)控的手段,如網(wǎng)頁(yè)瀏覽時(shí)長(zhǎng)等。
二、心理學(xué)與教育學(xué)大數(shù)據(jù)獲取方法
無(wú)論是心理學(xué)還是教育學(xué),主體皆為人,所以結(jié)構(gòu)化數(shù)據(jù)通常來(lái)自調(diào)查問(wèn)卷、參考文獻(xiàn)或?qū)嶒?yàn)探究等,而非結(jié)構(gòu)化數(shù)據(jù)則是通過(guò)提取產(chǎn)品使用、服務(wù)以及互聯(lián)網(wǎng)數(shù)據(jù)等有價(jià)值的信息達(dá)到研究的目的。具體研究方法如下。
其一,最小數(shù)據(jù)庫(kù)。顧名思義,最小數(shù)據(jù)庫(kù)是研究主體的某一狀態(tài)或某件事,通過(guò)具有代表性的情況來(lái)分析主體,相比之下數(shù)據(jù)庫(kù)較小,內(nèi)容較簡(jiǎn)。由多個(gè)最小數(shù)據(jù)庫(kù)組成的數(shù)據(jù)庫(kù)集需要具備兩種優(yōu)勢(shì),一方面可將有價(jià)值的代表性數(shù)據(jù)簡(jiǎn)化整合,另一方面要求數(shù)據(jù)完全圍繞研究主體展開(kāi),變量保持一致。利用最小數(shù)據(jù)庫(kù)獲取研究信息可避免在大數(shù)據(jù)中迷失方向,確保數(shù)據(jù)的客觀性。心理學(xué)及教育學(xué)主要是研究主體的心理動(dòng)態(tài)、學(xué)業(yè)水平和動(dòng)機(jī)產(chǎn)生的成就,所以最小數(shù)據(jù)庫(kù)應(yīng)以此建立并完善,如,將某校學(xué)生作為主要研究對(duì)象,需要獲取的內(nèi)容有班級(jí)、年齡、性別、身高、體重、成績(jī)、父母職業(yè)以及人格量表等,還可酌情增加其他變量,如,民族、籍貫等,成績(jī)和心理是主要研究方向,建立數(shù)據(jù)庫(kù)后,整合信息即可統(tǒng)計(jì)出數(shù)據(jù)之間的關(guān)系。
其二,大數(shù)據(jù)。隨著大數(shù)據(jù)時(shí)代的到來(lái),結(jié)構(gòu)化數(shù)據(jù)逐漸轉(zhuǎn)變?yōu)榉墙Y(jié)構(gòu)化以及半結(jié)構(gòu)化形式,操作更為簡(jiǎn)單便利,數(shù)據(jù)準(zhǔn)確性強(qiáng),打破了調(diào)查問(wèn)卷、交流訪談等傳統(tǒng)信息搜集方法的局限性,使其適應(yīng)性更強(qiáng)。大數(shù)據(jù)獲取有兩種方法,一種是線下獲取,另一種是線上獲取。
線下獲取是對(duì)各機(jī)構(gòu)數(shù)據(jù)的獲取,如,保險(xiǎn)公司關(guān)于車險(xiǎn)開(kāi)展調(diào)查,將各種車型的出險(xiǎn)數(shù)據(jù)及司機(jī)的駕駛習(xí)慣數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,進(jìn)而有針對(duì)性地提供保險(xiǎn)服務(wù);教育部門(mén)為了調(diào)查青少年心理健康,開(kāi)始每五年全國(guó)范圍大面積地獲取統(tǒng)計(jì)數(shù)據(jù),這些數(shù)據(jù)可以作為學(xué)術(shù)探究的參考。
線上搜集主要利用互聯(lián)網(wǎng)技術(shù)進(jìn)行,例如,獲取研究對(duì)象頻繁搜索的字詞,了解研究對(duì)象的網(wǎng)頁(yè)瀏覽速度、網(wǎng)站偏好以及點(diǎn)擊習(xí)慣等。與此同時(shí),電子設(shè)備也可將用戶的常用詞匯、軟件使用情況、通話時(shí)間等內(nèi)容傳遞給研究人員。再如,智能手環(huán)可將用戶的行走步數(shù)呈現(xiàn)出來(lái)。
其三,數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)是利用眾多信息采集工具獲取數(shù)據(jù)后整合而成。其與傳統(tǒng)數(shù)據(jù)庫(kù)相同點(diǎn)在于儲(chǔ)存功能強(qiáng)大,不同點(diǎn)在于支持?jǐn)?shù)據(jù)運(yùn)算處理,為決策提供參考條件。心理學(xué)及教育學(xué)研究需要將數(shù)據(jù)采集、篩選、處理、整合等,形成數(shù)據(jù)倉(cāng)庫(kù),為研究者提供有效信息。如,張強(qiáng)等三人獲取了所在地高二學(xué)生相關(guān)信息,建立了數(shù)據(jù)倉(cāng)庫(kù)并得到了最終研究結(jié)果,獲取了學(xué)生心理和成績(jī)、家庭特征、家長(zhǎng)受教育情況等內(nèi)容。
三、大數(shù)據(jù)視野下心理學(xué)與教育學(xué)的研究方法
(一)分類算法
分類算法中包括神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、支持向量機(jī)以及貝葉斯等分類形式,可為心理學(xué)及教育學(xué)研究奠定基礎(chǔ)。如,統(tǒng)計(jì)高校新生的心理、學(xué)習(xí)和生活情況建立分類樹(shù),最終有效判斷其初入新環(huán)境的適應(yīng)能力?,F(xiàn)階段,分類算法在心理學(xué)領(lǐng)域的研究應(yīng)用日益完善,而對(duì)于被研究者掌握的知識(shí)技能、答題速度以及考查知識(shí)的統(tǒng)計(jì)和研究也能作為教育教學(xué)的參考標(biāo)準(zhǔn),幫助教師從學(xué)生的角度出發(fā),制定符合學(xué)生心理特點(diǎn)和認(rèn)知能力的教學(xué)計(jì)劃。
(二)聚類分析法
聚類分析法需要將數(shù)據(jù)歸類整理,從同一階段的數(shù)據(jù)中尋找特征,將相似性強(qiáng)的數(shù)據(jù)集中歸類,與其他類別組間差距較大。例如,將A、B兩市的小學(xué)生作為研究主體,研究?jī)?nèi)容為適應(yīng)能力,以此為方向?qū)W(xué)生一分為三,第一種為交際良好,適應(yīng)能力強(qiáng)型;第二種為人際關(guān)系不佳,孤僻健談型;第三種為自尊心不強(qiáng)型。就此展開(kāi)調(diào)查,幫助教師有針對(duì)性地采取教學(xué)方法。
(三)關(guān)聯(lián)分析法
關(guān)聯(lián)分析要求數(shù)據(jù)間有必然聯(lián)系,如,超市銷售量的研究,其中交易數(shù)據(jù)即是銷量的最直接體現(xiàn),但還要分析相關(guān)商品之間的關(guān)聯(lián)性,如,牛奶和被子、泡面和泡面碗、水果和水果盒等,可以此為據(jù)關(guān)聯(lián)銷售,提升經(jīng)濟(jì)效益。關(guān)于心理學(xué)和教育學(xué)的例子,如,將高中學(xué)生作為研究對(duì)象,選取高一、高二學(xué)生的入學(xué)成績(jī)、現(xiàn)在成績(jī)、學(xué)習(xí)現(xiàn)狀、生活習(xí)慣、家庭狀況、自我評(píng)價(jià)內(nèi)容等,最終發(fā)現(xiàn)家庭狀況會(huì)對(duì)學(xué)生的成績(jī)產(chǎn)生影響,表現(xiàn)了心理與教育之間的關(guān)聯(lián)性。
(四)其他分析法
其一,貝葉斯分析法。將分類轉(zhuǎn)化為決策,為學(xué)術(shù)研究帶來(lái)了更多的可能性。如,獲取學(xué)生學(xué)習(xí)的行為,判斷其對(duì)任務(wù)執(zhí)行的態(tài)度;再如,通過(guò)學(xué)生學(xué)習(xí)情況,判斷預(yù)測(cè)學(xué)生的成績(jī)走向。
其二,數(shù)據(jù)可視化。若研究變量較少,可通過(guò)直方圖、散點(diǎn)圖、莖葉圖、餅圖等形式呈現(xiàn);若空間數(shù)據(jù)較多,則可使用等高線、切片圖等形式呈現(xiàn);數(shù)據(jù)變量較多,可通過(guò)平行坐標(biāo)系、矩陣等形式呈現(xiàn)。
其三,社會(huì)網(wǎng)分析法。社會(huì)行為中涉及到的內(nèi)容較為復(fù)雜多樣,研究主體可選擇組織、個(gè)體、社區(qū)、集體等,通過(guò)相互之間的關(guān)系和指標(biāo)來(lái)獲取研究結(jié)果。教育及心理學(xué)研究需要從社會(huì)網(wǎng)出發(fā),而網(wǎng)絡(luò)技術(shù)可作為研究媒介,例如,在微博上利用社會(huì)網(wǎng)分析方法,提取個(gè)體以及社會(huì)結(jié)構(gòu)的相關(guān)數(shù)據(jù),二者之間的深入探究是未來(lái)學(xué)術(shù)研究的主要發(fā)展方向。
四、大數(shù)據(jù)視野下心理學(xué)與教育學(xué)研究的主要特征
大數(shù)據(jù)視野下教育學(xué)和心理學(xué)研究的特征主要體現(xiàn)在以下幾方面。
首先,抽樣趨近于全面。以往研究多從局部出發(fā),利用抽樣調(diào)查的方法,將部分分析作為整體研究的代表,而大數(shù)據(jù)具有海量信息整合處理的能力,可將成千上萬(wàn)的樣本采集整合,生成數(shù)據(jù)結(jié)果。這些樣本可實(shí)現(xiàn)整體范圍的研究和調(diào)查,避免局限性或制約性,防止結(jié)果以偏概全。線上及線下數(shù)據(jù)的整合和積累可使數(shù)據(jù)參考價(jià)值更強(qiáng),打破時(shí)間或空間上的狹隘眭,使目標(biāo)選擇更為科學(xué)合理。
其次,定期調(diào)查轉(zhuǎn)變?yōu)閷?shí)時(shí)獲取。傳統(tǒng)研究中的調(diào)查問(wèn)卷、參考文獻(xiàn)或?qū)嶒?yàn)探究需要耗費(fèi)大量的時(shí)間和精力,而且由于抽查的對(duì)象自身情況不同,平均水平受到的外界干擾較多;調(diào)查環(huán)節(jié)還可能會(huì)受到個(gè)體素質(zhì)、時(shí)間、環(huán)境、狀態(tài)等影響。大數(shù)據(jù)獲取信息的方式主要源于網(wǎng)絡(luò),研究人員可足不出戶獲取被調(diào)查者的相關(guān)信息,通過(guò)雙向性的交流互動(dòng)獲取數(shù)據(jù)。無(wú)需面對(duì)面訪談,可打破時(shí)間和空間上的雙重局限。網(wǎng)絡(luò)系統(tǒng)還可直接將采集的信息進(jìn)行整合處理,在短時(shí)間內(nèi)制得統(tǒng)計(jì)圖,為分析提供依據(jù)。與此同時(shí),研究者和被研究者進(jìn)行一對(duì)一或一對(duì)多的互動(dòng),能實(shí)時(shí)掌握其情況,一旦發(fā)現(xiàn)不穩(wěn)定因素能在第一時(shí)間更改數(shù)據(jù),避免影響調(diào)查結(jié)果。
第三,主觀轉(zhuǎn)為客觀。傳統(tǒng)被調(diào)查者或多或少會(huì)在問(wèn)卷中滲入主觀色彩,如,實(shí)時(shí)情緒的變動(dòng),獲取的結(jié)果可能也與平時(shí)存在較大差距。大數(shù)據(jù)時(shí)代是客觀數(shù)據(jù)的獲取,通過(guò)長(zhǎng)時(shí)間規(guī)律性行為的掌控來(lái)判斷被調(diào)查者的心理活動(dòng),是一種無(wú)法自控的行為,這些數(shù)據(jù)不會(huì)受主觀意識(shí)所干擾,結(jié)果更為準(zhǔn)確。
第四,因果轉(zhuǎn)為精準(zhǔn)。傳統(tǒng)學(xué)術(shù)調(diào)查是由因溯果,存在一定的推導(dǎo)性,掌握的只是數(shù)據(jù)之間存在的關(guān)聯(lián)性或非關(guān)聯(lián)性,而大數(shù)據(jù)時(shí)代可以精確地獲得預(yù)測(cè)數(shù)據(jù),根據(jù)客觀精準(zhǔn)的結(jié)果制定調(diào)整和控制計(jì)劃,使研究方法更為先進(jìn)科學(xué)。
總之,大數(shù)據(jù)時(shí)代給心理學(xué)領(lǐng)域和教育學(xué)領(lǐng)域帶來(lái)了研究變革的契機(jī),研究人員應(yīng)打破結(jié)構(gòu)化研究的局限性,結(jié)合大數(shù)據(jù)內(nèi)容探索學(xué)術(shù)研究的更多可能性,從現(xiàn)階段研究出發(fā),發(fā)現(xiàn)數(shù)據(jù)之間的變化情況和關(guān)聯(lián)關(guān)系,借鑒以往成功經(jīng)驗(yàn),創(chuàng)造出更多有價(jià)值的信息內(nèi)容,確保大數(shù)據(jù)環(huán)境下研究的實(shí)效性。