• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    有關(guān)創(chuàng)造力測量的一些思考*

    2016-02-28 12:13:35沈汪兵2
    心理科學(xué)進(jìn)展 2016年1期
    關(guān)鍵詞:計(jì)分測驗(yàn)研究者

    貢 喆 劉 昌 沈汪兵2,

    (1南京師范大學(xué)心理學(xué)院暨認(rèn)知神經(jīng)科學(xué)實(shí)驗(yàn)室,南京 210097)

    (2河海大學(xué)公共管理學(xué)院暨應(yīng)用心理研究所,南京 210098)

    1 引言

    創(chuàng)造力概念一般被認(rèn)為包括兩大核心特質(zhì):新穎性(originality)和適宜性(appropriateness)。其中,新穎性意味著:創(chuàng)造性思維和產(chǎn)品應(yīng)相對于創(chuàng)造者自身或創(chuàng)新環(huán)境而言具有新穎、獨(dú)特的品質(zhì);適宜性則可以歸納為:創(chuàng)造性思維和產(chǎn)品對創(chuàng)造者自身或問題情境具備“有用性”(useful)或是對創(chuàng)新環(huán)境“有價(jià)值”(valuable)。這兩大核心特質(zhì)是創(chuàng)造力與其它相近概念的根本不同,亦是從概念上判別創(chuàng)造力的基本標(biāo)準(zhǔn)。依托于此類創(chuàng)造力基本概念,研究者進(jìn)一步對創(chuàng)造力概念展開量化研究,其中首要的課題即是測量創(chuàng)造力。創(chuàng)造力測量,即依據(jù)一定的創(chuàng)造力理論,使用測驗(yàn)對創(chuàng)造力進(jìn)行定量描述的過程。研究者一般認(rèn)為, 1883年高爾頓發(fā)表的《對人類能力的探求》(Inquiries into Human Faculty)喚起了人們測量創(chuàng)造力的興趣,直到1950年吉爾福特在美國心理學(xué)會上的演講后,創(chuàng)造力測量領(lǐng)域的研究開始進(jìn)入高峰期(Plucker&Renzulli,1999)。這表現(xiàn)在,一方面,創(chuàng)造力測量成為創(chuàng)造力研究的方法學(xué)基礎(chǔ),它為進(jìn)一步研究創(chuàng)造力提供有力支持。一項(xiàng)研究報(bào)告表明,各種創(chuàng)造力量表和問卷是創(chuàng)造力研究中收集信息的第一選擇,遠(yuǎn)遠(yuǎn)多于訪談法或文獻(xiàn)分析(Hürsen,Kaplan,&?zdal,2014);另一方面,各種創(chuàng)造力測量技術(shù)蓬勃發(fā)展,研究者圍繞創(chuàng)造力 主 體 (Domino,1970;Gough,1979;Kirton, 1976)、創(chuàng)造性思維過程(Guilford,1967;Mednick, 1962;Torrance,1972)、創(chuàng)造性產(chǎn)品(Amabile,1982; Besemer&O'Quin,1987)以及創(chuàng)造性環(huán)境(Amabile, Conti,Coon,Lazenby,&Herron,1996)四個(gè)方面對創(chuàng)造力展開測量研究,創(chuàng)造力測驗(yàn)從量和質(zhì)上都獲得飛躍式發(fā)展。Torrance和Goff(1989)在20余年前的報(bào)告中提到,在當(dāng)時(shí)學(xué)術(shù)界已經(jīng)有不少于255種創(chuàng)造力測驗(yàn)。雖然暫時(shí)未能發(fā)現(xiàn)較新的統(tǒng)計(jì)數(shù)據(jù),但可以想見的是,創(chuàng)造力測驗(yàn)的數(shù)量早已遠(yuǎn)遠(yuǎn)超過Torrance和Goff(1989)當(dāng)年的估算?,F(xiàn)如今,創(chuàng)造力測驗(yàn)已經(jīng)應(yīng)用于社會生活的各個(gè)領(lǐng)域,例如:數(shù)學(xué)(Tan,Mourgues,Bolden,& Grigorenko,2014);機(jī)械(Colangelo,Kerr,Hallowell, Huesman,&Gaeth,1992);漫畫(Chou,Chen,&Chou, 2014);就業(yè)市場(Paprika&Nagy,2012);網(wǎng)頁設(shè)計(jì)(Zeng,Proctor&Salvendy,2012);科學(xué)研究(Ayas&Sak;2014);教育實(shí)踐(Blamires&Peterson, 2014);工程規(guī)劃(Charyton&Merrill,2009)等等。

    然而,創(chuàng)造力測量領(lǐng)域,特別是各種創(chuàng)造力測驗(yàn)在近幾十年的發(fā)展中是否交出了一幅滿意的答卷呢?我們或許要先打上問號。研究者普遍認(rèn)為,創(chuàng)造力測量領(lǐng)域相較于創(chuàng)造力其他研究領(lǐng)域發(fā)展更為滯后(Plucker&Makel,2010;Silvia, Wigert,Reiter-Palmon,&Kaufman,2012)。作為心理測量領(lǐng)域和創(chuàng)造力研究領(lǐng)域的交集,創(chuàng)造力測驗(yàn)一些關(guān)鍵的測量指標(biāo)飽受詬病。例如:Simonton (2003)曾經(jīng)激烈抨擊現(xiàn)有創(chuàng)造力測驗(yàn):“那些推薦的創(chuàng)造力測量手段沒有一個(gè)能跨過能力測驗(yàn)所必需邁過的心理測量障礙。例如:創(chuàng)造力各種分測驗(yàn)的分?jǐn)?shù)與一般智力相關(guān)太高,這意味著區(qū)分效度(divergent validity)低下;而這些分測驗(yàn)之間相關(guān)卻又太低,這又說明聚合效度(convergent validity)低下;創(chuàng)造力測驗(yàn)分?jǐn)?shù)和客觀的創(chuàng)造力行為指標(biāo)相關(guān)很弱,這還代表預(yù)測效度(predictive validity)低下?!痹谥T多討伐聲中,創(chuàng)造力測驗(yàn)缺乏預(yù)測效度或許是最為嚴(yán)重的問題(Kaufman&Baer, 2012;Zeng,Proctor,&Salvendy,2011),這甚至可能意味著許多創(chuàng)造力測驗(yàn)事實(shí)上是無效的。

    既然如此,那么如何更準(zhǔn)確的測量創(chuàng)造力?為了回答這個(gè)問題,研究者從未停止努力的腳步,他們圍繞創(chuàng)造力測量的熱點(diǎn)問題進(jìn)行研究,提出了多種改進(jìn)方案。例如:創(chuàng)新測驗(yàn)方法(Prabhakaran, Green,&Gray,2014);豐富計(jì)分手段(Benedek, Mühlmann,Jauk,&Neubauer,2013);完善統(tǒng)計(jì)措施(Primi,2014);評估測驗(yàn)合理性(Lee,Huggins, &Therriault,2014)等等。這些創(chuàng)造力測量技術(shù)的新進(jìn)展,大大推進(jìn)了創(chuàng)造力測量的客觀性與實(shí)用性。鑒于國外有關(guān)創(chuàng)造力測量技術(shù)的權(quán)威綜述發(fā)表較早,且內(nèi)容類似(見Plucker&Renzulli,1999; Plucke&Makel,2010),國內(nèi)更缺乏與之相關(guān)的前沿介紹,因此極有必要對近幾年創(chuàng)造力測量的最新進(jìn)展進(jìn)行綜述。

    需要說明的問題是:第一,由于近幾年創(chuàng)造性思維過程測驗(yàn)和創(chuàng)造性產(chǎn)品測驗(yàn)的應(yīng)用更為廣泛深入,因此本文主要圍繞這兩個(gè)角度選取運(yùn)用最多、爭議最大的4類主流測量技術(shù)進(jìn)行綜述,其中既包括創(chuàng)造力測驗(yàn),即:發(fā)散思維測驗(yàn)、頓悟類測驗(yàn)、創(chuàng)造力成就測驗(yàn);也包括評分技術(shù),即:同感評估技術(shù)。同時(shí)值得注意的是,從嚴(yán)格意義上看,這4類主流測量技術(shù)并不能被認(rèn)為只隸屬于創(chuàng)造性思維測驗(yàn)或創(chuàng)造性產(chǎn)品測驗(yàn)的范疇,它們在實(shí)際應(yīng)用中往往較為靈活。例如:發(fā)散思維測驗(yàn)一般可歸類為創(chuàng)造性思維測驗(yàn),但是發(fā)散思維的成果也可視為創(chuàng)造性的產(chǎn)品,研究者是根據(jù)思維的產(chǎn)物評定其是否有創(chuàng)造性的。因此如果從這個(gè)角度出發(fā),把發(fā)散思維測驗(yàn)歸于測量創(chuàng)造性產(chǎn)品的測驗(yàn)亦無不可。又如:同感評估技術(shù)作為一種評分技術(shù),既可應(yīng)用于多種發(fā)散思維測驗(yàn),亦可運(yùn)用于某類產(chǎn)品的創(chuàng)造性評估乃至創(chuàng)造性環(huán)境的測評。第二,本文無意于細(xì)致羅列各種創(chuàng)造力測驗(yàn)的具體操作方法,該部分內(nèi)容可見由Kaufman,Plucker和Baer(2008)編著的《Essential of Creativity Assessment》。

    下文依次對4類主流創(chuàng)造力測量技術(shù)的最新進(jìn)展及熱點(diǎn)問題進(jìn)行評述,最后展望創(chuàng)造力測量未來的發(fā)展方向。

    2 發(fā)散思維測驗(yàn)

    發(fā)散思維測驗(yàn)(divergent thinking test)一般以開放性問題的形式呈現(xiàn),要求被試盡可能多的根據(jù)題目要求羅列答案。發(fā)散思維測驗(yàn)有多種分類方法,例如,從測驗(yàn)形式將其分為:語言測驗(yàn)、圖形測驗(yàn)以及動作測驗(yàn);或從測驗(yàn)內(nèi)容將其分為:靈活使用任務(wù)或多用途任務(wù)(alternate use task) (給普通物品設(shè)計(jì)多種新穎用法),舉例任務(wù)(instance task)(在普通種類中例舉新穎物品)以及結(jié)果任務(wù)(consquence task)(設(shè)想某種虛擬條件下可能產(chǎn)生的新穎結(jié)果)(Silvia,2011);又或從領(lǐng)域一般性及特殊性(domain general-specific)角度將其區(qū)分為:領(lǐng)域一般性發(fā)散思維測驗(yàn),或領(lǐng)域特殊性發(fā)散思維測驗(yàn)。發(fā)散思維測驗(yàn)適用于個(gè)體或團(tuán)體施測,且普及各個(gè)年齡段,是應(yīng)用最為廣泛的創(chuàng)造力測驗(yàn)形式。使用頻率較高的發(fā)散思維測驗(yàn)是:Guilford(1967)的智力結(jié)構(gòu)測驗(yàn)(Structure of the Intellect,SOI);Torrance(1972)的托蘭斯創(chuàng)造力測驗(yàn)(Torrance Tests of Creative Thinking,TTCT)等等。

    發(fā)散思維測驗(yàn)的基本理論假設(shè)是:創(chuàng)造力水平高的個(gè)體相較于普通人,最顯著的特點(diǎn)在于他們能夠從多角度思考并解決問題。因此,通過開放性問題評定個(gè)體發(fā)散思維水平,就能夠預(yù)測個(gè)體創(chuàng)造力潛能。然而,該假設(shè)并未準(zhǔn)確切中創(chuàng)造性思維的兩大核心特質(zhì),即新穎性和適宜性。首先,個(gè)體能夠?qū)δ硢栴}從多角度進(jìn)行思考和解答,未必是創(chuàng)造性思維新穎性的體現(xiàn),反映的可能只是個(gè)體在長時(shí)記憶中存儲的與該問題相關(guān)的信息數(shù)量(Leon,Altmann,Abrams,Gonzalez Rothi,& Heilman,2014)。同樣,個(gè)體從多角度思考問題也不意味其思維具有適宜性。理論層面的缺失可能進(jìn)一步給實(shí)證研究帶來不利影響。例如:研究者在采用發(fā)散思維測驗(yàn)時(shí)就經(jīng)常忽視適宜性維度,缺乏適宜性的限制,一些不合邏輯的“新穎”想法就會和創(chuàng)造性思維混為一談。當(dāng)該類測驗(yàn)應(yīng)用于特殊群體時(shí),問題可能會集中出現(xiàn)。Fink,Slamar-Halbedl,Unterrainer和Weiss(2012)的研究發(fā)現(xiàn)創(chuàng)造力與精神質(zhì)(psychoticism)存在顯著正相關(guān),原因可能在于他們在應(yīng)用發(fā)散思維測驗(yàn)時(shí)并沒有考慮適宜性維度,這就會把一些明顯不合理的答案判定為高新穎性,最終可能導(dǎo)致高估高精神質(zhì)個(gè)體的創(chuàng)造力水平。雖然該問題能夠通過改良新穎性計(jì)分的方式彌補(bǔ)(Silvia et al.,2008),但由此可見,發(fā)散思維測驗(yàn)基本理論假設(shè)存在的不足,可能引發(fā)一系列應(yīng)用問題,這需要引起研究者的足夠重視。

    發(fā)散思維測驗(yàn)的應(yīng)用最為廣泛,在某種程度上或許可稱之為創(chuàng)造力測驗(yàn)的“代言人”。然而,發(fā)散思維測驗(yàn)在獲得更多關(guān)注的同時(shí)也遭到更多指責(zé)。發(fā)散思維測驗(yàn)的客觀性、信度以及效度問題都飽受爭議(Baer,2011;Benedek,K?nen,&Neubauer, 2012;Zeng et al.,2011)。Zeng等人(2011)曾羅列了發(fā)散思維測驗(yàn)的六大“罪狀”,主要包括:缺乏結(jié)構(gòu)效度、未能整合創(chuàng)造性思維過程、對領(lǐng)域特殊性及專業(yè)知識的忽視、預(yù)測能力較弱以及缺乏生態(tài)效度和區(qū)分效度。Baer(2011)還曾在美國心理協(xié)會會議上呼吁盡量避免使用諸如“易拉罐不同尋常的用法”之類的發(fā)散思維測驗(yàn),他認(rèn)為這種測驗(yàn)根本不是創(chuàng)造性思維合理的測量方式,繼續(xù)使用它們只會令創(chuàng)造力研究步入泥沼。

    但同時(shí)也有大量研究表明發(fā)散思維具備良好的信、效度(Beaty,Smeekens,Silvia,Hodges,& Kane,2013;Hong,Milgram,&Gorsky,1995;Kim, 2008)。由于發(fā)散思維測驗(yàn)信、效度指標(biāo),特別是效度指標(biāo)積累了大量矛盾結(jié)論,因此,目前仍然無法確定發(fā)散思維測驗(yàn)是否“完全”可信且有效,圍繞此問題的爭論勢必一直存在。不過于此同時(shí),研究者開始逐漸意識到發(fā)散思維測驗(yàn)只是針對創(chuàng)造力潛能的一種估計(jì)(Runco&Acar,2012),潛能的發(fā)揮除了依靠能力本身,還需要知識、技能、心理健康乃至機(jī)遇(Cropley,2000)。不僅如此,越來越多研究者傾向于支持創(chuàng)造力具有領(lǐng)域特殊性(Baer,2011;Pretz&McCollum,2014),簡言之即創(chuàng)造力在不同領(lǐng)域具有差異化表現(xiàn),創(chuàng)造力測驗(yàn)亦是如此。因此,一種更為合理的推測是:發(fā)散思維測驗(yàn)?zāi)軌蛟谝欢ǔ潭壬嫌行гu定和預(yù)測創(chuàng)造力水平,但有賴于不同領(lǐng)域。例如:Clapham,Cowdery, King和Montang(2005)的研究就發(fā)現(xiàn),智力結(jié)構(gòu)測驗(yàn)(SOI)中與機(jī)械能力有關(guān)的分量表,比智力結(jié)構(gòu)測驗(yàn)(SOI)測驗(yàn)總分對創(chuàng)造力行為和專利數(shù)量有更好的預(yù)測作用;Runco,Millar,Acar和Cramond (2010)一項(xiàng)針對托蘭斯創(chuàng)造力測驗(yàn)(TTCT)長達(dá)50年的縱向研究表明,托蘭斯創(chuàng)造力測驗(yàn)(TTCT)與個(gè)體一些創(chuàng)造力行為有中等相關(guān),但和個(gè)體社會層面的創(chuàng)造性成就無關(guān)。據(jù)此可見,從整體上判定發(fā)散思維測驗(yàn)是否有效實(shí)際上并不妥當(dāng),從不同角度出發(fā),歸納多測驗(yàn)在多領(lǐng)域中的表現(xiàn),分別總結(jié)其信、效度數(shù)據(jù)或許是更為合理的方法。

    對發(fā)散思維測驗(yàn)計(jì)分方法的爭論與改進(jìn)是近年來創(chuàng)造力測量領(lǐng)域的熱點(diǎn)問題,也是發(fā)散思維測驗(yàn)研究的重要突破。發(fā)散思維測驗(yàn)通常包括對被試答案流暢性(fluency)、變通性(flexibility)以及獨(dú)特性(uniqueness)或新穎性(originality)的計(jì)分。其中,由于發(fā)散思維測驗(yàn)中多將獨(dú)特性維度和新穎性維度視為等同(Benedek et al.,2013),因此本文統(tǒng)一采用“獨(dú)特性”表征該維度。學(xué)術(shù)界對流暢性和變通性的計(jì)分較為統(tǒng)一,前者即清點(diǎn)被試答案的個(gè)數(shù),后者即計(jì)算被試答案囊括的不同種類。而發(fā)散思維測驗(yàn)獨(dú)特性維度的計(jì)分方法則一直存有爭議。較早的經(jīng)典計(jì)分方法為:研究者將所有答案匯總,如果某個(gè)答案是特殊的,即唯一的,那么該答案計(jì)1分,其他答案記0分。該計(jì)分方法直觀明了,較好的反映了創(chuàng)造力“獨(dú)特性”的含義,得到了一定程度上的運(yùn)用。其他獨(dú)特性計(jì)分方法還有:列出一張非獨(dú)特性答案對照表,如果被試答案不在該表上,即可以在獨(dú)特性維度上計(jì)分;還有方法給樣本中少于5%的答案記1分,給其它答案記0分。這一類方法采用一種計(jì)分模式,即被試憑借獨(dú)特性答案得分,分?jǐn)?shù)最后相加成為獨(dú)特性指標(biāo)(Silvia et al.,2008)。

    然而此類方法的問題在于:第一,流暢性和獨(dú)特性分?jǐn)?shù)間相關(guān)過高,二者的含義會因此發(fā)生混淆(Clark&Mirels,1970)。Silvia(2008)一項(xiàng)潛變量分析研究就發(fā)現(xiàn),潛在流暢性和獨(dú)特性變量相關(guān)極高(r=0.88)。依照研究者對流暢性和獨(dú)特性的定義,如果說流暢性是發(fā)散思維量的指標(biāo),那么獨(dú)特性即為發(fā)散思維質(zhì)的指標(biāo),質(zhì)需要具有其相對獨(dú)立性。但既有研究結(jié)果卻揭示二者間存在不可忽視的高相關(guān),這導(dǎo)致獨(dú)特性分?jǐn)?shù)難以越過流暢性分?jǐn)?shù)的影響對其他變量進(jìn)行解釋(Silvia et al., 2008),因此有研究者甚至稱流暢性為污染變量(Hocevar,1979;Kaufman et al.,2008)。第二:獨(dú)特性分?jǐn)?shù)極易受到樣本量誤差的干擾。一個(gè)可以預(yù)見的情況是,在一項(xiàng)發(fā)散思維測驗(yàn)里,如果實(shí)驗(yàn)只有30個(gè)樣本,那么被試的很多答案都可能被認(rèn)定為“特殊”,但當(dāng)樣本擴(kuò)充到300個(gè)乃至更多時(shí),原先“特殊”的答案可能將只是一個(gè)普通答案。當(dāng)樣本數(shù)量極大時(shí),甚至可能出現(xiàn)沒有獨(dú)特性答案的現(xiàn)象(Nusbaum&Silvia,2011)。第三,對答案獨(dú)特性的判定需要同時(shí)考量其是否合理,因?yàn)閯?chuàng)造力還內(nèi)在具有適宜性的含義。依照傳統(tǒng)計(jì)分方法,一些古怪、奇特的答案很可能被納入獨(dú)特性得分的范疇,例如:磚頭的用途,某個(gè)答案是“吃”。該答案誠然非常特殊,但這顯然并不合理,因此不應(yīng)當(dāng)屬于創(chuàng)造力的范疇。

    Silvia,Martin和Nusbaum(2009)認(rèn)為可以借助主觀計(jì)分法解決傳統(tǒng)獨(dú)特性計(jì)分方法的問題,他們要求被試在限時(shí)發(fā)散思維任務(wù)中給出有創(chuàng)意的答案,并要求評定者依照不尋常、遠(yuǎn)距離以及聰明三個(gè)指標(biāo),對被試給出的答案在5點(diǎn)量表上打分(Silvia et al.,2008)。采取主觀計(jì)分法的優(yōu)點(diǎn)在于,第一:流暢性和獨(dú)特性指標(biāo)間不再混淆。多項(xiàng)研究表明采用主觀計(jì)分法后流暢性和獨(dú)特性相關(guān)程度顯著減小(Benedek et al.,2013;Primi, 2014;Silvia et al.,2008;Silvia,Nusbaum,Berg, Martin,&O’Connor,2009)。第二,獨(dú)特性水平直接由評定者判定,因此獨(dú)特性分?jǐn)?shù)不再受到樣本量的干擾。第三,一些明顯不符合創(chuàng)造力的古怪答案在主觀計(jì)分中可以進(jìn)行更為準(zhǔn)確的判斷并加以剔除。

    發(fā)散思維測驗(yàn)的主觀計(jì)分方法主要包括:平均得分法(average scoring)和最優(yōu)項(xiàng)法(Top scoring)。平均得分法即對被試某一道題目多個(gè)答案的得分進(jìn)行平均,得到其創(chuàng)造力的整體評價(jià),用商數(shù)代替求和可以較好的規(guī)避流暢性和獨(dú)特性計(jì)分的混淆問題。最優(yōu)項(xiàng)法即要求被試在回答完每道問題后自行圈出其認(rèn)為最有創(chuàng)造力的幾個(gè)答案(答案的數(shù)量由實(shí)驗(yàn)者確定,另根據(jù)Benedek等人(2013)的研究表明,選擇3~6個(gè)最優(yōu)答案測驗(yàn)效度最佳),評定者只對這幾個(gè)答案進(jìn)行評價(jià),評價(jià)后求平均數(shù)以表征其創(chuàng)造力。Silvia等人(2008)的研究表明,當(dāng)采用傳統(tǒng)計(jì)分方法時(shí),數(shù)據(jù)信度表現(xiàn)最差,只有使用不低于15個(gè)測驗(yàn)任務(wù)時(shí),測驗(yàn)的可靠性指數(shù)才能達(dá)到0.80水平。但通常情況下,研究者在實(shí)驗(yàn)中使用的測驗(yàn)任務(wù)不會超過4個(gè);而平均得分法和最優(yōu)項(xiàng)法在信度上都表現(xiàn)較好;在效度上最優(yōu)項(xiàng)法比平均得分法更佳,其解釋力為平均得分法的兩倍,原因可能在于最優(yōu)項(xiàng)法省略了許多缺乏創(chuàng)意的答案,因此可以傳遞更多有價(jià)值的信息。Benedek等人(2013)認(rèn)為,平均得分法由于對被試的所有答案進(jìn)行平均,可能導(dǎo)致一些關(guān)鍵信息的丟失。例如:某高創(chuàng)造性個(gè)體在5個(gè)答案中有兩個(gè)是特別有創(chuàng)意的答案,其余3個(gè)答案只是隨意寫下的,其創(chuàng)造力平均得分將會是居中水平;而某個(gè)普通創(chuàng)造性個(gè)體寫下的5個(gè)答案可能既沒有富有創(chuàng)意的答案,但同時(shí)也沒有隨意寫下的答案,因此其創(chuàng)造力平均得分同樣是居中。最優(yōu)項(xiàng)法突出了其最具創(chuàng)意的答案,省略了相對次要的內(nèi)容,因此在實(shí)際操作中,最優(yōu)項(xiàng)法保留了被試創(chuàng)造力信息中更有代表性的部分。雖然也有研究表明(Plucker,Qian,&Wang,2011)平均得分法在幾類主觀計(jì)分方法中表現(xiàn)最好,但原因可能在于Plucker等人(2011)的研究中未要求被試自行圈出最有創(chuàng)意的答案,被試前10個(gè)答案或后10個(gè)答案不等于其最優(yōu)答案??傊?究竟哪一種方法更為合適,仍有待于進(jìn)一步研究佐證。

    除此之外,為進(jìn)一步提高主觀計(jì)分法的效率, Silvia等(2009)還創(chuàng)制快照評定法(snapshot scoring)對發(fā)散思維測驗(yàn)進(jìn)行計(jì)分。不同于一般主觀計(jì)分方法,快照評定法只需要評定者對被試某道題目的答案進(jìn)行整體評判,而不需要對被試的每一個(gè)答案進(jìn)行打分,這無疑能節(jié)省大量的時(shí)間,且根據(jù)現(xiàn)有研究成果,快照評定法具備較好的可操作性和可信度,得到了不少研究者的采納。但同時(shí)需要注意的是,根據(jù)Silvia等(2009)的研究報(bào)告表明,快照評定法相較于一般主觀評定方法可能會令測驗(yàn)結(jié)果在一定程度上受損。

    以上研究雖然傾向于支持主觀計(jì)分方法,但同時(shí)也有研究者提出質(zhì)疑,Lee(2008)就對Silvia等人(2008)的研究報(bào)告提出了批評,他認(rèn)為主觀評價(jià)法實(shí)際上無法真正避免傳統(tǒng)計(jì)分方法的弊端。例如:最優(yōu)項(xiàng)法要求被試自行選取最有創(chuàng)意的答案,但當(dāng)要求被試寫出更多答案的時(shí)候,出現(xiàn)更特殊答案的可能性同樣提高了,此時(shí)流暢性和獨(dú)特性并未真正分離。不僅如此,主觀自評的計(jì)分方式還會帶來更多問題。例如:最優(yōu)項(xiàng)法容易導(dǎo)致積極偏見(positive bias),即通過該計(jì)分方法得到創(chuàng)造力分?jǐn)?shù)可能遠(yuǎn)高于其真實(shí)水平,在效標(biāo)參照測驗(yàn)中這將會帶入系統(tǒng)誤差。Primi(2014)也指出,當(dāng)采用主觀計(jì)分法時(shí),評定者的標(biāo)準(zhǔn)可能各有高低,當(dāng)一組標(biāo)準(zhǔn)較高的評定者對被試進(jìn)行打分時(shí),被試的得分將系統(tǒng)性降低,這勢必會引入誤差。因此,Primi(2014)認(rèn)為,應(yīng)當(dāng)通過統(tǒng)計(jì)手段評估主觀計(jì)分法可能帶來的誤差,如借助項(xiàng)目反應(yīng)理論(item response theory)中的羅舒模型(Rasch model)對數(shù)據(jù)實(shí)現(xiàn)標(biāo)準(zhǔn)化處理,以便比較評定者之間標(biāo)準(zhǔn)的高低。

    總而言之,盡管發(fā)散思維測驗(yàn)在信、效度問題上承受了很大責(zé)難,但是學(xué)術(shù)界對發(fā)散思維測驗(yàn)的革新遠(yuǎn)未停止。因此研究者依然對發(fā)散思維測驗(yàn)抱有極大信心(Kim,2011;Runco&Acar, 2012)。可以說,迄今為止,發(fā)散思維測驗(yàn)仍然是測量創(chuàng)造力的第一選擇。

    3 頓悟類測驗(yàn)

    發(fā)散思維是由意識引導(dǎo),解決界定清晰問題的創(chuàng)造性思維過程,執(zhí)行功能對發(fā)散思維起到關(guān)鍵作用。與之相反,創(chuàng)造性思維還具備通過無意識自動聯(lián)想,解決界定模糊任務(wù)的能力(Mednick, 1962)。某問題界定模糊意味著,解決該問題的方法和途徑不明確,此時(shí)個(gè)體需要借助一系列認(rèn)知加工實(shí)現(xiàn)對問題的解決,并繼而產(chǎn)生頓悟的“啊哈”體驗(yàn)。研究者圍繞該創(chuàng)造性思維設(shè)計(jì)了一系列創(chuàng)造力問題和測驗(yàn),本文將這一類問題和測驗(yàn)概述為頓悟類測驗(yàn)。頓悟類測驗(yàn)的基本理論假設(shè)是:高創(chuàng)造性個(gè)體能夠憑借諸如:遠(yuǎn)距離聯(lián)想、思維重組、原型啟發(fā)等認(rèn)知加工過程整合并處理與目標(biāo)有關(guān)的信息,從而更好的解決頓悟問題,并產(chǎn)生頓悟體驗(yàn)。該假設(shè)邏輯與創(chuàng)造性思維兩大核心特質(zhì)新穎性與適宜性的結(jié)合較好,不難想象,能夠解答某頓悟問題的答案和策略,勢必是較為新穎且適用于該問題情境的。其中應(yīng)用最廣的是Mednick(1962)的遠(yuǎn)距離聯(lián)想測驗(yàn)(remote associates test,RAT)。

    Mednick(1962)認(rèn)為創(chuàng)造性思維的本質(zhì)是聯(lián)想。他提出創(chuàng)造力包含“將關(guān)聯(lián)的要素結(jié)合以滿足某種特定需求或使之有用”的過程,且個(gè)體間創(chuàng)造力的差異往往表現(xiàn)在操作聯(lián)想思維過程上的不同,因此,Mednick(1962)假設(shè)個(gè)體有聯(lián)想等級(associative hierarchy)的差異。具體表現(xiàn)為:創(chuàng)造力高的個(gè)體能夠連接距離更遙遠(yuǎn)的要素,據(jù)此理論假設(shè),Mednick(1962)創(chuàng)立了影響深遠(yuǎn)的遠(yuǎn)距離聯(lián)想測驗(yàn)。遠(yuǎn)距離聯(lián)想測驗(yàn)一般由30個(gè)項(xiàng)目構(gòu)成,每個(gè)項(xiàng)目包括三個(gè)詞匯,要求被試根據(jù)所呈現(xiàn)的三個(gè)詞匯進(jìn)行聯(lián)想,填入與之相關(guān)的新詞。以英文版遠(yuǎn)距離聯(lián)想測驗(yàn)為例,如:光(light),生日(birthday),蠟(wax),正確答案應(yīng)為:蠟燭(candle)。遠(yuǎn)距離聯(lián)想測驗(yàn)在過去幾十年中于創(chuàng)造力、聯(lián)想、頓悟乃至記憶、精神病理學(xué)等研究領(lǐng)域中得到了廣泛運(yùn)用(Aiello,Jarosz,Cushen,&Wiley,2012; Fodor,1999;Storm,Angello,&Bjork,2011),我國也有系統(tǒng)介紹其使用方法的綜述出現(xiàn)(王燁,余榮軍,周曉林,2005),同時(shí)中文版遠(yuǎn)距離聯(lián)想測驗(yàn)的修訂工作也有所進(jìn)展(李良敏,羅玲玲,劉武, 2015)。

    相較于發(fā)散思維測驗(yàn),遠(yuǎn)距離聯(lián)想測驗(yàn)最鮮明的特點(diǎn)是,測驗(yàn)中的題目具備唯一的正確答案。如上文所述,發(fā)散思維測驗(yàn)要求被試針對某一問題進(jìn)行多角度的回答,被試答案的流暢性、變通性是極其重要的考量指標(biāo)。遠(yuǎn)距離聯(lián)想測驗(yàn)并不接受多種可能的答案,因?yàn)轭}目中已經(jīng)暗含了唯一且最佳的答案。然而,遠(yuǎn)距離聯(lián)想測驗(yàn)這一特性引發(fā)的爭執(zhí)隨之產(chǎn)生。早已經(jīng)有研究指出,具有“唯一解”的遠(yuǎn)距離聯(lián)想測驗(yàn)實(shí)際上與智力測驗(yàn)的結(jié)構(gòu)更為類似,且遠(yuǎn)距離測驗(yàn)與發(fā)散思維測驗(yàn)相關(guān)程度很低(Laughlin,Doherty,&Dunn,1968; Taft&Rossiter,1967),因此遠(yuǎn)距離聯(lián)想測驗(yàn)是否能反映個(gè)體的創(chuàng)造力水平?為闡明這一問題,有研究者通過分析遠(yuǎn)距離聯(lián)想測驗(yàn)的內(nèi)、外部結(jié)構(gòu)效度以明確該測驗(yàn)真實(shí)反映的心理機(jī)能(Chermahini, Hickendorff,&Hommel,2012;Lee et al.,2014)。例如:Lee等人(2014)的研究發(fā)現(xiàn),遠(yuǎn)距離聯(lián)想測驗(yàn)的結(jié)果不僅與發(fā)散思維測驗(yàn)的相關(guān)程度很低(r=?0.05~0.13),還與經(jīng)驗(yàn)開放性人格呈負(fù)相關(guān)(r=?0.02)。在過往研究中,經(jīng)驗(yàn)開放性人格能夠顯著預(yù)測個(gè)體發(fā)散思維水平;形成鮮明對比的發(fā)現(xiàn)是,遠(yuǎn)距離聯(lián)想測驗(yàn)同流體智力、言語智力則具備較高正相關(guān)(r=0.33~0.42)。Lee和Therriault(2013)在結(jié)構(gòu)方程模型中將遠(yuǎn)距離聯(lián)想測驗(yàn)當(dāng)做聚合思維這一潛變量的指標(biāo),他們的研究發(fā)現(xiàn),聯(lián)想類、聚合類以及發(fā)散類思維表征創(chuàng)造力不同的認(rèn)知結(jié)構(gòu),諸如工作記憶、智力等變量比起發(fā)散思維水平能夠更好的預(yù)測個(gè)體的聚合思維水平。這些研究繼續(xù)驗(yàn)證了已有觀點(diǎn),即遠(yuǎn)距離聯(lián)想測驗(yàn)和發(fā)散測驗(yàn)的確測量了不同的心理品質(zhì)。更為重要的是Benedek等人(2012)的研究發(fā)現(xiàn),聯(lián)想思維實(shí)際在發(fā)散思維的運(yùn)用中起到基礎(chǔ)作用,他們的研究表明4項(xiàng)聯(lián)想類任務(wù)能夠解釋發(fā)散思維半成的變異,而在過去,由于遠(yuǎn)距離聯(lián)想測驗(yàn)和發(fā)散思維相關(guān)低下,研究者往往認(rèn)為聯(lián)想思維與發(fā)散思維毫無關(guān)系。該研究在一定程度上說明,遠(yuǎn)距離聯(lián)想測驗(yàn)或許很接近傳統(tǒng)智力測驗(yàn),但它仍然是創(chuàng)造力測驗(yàn)?,F(xiàn)在,越來越多的研究者傾向于認(rèn)為,遠(yuǎn)距離聯(lián)想測驗(yàn)或許不涉及傳統(tǒng)產(chǎn)生性、發(fā)散性的創(chuàng)造力機(jī)制,它更著重于聚合性的創(chuàng)造力品質(zhì)。

    但同時(shí),Lee等人(2014)也指出,遠(yuǎn)距離聯(lián)想測驗(yàn)與智力測驗(yàn)有極高相關(guān)仍可能存在兩種迥然不同的結(jié)論:第一,遠(yuǎn)距離聯(lián)想測驗(yàn)確實(shí)表征聚合性創(chuàng)造力;第二,與之完全相反,遠(yuǎn)距離聯(lián)想測驗(yàn)可能仍舊只是與智力測驗(yàn)類似的分析思維測驗(yàn)。因此,遠(yuǎn)距離聯(lián)想測驗(yàn)是否真能反映個(gè)體創(chuàng)造力水平?有關(guān)該測驗(yàn)預(yù)測效度的數(shù)據(jù),特別是遠(yuǎn)距離聯(lián)想測驗(yàn)與創(chuàng)造力成就之間的關(guān)系就十分重要。然而該研究領(lǐng)域目前仍然非常缺乏,所以研究者在使用和解釋遠(yuǎn)距離聯(lián)想測驗(yàn)時(shí)仍然需要非常謹(jǐn)慎。

    除了遠(yuǎn)距離聯(lián)想測驗(yàn),其他頓悟類測驗(yàn)還有諸如經(jīng)典的鄧克爾蠟燭問題(Duncker,1945);九點(diǎn)問題;“腦筋急轉(zhuǎn)彎式”頓悟問題(DeYoung, Flanders,&Peterson,2008);我國研究者設(shè)計(jì)的三字謎頓悟、原型啟發(fā)頓悟等等(沈汪兵,劉昌,張小將,陳亞林,2011;羅俊龍等,2012)。但通過仔細(xì)分析可以發(fā)現(xiàn),一些廣泛使用的聯(lián)想頓悟問題實(shí)際最早屬于問題解決范疇,主要用于探討定勢對解決問題的作用,雖然打破定勢是創(chuàng)造性思維的重要環(huán)節(jié),但其并非是創(chuàng)造力水平可靠的評定標(biāo)準(zhǔn)。Beaty,Nusbaum和Silvia(2014)的研究就發(fā)現(xiàn),解決頓悟問題的能力與真實(shí)創(chuàng)造力行為水平相關(guān)程度極低。而諸如三字謎、原型啟發(fā)等頓悟問題的設(shè)計(jì)初衷在于,采用ERP、fMRI等認(rèn)知神經(jīng)科學(xué)手段研究頓悟思維本身的腦定位、思維進(jìn)程等問題。嚴(yán)格說,它們并非是針對創(chuàng)造力水平的測驗(yàn)。雖然有研究表明,聯(lián)想頓悟水平與發(fā)散思維有中等程度相關(guān)(Gilhooly&Murphy,2005),但結(jié)合以上所述,頓悟類測驗(yàn)?zāi)芊癯蔀閯?chuàng)造力水平的合理評估手段,仍然有待于更多研究予以驗(yàn)證和說明。

    4 創(chuàng)造力成就測驗(yàn)

    創(chuàng)造力成就是個(gè)體在其一生中所創(chuàng)造出新穎且有價(jià)值的產(chǎn)品的集合(Carson,Peterson,&Higgins, 2005)。創(chuàng)造力成就測驗(yàn)的理論假設(shè)最為直觀明了:如果有什么能夠預(yù)測未來的創(chuàng)造力潛能,那么最有可能的是已經(jīng)存在的創(chuàng)造力成就。對創(chuàng)造力成就的測量方式主要為:可證實(shí)的成就或榮譽(yù)的數(shù)量;業(yè)已存在的創(chuàng)造性產(chǎn)品所獲得的評價(jià)以及自述創(chuàng)造力成就清單(Wang,Ho,Cheng,& Cheng,2014)。自述創(chuàng)造力成就清單是創(chuàng)造力成就測驗(yàn)的主流,經(jīng)常被使用的測驗(yàn)包括:Hocevar (1979)的創(chuàng)造力行為清單(Creative Behavior Inventory,CBI);Ludwig(1992)的創(chuàng)造力成就量表(Creative Achievement Scale,CAS);Carson等人(2005)的創(chuàng)造力成就問卷(Creative Achievement Questionnaire,CAQ);Batey和 Furnham(2008)的創(chuàng)造力行為傳記清單(Biographical Inventory of Creative Behaviours,BICB)等等。Silvia等人(2012)對廣泛使用的創(chuàng)造力成就問卷(CAQ)、創(chuàng)造力行為清單(CBI)等創(chuàng)造力成就測驗(yàn)的可信度進(jìn)行了分析,他們采用經(jīng)典測驗(yàn)理論和項(xiàng)目反應(yīng)理論系統(tǒng)考察了其項(xiàng)目水平和測驗(yàn)水平,結(jié)果發(fā)現(xiàn)這些成就自評量表不僅在測量指標(biāo)上表現(xiàn)較好,幾種量表之間還維持了很好的共變關(guān)系。另根據(jù)Wang等人(2014)對現(xiàn)有自述創(chuàng)造力成就清單應(yīng)用情況的調(diào)查報(bào)告,Carson等人(2005)的創(chuàng)造力成就問卷(CAQ)由于囊括了藝術(shù)和科學(xué)領(lǐng)域10個(gè)大類的成就自評而得到了最為廣泛的應(yīng)用。

    自述創(chuàng)造力成就清單采取主觀自評的形式,然而,這種形式本身可能帶來一些問題,其中最為重要的是共同方法變異問題(common method variance)。共同方法變異指的是,實(shí)驗(yàn)結(jié)果來源于測量方法而非測量方法所表征的結(jié)構(gòu)(Podsakoff, MacKenzie,Lee,&Podsakoff,2003)。 Ng和Feldman(2012)指出,當(dāng)采取主觀自評的方式測量創(chuàng)造力和與創(chuàng)造力相關(guān)的變量時(shí),共同方法變異問題極易產(chǎn)生。具體表現(xiàn)為,當(dāng)對創(chuàng)造力和其他變量進(jìn)行相關(guān)分析時(shí),共同方法變異會導(dǎo)致兩個(gè)變量間產(chǎn)生虛高的相關(guān),從而極易誘使研究者出現(xiàn)棄真錯(cuò)誤。出現(xiàn)這類問題的原因在于,第一:被試會傾向于在一系列主觀評價(jià)任務(wù)中保持認(rèn)知層面和態(tài)度層面的一致性,這會導(dǎo)致變量間相關(guān)被人為增高;第二:從內(nèi)隱理論角度出發(fā),被試可能會認(rèn)為接受的一系列測驗(yàn)存在一定程度上的共變;第三:被試可能出于社會贊許效應(yīng)故意夸大其創(chuàng)造力水平,特別當(dāng)主觀自評創(chuàng)造力應(yīng)用于高風(fēng)險(xiǎn)情境中,例如:招聘、決策等,被試更有可能“裝好人(Faking good)”(Silvia et al.,2012);第四,被試的情緒可能會連續(xù)影響其在一系列測驗(yàn)中的態(tài)度,導(dǎo)致被試在多項(xiàng)測驗(yàn)中采取相同回答策略。Kaufman,Evans和Baer(2010)的研究就發(fā)現(xiàn),學(xué)生自評創(chuàng)造力水平和其真實(shí)創(chuàng)造力表現(xiàn)毫無關(guān)聯(lián)。

    為說明共同方法變異在主觀創(chuàng)造力測量中可能帶來的影響,Ng和Feldman(2012)系統(tǒng)比較了主觀自評創(chuàng)造力測驗(yàn)與非主觀評定創(chuàng)造力測驗(yàn)以及情緒、人格等多個(gè)變量之間的關(guān)系。結(jié)果發(fā)現(xiàn),主觀自評測驗(yàn)的確比非主觀自評測驗(yàn)產(chǎn)生更大的共同變異效應(yīng);不過,當(dāng)變量為“客觀自評”,即要求被試自評其過往生活史等客觀事件時(shí),該變量與創(chuàng)造力間的共同方法變異效應(yīng)較小;研究還發(fā)現(xiàn),積極情緒和主觀自評創(chuàng)造力不會出現(xiàn)虛高的相關(guān)。這提醒研究者一方面在運(yùn)用自述創(chuàng)造力成就清單對創(chuàng)造測量時(shí)需要合理評估可能出現(xiàn)的誤差,另一方面可以采取其他方法減小這種誤差的出現(xiàn)。例如:同時(shí)匯報(bào)主觀自評創(chuàng)造力和非主觀自評創(chuàng)造力;分時(shí)段對創(chuàng)造力和其他相關(guān)變量進(jìn)行測量等等??梢哉f,通過合理利用測驗(yàn)和匯報(bào)必要測量指標(biāo),創(chuàng)造力成就測驗(yàn)普遍存在的共同方法變異問題能夠得到妥善解決。

    除此之外,研究者在應(yīng)用創(chuàng)造力成就測驗(yàn)時(shí)還應(yīng)注意:首先,根據(jù)實(shí)驗(yàn)?zāi)康耐咨七x取恰當(dāng)?shù)膭?chuàng)造力成就測驗(yàn),有些創(chuàng)造力成就測驗(yàn)為領(lǐng)域一般性,例如:創(chuàng)造力行為清單(CBI),創(chuàng)造力行為傳記清單(BICB);而有些測驗(yàn)為領(lǐng)域特殊性,例如:創(chuàng)造力成就問卷(CAQ)。一些測驗(yàn)著重考察較高水平或顯著人群的創(chuàng)造力成就,有研究者稱之為Pro–C或Big–C創(chuàng)造力(Kaufman&Beghetto, 2009),例如:創(chuàng)造力成就問卷(CAQ);而另一些測驗(yàn)著重于考察一般水平或普通人群的創(chuàng)造力,即little–c創(chuàng)造力,例如:創(chuàng)造力行為清單(CBI),創(chuàng)造力行為傳記清單(BICB)。其次,由于該類測驗(yàn)往往產(chǎn)生分類或計(jì)數(shù)數(shù)據(jù),這極易導(dǎo)致數(shù)據(jù)整體成正偏態(tài)分布,因此研究者在處理該類數(shù)據(jù)時(shí)需要首先借助統(tǒng)計(jì)方法實(shí)現(xiàn)其正態(tài)化(Silvia et al., 2012)。

    5 同感評估技術(shù)

    同感評估技術(shù)(consensual assessment technique),是當(dāng)前創(chuàng)造力測量領(lǐng)域中最主要的評分技術(shù)。其基本理論假設(shè)是:某領(lǐng)域內(nèi)的專家對該領(lǐng)域創(chuàng)造力評估存在一種共識。因此,當(dāng)評價(jià)某產(chǎn)品的創(chuàng)造力水平時(shí),只需要借助該領(lǐng)域?qū)<覙I(yè)已形成的標(biāo)準(zhǔn)對產(chǎn)品進(jìn)行評定即可。與創(chuàng)造力成就測驗(yàn)大多采用自評不同,同感評估技術(shù)本質(zhì)上為專家評價(jià)法。該技術(shù)與之對應(yīng)的基本要求為:第一,測驗(yàn)評定者需為該領(lǐng)域?qū)<?第二,評定者依靠其對創(chuàng)造力的內(nèi)隱態(tài)度對產(chǎn)品進(jìn)行評判;第三,評定者應(yīng)獨(dú)立對產(chǎn)品進(jìn)行評估(Amabile,1982)。研究發(fā)現(xiàn),同感評估技術(shù)不僅適用于實(shí)驗(yàn)室環(huán)境中的即時(shí)創(chuàng)造性產(chǎn)品,同時(shí)也適用于業(yè)已存在的準(zhǔn)實(shí)驗(yàn)產(chǎn)品(Baer,Kaufman,&Gentile,2004)。由于適用于多種創(chuàng)造性產(chǎn)品的評價(jià)且具備良好的信、效度指標(biāo),同感評估技術(shù)得到了廣泛應(yīng)用。有研究表明,在西方5種創(chuàng)造力主流學(xué)術(shù)期刊中,約1/4的創(chuàng)造力測量方法采取了同感評估技術(shù)或類似的專家評價(jià)方法(Long,2014),我國也不乏介紹并應(yīng)用該技術(shù)的研究(宋曉輝,施建農(nóng),2005)。

    但也有一些研究者提出異議,他們認(rèn)為該技術(shù)應(yīng)用成本過高(必須采用專家進(jìn)行評定);過程繁復(fù)(專家必須分別對每個(gè)項(xiàng)目進(jìn)行評定),評價(jià)耗時(shí)(Kaufman,Baer,Cole,&Sexton,2008)。因此,有研究者希望可以用非專家代替專家實(shí)施同感評估技術(shù)。然而有研究表明,盡管非專家在特定類型的研究或產(chǎn)品的評定中可以勝任,但他們表現(xiàn)并不穩(wěn)定,和專家間的評價(jià)差異很大(Kaufman& Baer,2012)。例如:Kaufman等人(2008)的研究表明,當(dāng)非專家采用同感評估技術(shù)時(shí),其評分者一致性系數(shù)很低,且評價(jià)結(jié)果和專家評定結(jié)果差異很大。為改進(jìn)這一問題,Cropley和Kaufman(2012)編制了創(chuàng)造性解決方案診斷量表(creative solution diagnosis scale)。該量表包括30個(gè)項(xiàng)目,每一個(gè)項(xiàng)目對應(yīng)一個(gè)評價(jià)維度,要求評定者根據(jù)項(xiàng)目對該產(chǎn)品在該維度上的水平進(jìn)行打分。他們的研究發(fā)現(xiàn),當(dāng)施用該量表對產(chǎn)品創(chuàng)造性水平進(jìn)行評價(jià)時(shí),即使評定者為非專家,評價(jià)結(jié)果仍具備較高的內(nèi)部一致性系數(shù)。但值得注意的問題是,在使用該量表時(shí),評定者的評價(jià)標(biāo)準(zhǔn)實(shí)際上直接受到了該量表明確、外顯標(biāo)準(zhǔn)的引導(dǎo),這與Amabile (1982)強(qiáng)調(diào)評定者個(gè)體憑借內(nèi)隱態(tài)度進(jìn)行評判的理念已經(jīng)背道而馳,與基本理論要求形成矛盾。

    同感評估技術(shù)的一個(gè)突破性貢獻(xiàn)在于其巧妙地解決了創(chuàng)造性產(chǎn)品的標(biāo)準(zhǔn)問題。在同感評估技術(shù)提出之前,研究者始終無法在創(chuàng)造性產(chǎn)品的標(biāo)準(zhǔn)上達(dá)成共識。雖然研究者普遍認(rèn)同創(chuàng)造力應(yīng)具備“新穎性”和“適宜性”,但各領(lǐng)域創(chuàng)造性產(chǎn)品仍然具備不同的標(biāo)準(zhǔn),特別當(dāng)標(biāo)準(zhǔn)在跨領(lǐng)域的具體情境中時(shí),我們無法認(rèn)定某個(gè)領(lǐng)域的標(biāo)準(zhǔn)就適用于另一個(gè)領(lǐng)域的標(biāo)準(zhǔn)。同感評估技術(shù)提出直接采用該領(lǐng)域?qū)<覍υ摦a(chǎn)品進(jìn)行評定,因?yàn)橹挥性擃I(lǐng)域的專家才清楚怎樣的產(chǎn)品是具有創(chuàng)造性的(Plucker&Makel,2010)。不難發(fā)現(xiàn),同感評估技術(shù)實(shí)際上回避了對于創(chuàng)造力普適性標(biāo)準(zhǔn)的討論,即不同領(lǐng)域的標(biāo)準(zhǔn)無需互相比較,該領(lǐng)域的專家才有實(shí)際的發(fā)言權(quán)。然而這在一定程度上引入了一種混亂,即忽視了評定者可能對測驗(yàn)結(jié)果帶來的不良變異。有研究者稱之為評定者效應(yīng)(rater effects)(Wolfe,2004),評定者效應(yīng)體現(xiàn)在兩個(gè)層面,表層效應(yīng)為評定者給出的原始分?jǐn)?shù),潛層效應(yīng)為評定者的思維過程和評定認(rèn)知,這兩個(gè)層面的效應(yīng)共同作用最終可能影響測驗(yàn)的信、效度(Wolfe&McVay,2012)。

    盡管同感評估技術(shù)會在研究中采用科隆巴赫alpha系數(shù)報(bào)告其評分者一致性信度,以說明評定者打分的可靠性,然而相關(guān)系數(shù)高并不意味著評分者實(shí)際上采用了相同的標(biāo)準(zhǔn),只能說明他們給出了類似的分?jǐn)?shù),或者只是評定者數(shù)量較多帶來的虛假高相關(guān)。由于經(jīng)典測量理論將被試分?jǐn)?shù)理解為真實(shí)分?jǐn)?shù)和誤差的結(jié)合,所以評定者標(biāo)準(zhǔn)的高低等因素?zé)o法通過經(jīng)典測量理論進(jìn)行估計(jì)(Stemler,2004)。為闡明評定者效應(yīng)可能帶來的消極影響及其原因,Long和Pang(2015)結(jié)合定量研究與定性研究的優(yōu)勢,一方面采用概化理論(generalizability theory)技術(shù)明確評定者效應(yīng)對數(shù)據(jù)可靠性帶來的影響;另一方面采取框架分析(framing analysis)技術(shù)進(jìn)一步挖掘其原因。結(jié)果發(fā)現(xiàn):量化研究顯示,當(dāng)評定者數(shù)量較少時(shí),概化系數(shù)和依存系數(shù)的指標(biāo)均不能達(dá)到滿意水平;質(zhì)化研究進(jìn)一步發(fā)現(xiàn),當(dāng)評定者更強(qiáng)調(diào)知識在創(chuàng)造過程中的功能時(shí),他們往往更關(guān)注創(chuàng)造性產(chǎn)品的適宜性且傾向于采用更嚴(yán)格的標(biāo)準(zhǔn)。Long(2014)的另一項(xiàng)定性研究也發(fā)現(xiàn),評定者不僅采取新穎性和適宜性標(biāo)準(zhǔn)對創(chuàng)造性產(chǎn)品進(jìn)行評定,他們還會考慮被試的答案是否有思想,有趣味以及是否聰明。

    評定者效應(yīng)的根源在于評定者作為不同個(gè)體具備不同的心理特質(zhì),因此他們在各種情境中難以維持一致的評價(jià)標(biāo)準(zhǔn)。有研究發(fā)現(xiàn),評定者效應(yīng)受到評定者背景、知識經(jīng)驗(yàn)以及內(nèi)心準(zhǔn)則(Bejar, 2012;Cumming,1990),甚至創(chuàng)造性產(chǎn)品作者的性別以及名字特殊性的影響(Lebuda&Karwowski, 2013);且當(dāng)評價(jià)任務(wù)改變,評價(jià)標(biāo)準(zhǔn)就會發(fā)生變化(Long,2014);接受培訓(xùn)后的評定者依然存在評定者效應(yīng)(Hung,Chen,&Chen,2012)。Hempel和Sue-Chan(2010)還從東西方文化差異的角度考慮評定者可能帶來誤差,他們認(rèn)為,即使東西方學(xué)者對創(chuàng)造力概念持有相同意見,但由于不同文化情境中主流價(jià)值觀存在巨大差異,該差異可能會直接決定東西方評定者具備不同的評價(jià)標(biāo)準(zhǔn)和評價(jià)體系,這將最終影響對產(chǎn)品創(chuàng)造性的判定。例如:相較于西方人,中國人在判定某個(gè)產(chǎn)品是否具備創(chuàng)造性時(shí),傾向于看重其對社會的進(jìn)步是否有推動作用(Rudowicz&Hui,1997)。

    雖然研究者同時(shí)也認(rèn)為,如果評定者接受恰當(dāng)培訓(xùn),測驗(yàn)包含明確定義的評價(jià)體系,評價(jià)者效應(yīng)能得到有效控制(Long&Pang,2015)。然而,這與同感評估技術(shù)的基本精神存在一定矛盾。如果評定者接受了培訓(xùn)的外在標(biāo)準(zhǔn),那么評定者也就不再是憑借創(chuàng)造力的內(nèi)隱態(tài)度進(jìn)行評判。理論的基本要求和應(yīng)用的客觀限制之間該如何權(quán)衡,或許是同感評估技術(shù)下一個(gè)需要解決的問題。

    6 展望

    6.1 基本概念問題

    通過分析前文介紹的幾種主流創(chuàng)造力測驗(yàn)技術(shù),不難發(fā)現(xiàn)它們在創(chuàng)造力概念上具有不同的內(nèi)涵。例如:發(fā)散思維測驗(yàn)認(rèn)為創(chuàng)造力就是多角度解決問題的能力;頓悟類測驗(yàn)側(cè)重于創(chuàng)造力無意識頓悟的一面;創(chuàng)造力成就測驗(yàn)則更看重個(gè)體現(xiàn)實(shí)中的創(chuàng)造性實(shí)踐和成果。由于測量方式直接依賴于概念,這極易導(dǎo)致:由于基本概念不同,有大量碎片化的創(chuàng)造力測驗(yàn)被提出,測驗(yàn)之間聚合效度低下,因此缺乏互相比較的基礎(chǔ)。例如:Mishra和Henriksen(2013)認(rèn)為除了創(chuàng)造力的新穎性和有效性維度,還應(yīng)當(dāng)增加整體性(whole)維度,即相對于問題解決情境的審美標(biāo)準(zhǔn),他們在此基礎(chǔ)上編制同時(shí)測量該三個(gè)維度的創(chuàng)造力測驗(yàn)??梢韵胂?如果某研究者的創(chuàng)造力概念不包含整體性維度,那么其測驗(yàn)方法就會與Mishra和Henriksen (2013)的方法差異很大,這不僅導(dǎo)致測量方法之間無法互換使用,還會進(jìn)一步導(dǎo)致測量結(jié)論難以直接互相印證,最終可能陷入各種測量方法雜亂不堪,研究結(jié)果相互矛盾的境地。有研究者就將這種現(xiàn)狀形容為:進(jìn)入到Hennessey和Amabile稱之為“繁榮卻破碎”的研究階段(Corbalán, Martín-Brufau,Limi?ana,&García-Pe?as,2014)。破碎意味著諸多創(chuàng)造力測驗(yàn)彼此分離,無法合力對創(chuàng)造力研究作出貢獻(xiàn)。已有很多研究者指責(zé)創(chuàng)造力研究領(lǐng)域的許多矛盾結(jié)論源頭在于創(chuàng)造力測量手段的混亂(Dietrich&Kanso,2010;Lillard et al.,2013)。但實(shí)際上,混亂歸根結(jié)底可能還是在于研究者無法從根本上對創(chuàng)造力概念達(dá)成共識,這種缺乏共識從領(lǐng)域一般性創(chuàng)造力的核心特質(zhì)到不同領(lǐng)域創(chuàng)造力概念中都有體現(xiàn)。雖然本文開篇提到,大部分研究者認(rèn)同創(chuàng)造力定義的核心標(biāo)準(zhǔn)是具備“新穎性”和“適宜性”,但仔細(xì)分析,其中仍有較大分歧,特別是適宜性維度。例如:適宜性可能從社會環(huán)境角度被理解為“有道德或社會價(jià)值”(Forgeard&Mecklenburg,2013);也能從問題解決的角度被理解為“有效或有用”(Sternberg& Lubart,1996)。如果從前者出發(fā),創(chuàng)造力應(yīng)當(dāng)只包括具有積極社會意義的想法和行為,但如果從后者出發(fā),創(chuàng)造力同樣也可以是一些“為我所用”的惡意行徑,如近幾年涌現(xiàn)的惡意創(chuàng)造力(malevolent creativity)研究就主要探究具備負(fù)性社會價(jià)值的創(chuàng)造性行為(Harris,Reiter-Palmon,&Kaufman,2013)。

    因此,為解決這一問題,有研究者指出應(yīng)追根溯源,從定義角度規(guī)范創(chuàng)造力理論,并在此基礎(chǔ)上統(tǒng)一創(chuàng)造力測量方法(Batey,2012)。Treffinge, Renzulli和Feldhusen(1971)也曾指出,創(chuàng)造力測量的困難很大程度上來自于我們無法對創(chuàng)造力概念形成“理論統(tǒng)一(theoretical unity)”。在某一學(xué)科研究領(lǐng)域,實(shí)現(xiàn)完全的理論統(tǒng)一或許是不可能同時(shí)也是沒有必要的。在一定概念框架的基礎(chǔ)上,通過不斷運(yùn)用創(chuàng)造力測驗(yàn),并積極向創(chuàng)造力概念進(jìn)行反饋,令學(xué)術(shù)界對創(chuàng)造力的核心特質(zhì)及各領(lǐng)域內(nèi)的基本概念達(dá)成真正共識,或許才是解決創(chuàng)造力測量混亂局面的根本途徑。如上文所述,研究者現(xiàn)已普遍認(rèn)同創(chuàng)造力概念既包括發(fā)散思維,也包括聚合思維,過去發(fā)散思維測驗(yàn)就能完全表征創(chuàng)造力的觀念被徹底摒棄。研究者現(xiàn)今往往在一項(xiàng)創(chuàng)造力研究中選取多種創(chuàng)造力測驗(yàn),以避免方法上的片面,這無疑是研究者在創(chuàng)造力基本概念日益形成共識的基礎(chǔ)上,進(jìn)一步于測驗(yàn)定位和選取上獲得的進(jìn)步。借助此類測驗(yàn)運(yùn)用的推進(jìn),反過來會有助于研究者對創(chuàng)造力概念進(jìn)一步達(dá)成共識。通過這種概念到測驗(yàn),測驗(yàn)再回到概念且不斷循環(huán)上升的研究邏輯,最終將有助于理清當(dāng)前創(chuàng)造力測驗(yàn)領(lǐng)域紛亂的現(xiàn)狀。

    6.2 測驗(yàn)優(yōu)化問題

    如前文所述,創(chuàng)造力測驗(yàn)的一些基本的心理學(xué)測量指標(biāo)仍然飽受批評。例如:發(fā)散思維測驗(yàn)的信、效度問題;遠(yuǎn)距離聯(lián)想測驗(yàn)的效度問題等等。因此不斷從測驗(yàn)內(nèi)容、施測過程等方面推進(jìn)創(chuàng)造力測驗(yàn)的優(yōu)化工作是當(dāng)務(wù)之急。從測驗(yàn)內(nèi)容看,研究者需通過對創(chuàng)造力測驗(yàn)的不斷應(yīng)用和改進(jìn)提高創(chuàng)造力測驗(yàn)的信、效度水平,體現(xiàn)心理測驗(yàn)的科學(xué)性。例如:當(dāng)采取主觀計(jì)分方法測量創(chuàng)造力時(shí),要求被試在2~3分鐘左右完成一道測驗(yàn)時(shí)其新穎性分?jǐn)?shù)效度最好,時(shí)間無需過長,因?yàn)榧词箷r(shí)間繼續(xù)延長,被試答案的信、效度也沒有顯著提高(Benedek,et al.,2013),同時(shí),時(shí)間也不宜過短,因?yàn)楸辉噧A向于在創(chuàng)造力測驗(yàn)的后期表現(xiàn)更好(Beaty&Silvia,2012);又如:Silvia(2011)的研究發(fā)現(xiàn),作為發(fā)散思維測驗(yàn)經(jīng)常使用的三種測驗(yàn)形式:靈活使用任務(wù)、舉例任務(wù)以及結(jié)果任務(wù)在信度上有較大差異,彼此并不能互相替代; Gupta,Jang,Mednick和Huber(2012)建議在遠(yuǎn)距離聯(lián)想測驗(yàn)中避免使用高詞頻答案的題目等等。

    從施測過程看,傳統(tǒng)創(chuàng)造力測驗(yàn)時(shí)間大多較長,耗時(shí)費(fèi)力;施測采用紙筆測驗(yàn)的形式,測驗(yàn)的信息需要通過轉(zhuǎn)錄到電腦中才能進(jìn)行處理,后期工序十分繁復(fù),增加了諸多主觀不確定因素。因此,一方面,傳統(tǒng)測驗(yàn)的精簡化在有條不紊的開展中,且收到了良好效果(Althuizen,Wierenga, &Rossiter,2010);另一方面,隨著電子信息技術(shù)的發(fā)展,越來越多的研究者試圖在電腦上完成對創(chuàng)造力的測量,以提高創(chuàng)造力測驗(yàn)的標(biāo)準(zhǔn)化和客觀化(Diener,Wright,Smith,&Wright,2014;Hass, 2015;Kwon,Goetz,&Zellner,1998)。Lau和Cheung (2010)就比較了電子版和紙筆版Wallach-Kogan創(chuàng)造力測驗(yàn)的不同,結(jié)果發(fā)現(xiàn)電子版和紙筆版測驗(yàn)都展現(xiàn)出相似水平的信度。不僅如此,多元方差分析還顯示電子版和紙筆版在各項(xiàng)分測驗(yàn)上均無顯著得分差異。雖然同時(shí)有研究表明電子版和紙筆版測驗(yàn)在某些方面并不相同,特別當(dāng)該創(chuàng)造力測驗(yàn)中要求被試進(jìn)行畫圖等操作時(shí),其在電子版創(chuàng)造力測驗(yàn)中的表現(xiàn)要比紙筆版更差(Diener et al.,2014;Kwon et al.,1998),但原因可能在于在電腦中操作鼠標(biāo)進(jìn)行畫圖比紙筆畫圖更難操作,與之類似的發(fā)現(xiàn)還有,Hass(2015)的研究表明,電子版創(chuàng)造力測驗(yàn)不會導(dǎo)致被試答案的創(chuàng)新性減少,但會在一定程度上降低其答案的流暢性。雖然創(chuàng)造力電子版測驗(yàn)尚不成熟,但其在測驗(yàn)標(biāo)準(zhǔn)化和客觀化,計(jì)分自動化以及建立創(chuàng)造力測驗(yàn)常模大數(shù)據(jù)(big-data)等方面具有不可忽視的潛力。因此,創(chuàng)造力測驗(yàn)的電子化取向有很大上升空間,未來應(yīng)在此方向努力。

    總而言之,創(chuàng)造力測驗(yàn)需要通過不斷地優(yōu)化和完善,才能真正成為科學(xué)可靠的測量工具,從而為創(chuàng)造力研究提供堅(jiān)強(qiáng)助力。

    6.3 測驗(yàn)運(yùn)用問題

    創(chuàng)造力測驗(yàn)數(shù)量龐大,種類繁雜,測驗(yàn)如何運(yùn)用同樣是難點(diǎn)問題。根據(jù)研究現(xiàn)狀,首先,研究者在應(yīng)用測驗(yàn)時(shí)宜采取混合測驗(yàn)的策略?;旌蠝y驗(yàn)即在運(yùn)用創(chuàng)造力測驗(yàn)時(shí),至少選取兩種或兩種以上的測驗(yàn)方式,且測驗(yàn)來自不同角度。主要原因在于:第一,從理論角度看,創(chuàng)造力絕非某種人格特質(zhì),某類思維習(xí)慣或某處環(huán)境單獨(dú)決定的。眾多心理學(xué)家都持有類似觀點(diǎn):Amabile(1982)提出,創(chuàng)造性問題解決是在任務(wù)、動機(jī)、領(lǐng)域相關(guān)知識和能力、與創(chuàng)造力有關(guān)的技能共同作用的條件下達(dá)成的;Plucker和Renzulli(1999)曾提出創(chuàng)造性產(chǎn)品的內(nèi)隱理論(implict theory),他們認(rèn)為個(gè)體具備某種認(rèn)知或人格結(jié)構(gòu),二者互相結(jié)合才能產(chǎn)生創(chuàng)造性產(chǎn)品;Csikszentmihalyi(1999)的系統(tǒng)理論(system theory)也認(rèn)為,創(chuàng)造力來源于個(gè)體、場,以及領(lǐng)域的交互作用;Sternberg和Lubart (1992)認(rèn)為,創(chuàng)造力包括6個(gè)要素:智力、知識、思考方式、人格、動機(jī)以及環(huán)境。因此,創(chuàng)造力基本理論不支持應(yīng)用單一的測量技術(shù)。第二,從現(xiàn)實(shí)角度看,據(jù)上文所述,一方面,目前尚存在多種創(chuàng)造力概念,因此創(chuàng)造力測量決不能僅僅使用某一種,采取多種測驗(yàn)同時(shí)施測是較為穩(wěn)妥的策略(Cropley,2000)。另一方面,當(dāng)今流行的各種測驗(yàn)形式和計(jì)分方式各有其利弊,唯有結(jié)合運(yùn)用才能揚(yáng)長避短。

    當(dāng)前,較好的混合測驗(yàn)策略是選取恰當(dāng)?shù)亩嘟嵌葴y驗(yàn),并且確保幾類測驗(yàn)都有一定程度的重合且能夠分別測量創(chuàng)造力的不同方面(Pinheiro& Cruz,2014);或者采用囊括創(chuàng)造力多角度品質(zhì)的測驗(yàn),例如:Sen,Acar和Cetinkaya(2014)認(rèn)為,創(chuàng)造性活動中的個(gè)體和環(huán)境從來就不是孤立存在的,據(jù)此他們編制了個(gè)人環(huán)境適應(yīng)量表(Person-Environment Fit Scale,PEFSC),從個(gè)體和環(huán)境兩個(gè)角度同時(shí)測量創(chuàng)造力。

    除此之外,從推進(jìn)創(chuàng)造力測驗(yàn)發(fā)展的角度看,一些過往研究中針對某測驗(yàn)的爭議問題還應(yīng)當(dāng)通過有意識的運(yùn)用該測驗(yàn)加以解決和驗(yàn)證。例如:研究者可以嘗試在較長的縱向時(shí)間內(nèi)對不同群體施測遠(yuǎn)距離聯(lián)想測驗(yàn),并在恰當(dāng)?shù)臅r(shí)間節(jié)點(diǎn)選取多類效標(biāo),從而為該測驗(yàn)類型的有效性提供有力說明。如果缺乏主動的驗(yàn)證,由于絕大多數(shù)的創(chuàng)造力測驗(yàn)在應(yīng)用時(shí)只是為其他研究目標(biāo)服務(wù),因此即使某測驗(yàn)在研究中獲得了廣泛的應(yīng)用,研究者也可能無法獲取有關(guān)該測驗(yàn)的重要信息。特別是測驗(yàn)的有效性往往還存在中西方差異,本土化的創(chuàng)造力測驗(yàn)更需要此類基礎(chǔ)性工作。一些國外研究者在這些方面做出了很好的嘗試(Runco et al., 2010;Silvia et al.,2012),這值得國內(nèi)研究者借鑒。

    6.4 測量技術(shù)多樣化

    雖然正如前文多次提及,創(chuàng)造力測量技術(shù)數(shù)量巨大,然而當(dāng)前應(yīng)用最廣的測量技術(shù)仍然是幾十年前提出的諸如:發(fā)散思維測驗(yàn)、遠(yuǎn)距離聯(lián)想測驗(yàn)以及同感評估技術(shù)等等。這些經(jīng)典測量技術(shù)固然有其優(yōu)勢,但亦有諸如:獨(dú)特性維度計(jì)分問題、評分者效應(yīng)等頑疾。因此除了對原有測量技術(shù)的改進(jìn),創(chuàng)造力測量領(lǐng)域依然需要新想法和新突破,這就要求研究者持續(xù)推進(jìn)創(chuàng)造力測量技術(shù)的多樣化發(fā)展,以求從根本上解決問題。

    近幾年,研究者開始從語義網(wǎng)絡(luò)角度測量創(chuàng)造力(Bossomaier,Harré,Knittel,&Snyder,2009; Prabhakaran et al.,2014),或改進(jìn)創(chuàng)造力計(jì)分方法(Wang,Chang,&Li,2008)。Harbison和Haarmann (2014)就從語義表征角度提出了稱之為“自動化計(jì)分”(automated scoring)技術(shù)對發(fā)散思維測驗(yàn)中的特殊性水平進(jìn)行打分。根據(jù)過往研究,個(gè)體在行為中采用的語義表征模式能夠?qū)σ幌盗腥祟愋袨槠鸬筋A(yù)測作用。因此,他們借助潛在語義分析和共同逐點(diǎn)信息(pointwise-mutual information)技術(shù)對被試的答案和題目之間的語義相似度(similarity)進(jìn)行分析。結(jié)果發(fā)現(xiàn),相似度越高,被試答案的新穎度越低。據(jù)此,他們提出語義相似度可以作為答案新穎性的有效預(yù)測指標(biāo)。由于潛在語義分析等技術(shù)采取的是大數(shù)據(jù)支持下的客觀計(jì)算(網(wǎng)頁版測評可見http://lsa.colorado.edu/),因此通過應(yīng)用該類技術(shù),上文提到主觀評價(jià)法可能帶來的評定者效能在一定程度上避免。用客觀化的新指標(biāo)表征原有的獨(dú)特性維度,也可能有助于從徹底規(guī)避前文討論的獨(dú)特性維度計(jì)分問題。但這種方法是否合適,仍有待于進(jìn)一步檢驗(yàn)。

    從認(rèn)知神經(jīng)實(shí)驗(yàn)的角度,Prabhakaran等(2014)還認(rèn)為,傳統(tǒng)創(chuàng)造力測量手段并不適用于腦成像研究。傳統(tǒng)創(chuàng)造力腦成像技術(shù)研究過于依賴被試對任務(wù)的反應(yīng)時(shí)或反應(yīng)數(shù),無法準(zhǔn)確捕捉到創(chuàng)造性思維的瞬間。為解決這一問題,他們基于語義網(wǎng)絡(luò)理論提出了便于進(jìn)行腦成像研究的創(chuàng)造力單字發(fā)音(single-word utterances)測驗(yàn)。即讓被試看到一個(gè)名詞,讓其口頭報(bào)告一個(gè)與該名詞有新穎聯(lián)系的動詞,并利用潛在語義分析技術(shù)(Latent Semantic Analysis)分析動詞與名詞的語詞距離,語義距離越大,創(chuàng)造性水平越高。他們的研究結(jié)果發(fā)現(xiàn),語義距離與言語、非言語創(chuàng)造力相關(guān)程度很高(β=0.50)。

    除此之外,教育學(xué)領(lǐng)域提出了更具生態(tài)效度的創(chuàng)造力測量方法(Blamires&Peterson,2014);功能設(shè)計(jì)領(lǐng)域的創(chuàng)造力研究也為創(chuàng)造性產(chǎn)品測量提供了新的視角。如:Sarkar和Chakrabarti(2011)設(shè)計(jì)了客觀嚴(yán)格的模型和公式對創(chuàng)造力的新穎性和有效性進(jìn)行計(jì)算,以得出對某產(chǎn)品創(chuàng)新水平的判斷。例如:新穎性指標(biāo)=重要程度×受歡迎程度×使用頻率×使用持續(xù)時(shí)間或使用期間受益。Redelinghuys和Bahill(2006)從工程設(shè)計(jì)的角度將創(chuàng)造性產(chǎn)品理解為設(shè)計(jì)價(jià)值(design value),探究某一產(chǎn)品的價(jià)值則需要考察設(shè)計(jì)過程中的資源消耗和努力投入,他們通過 REV(resources-effortvalue)技術(shù)構(gòu)建數(shù)理模型,并將量化的資源、努力以及價(jià)值指標(biāo)帶入演算,以求得創(chuàng)造力指數(shù)。這一系列成果提醒創(chuàng)造力測量領(lǐng)域研究者決不能閉門造車,從其他領(lǐng)域吸取靈感或許能給未來研究打開一片新天地。

    李良敏,羅玲玲,劉武.(2015).客觀化創(chuàng)造力測量工具:《中文遠(yuǎn)距聯(lián)想測驗(yàn)》編制.東北大學(xué)學(xué)報(bào)(社會科學(xué)版),17(1),19–24.

    羅俊龍,覃義貴,李文福,朱海雪,田燕,邱江,張慶林. (2012).創(chuàng)造發(fā)明中頓悟的原型啟發(fā)腦機(jī)制.心理科學(xué)進(jìn)展,20(4),504–513.

    沈汪兵,劉昌,張小將,陳亞林.(2011).三字字謎頓悟的時(shí)間進(jìn)程和半球效應(yīng):一項(xiàng)ERP研究.心理學(xué)報(bào),43(3), 229–240.

    宋曉輝,施建農(nóng).(2005).創(chuàng)造力測量手段——同感評估技術(shù)(CAT)簡介.心理科學(xué)進(jìn)展,13(6),739–744.

    王燁,余榮軍,周曉林.(2005).創(chuàng)造性研究的有效工具——遠(yuǎn)距離聯(lián)想測驗(yàn)(RAT).心理科學(xué)進(jìn)展,13(6),734–738.

    Aiello,D.A.,Jarosz,A.F.,Cushen,P.J.,&Wiley,J.(2012). Firing the executive:When an analytic approach to problem solving helps and hurts.The Journal of Problem Solving, 4(2),116–127.

    Althuizen,N.,Wierenga,B.,&Rossiter,J.(2010).The validity oftwo briefmeasures ofcreative ability.Creativity Research Journal,22(1),53–61.

    Amabile,T.M.(1982).Social psychology of creativity:A consensual assessment technique.Journal of Personality and Social Psychology,43,997–1013.

    Amabile,T.M.,Conti,R.,Coon,H.,Lazenby,J.,&Herron, M.(1996).Assessing the work environment for creativity.Academy of Management Journal,39(5),1154–1184.

    Ayas,M.B.,&Sak,U.(2014).Objective measure of scientific creativity:Psychometric validity of the Creative Scientific Ability Test.Thinking Skills and Creativity,13,195–205.

    Baer,J.(2011).How divergent thinking tests mislead us:Are the Torrance Tests still relevant in the 21st century?The Division 10 debate.Psychology of Aesthetics,Creativity, and the Arts,5(4),309–313.

    Baer,J.,Kaufman,J.C.,&Gentile,C.A.(2004).Extension of the consensual assessment technique to nonparallel creative products.Creativity Research Journal,16(1),113–117.

    Batey,M.(2012).The measurement of creativity:From definitionalconsensus to the introduction ofa new heuristic framework.Creativity Research Journal,24(1), 55–65.

    Batey,M.,&Furnham,A.(2008).The relationship between measures of creativity and schizotypy.Personality and Individual Differences,45(8),816–821.

    Beaty,R.E.,Nusbaum,E.C.,&Silvia,P.J.(2014).Does insight problem solving predict real–world creativity?.Psychology of Aesthetics,Creativity,and the Arts,8(3), 287–292.

    Beaty,R.E.,&Silvia,P.J.(2012).Why do ideas get more creative across time?An executive interpretation of the serial order effect in divergent thinking tasks.Psychology of Aesthetics,Creativity,and the Arts,6(4),309–319.

    Beaty,R.E.,Smeekens,B.A.,Silvia,P.J.,Hodges,D.A.,& Kane,M.J.(2013).A first look at the role of domaingeneral cognitive and creative abilities in jazz improvisation.Psychomusicology:Music,Mind,and Brain,23(4),262–268.

    Bejar,I.I.(2012).Rater cognition:Implications for validity.Educational Measurement:Issues and Practice,31(3),2–9.

    Benedek,M.,K?nen,T.,&Neubauer,A.C.(2012).Associative abilities underlying creativity.Psychology of Aesthetics, Creativity,and the Arts,6(3),273–281.

    Benedek,M.,Mühlmann,C.,Jauk,E.,&Neubauer,A.C. (2013).Assessment of divergent thinking by means of the subjective top–scoring method:Effects of the number of top–ideas and time–on–task on reliability and validity.Psychology of Aesthetics,Creativity,and the Arts,7(4), 341–349.

    Besemer,S.P.,&O'Quin,K.(1987).Creative product analysis: Testing a model by developing a judging instrument.In S. G.Isaksen(Ed.),Frontiers of creativity research:Beyond the basics(pp.367–389).Buffalo,NY:Bearly.

    Blamires,M.,&Peterson,A.(2014).Can creativity be assessed?Towards an evidence–informed framework for assessing and planning progress in creativity.Cambridge Journal of Education,44(2),147–162.

    Bossomaier,T.,Harré,M.,Knittel,A.,&Snyder,A.(2009). A semantic network approach to the creativity quotient (CQ).Creativity Research Journal,21(1),64–71.

    Carson,S.H.,Peterson,J.B.,&Higgins,D.M.(2005). Reliability,validity,and factor structure of the creative achievement questionnaire.Creativity Research Journal, 17(1),37–50.

    Charyton,C.,&Merrill,J.A.(2009).Assessing general creativity and creative engineering design in first year engineering students.Journal of Engineering Education, 98(2),145–156.

    Chermahini,S.A.,Hickendorff,M.,&Hommel,B.(2012). Development and validity of a Dutch version of the Remote Associates Task:An item–response theory approach.Thinking Skills and Creativity,7(3),177–186.

    Chou,H.W.,Chen,Y.L.,&Chou,S.B.(2014).A method for evaluating the creativity of comic strips.Thinking Skills and Creativity,14,11–19.

    Clapham,M.M.,Cowdery,E.M.,King,K.E.,&Montang, M.A.(2005).Predicting work activities with divergent thinking tests:A longitudinalstudy.TheJournalof Creative Behavior,39(3),149–166.

    Clark,P.M.,&Mirels,H.L.(1970).Fluency as a pervasive element in the measurement of creativity.Journal of Educational Measurement,7(2),83–86.

    Colangelo,N.,Kerr,B.,Hallowell,K.,Huesman,R.,& Gaeth,J.(1992).The Iowa InventivenessInventory: Toward a measure of mechanical inventiveness.Creativity Research Journal,5(2),157–163.

    Corbalán,J.,Martín-Brufau,R.,Limi?ana,R.,&García-Pe?as,V.(2014).CREA.10 years in response to the question: Is it really possible to measure creativity?.(Abstract).Personality and Individual Differences,60,S29.

    Cropley,A.J.(2000).Defining and measuring creativity:Are creativity tests worth using?.Roeper Review,23(2),72–79.

    Cropley,D.H.,& Kaufman,J.C.(2012).Measuring functional creativity:Non–expert raters and the creative solution diagnosis scale.The Journal of Creative Behavior, 46(2),119–137.

    Csikszentmihalyi,M.(1999).Implications of a systems perspective for the study of creativity.In R.J.Sternberg (Ed.),Handbook of creativity(pp.313–335).Cambridge, UK:Cambridge University Press.

    Cumming,A.(1990).Expertise in evaluating second language compositions.Language Testing,7(1),31–51.

    DeYoung,C.G.,Flanders,J.L.,&Peterson,J.B.(2008). Cognitive abilities involved in insight problem solving: An individualdifferencesmodel.CreativityResearch Journal,20(3),278–290.

    Diener,M.L.,Wright,C.A.,Smith,K.N.,&Wright,S.D. (2014).Assessing Visual–spatial creativity in youth on the autism spectrum.Creativity Research Journal,26(3),328–337.

    Dietrich,A.,&Kanso,R.(2010).A review of EEG,ERP, and neuroimaging studies of creativity and insight.Psychological Bulletin,136(5),822–848.

    Domino,G.(1970).Identification of potentially creative persons from the Adjective Check List.Journalof Consulting and Clinical Psychology,35,48–51.

    Duncker,K.(1945).On problem-solving.PsychologicalMonographs,58,5.

    Fink,A.,Slamar-Halbedl,M.,Unterrainer,H.F.,&Weiss,E. M.(2012).Creativity:Genius,madness,or a combination of both?.Psychology of Aesthetics,Creativity,and the Arts, 6(1),11–18.

    Fodor,E.M.(1999).Subclinical inclination toward manicdepression and creativeperformanceon theRemote Associates Test.Personality and Individual Differences, 27(6),1273–1283.

    Forgeard,M.J.C.,&Mecklenburg,A.C.(2013).The two dimensions of motivation and a reciprocal model of the creative process.Review of General Psychology,17(3), 255–266.

    Gilhooly,K.J.,&Murphy,P.(2005).Differentiating insight from non-insight problems.Thinking&Reasoning,11(3), 279–302.

    Gough,H.G.(1979).A creative personality scale for the Adjective Check List.Journal of Personality and Social Psychology,37(8),1398–1405.

    Guilford,J.P.(1967).Creativity:Yesterday,today and tomorrow.The Journal of Creative Behavior,1(1),3–14.

    Gupta,N.,Jang,Y.,Mednick,S.C.,&Huber,D.E.(2012). The road not taken:Creative solutions require avoidance of high-frequency responses.Psychological Science,23(3), 288–294.

    Harbison,J.I.,&Haarmann,H.(2014).Automated scoring of originality using semantic representations.Proceedings of COGSCI,2327–2332.

    Harris,D.J.,Reiter-Palmon,R.,&Kaufman,J.C.(2013). The effect of emotional intelligence and task type on malevolent creativity.Psychology of Aesthetics,Creativity, and the Arts,7(3),237–244.

    Hass,R.W.(2015).Feasibility of online divergent thinking assessment.Computers in Human Behavior,46,85–93.

    Hempel,P.S.,&Sue-Chan,C.(2010).Culture and the assessment of creativity.Management and Organization Review,6(3),415–435.

    Hocevar,D.(1979,April).The Development of the creative behavior inventory(CBI).Annual Meeting of the Rocky Mountain Psychological Association.

    Hong,E.,Milgram,R.M.,&Gorsky,H.(1995).Original thinking as a predictor of creative performance in young children.Roeper Review,18(2),147–149.

    Hung,S.P.,Chen,P.H.,&Chen,H.C.(2012).Improving creativity performance assessment:A rater effect examination with many facet Rasch model.Creativity Research Journal, 24(4),345–357.

    Hürsen,?.,Kaplan,A.,& ?zdal,H.(2014).Assessment of creative thinking studies in terms of content analysis.Procedia–Social and Behavioral Sciences,143,1177–1185.

    Kaufman,J.C.,& Baer,J.(2012).Beyond new and appropriate:Who decides what is creative?.CreativityResearch Journal,24(1),83–91.

    Kaufman,J.C.,Baer,J.,Cole,J.C.,&Sexton,J.D.(2008). A comparison of expert and nonexpert raters using the consensualassessmenttechnique.CreativityResearch Journal,20(2),171–178.

    Kaufman,J.C.,&Beghetto,R.A.(2009).Beyond big and little:The four c model of creativity.Review of General Psychology,13(1),1–12.

    Kaufman,J.C.,Evans,M.L.,&Baer,J.(2010).The American idol effect:Are students good judges of their creativity across domains?.Empirical Studies of the Arts, 28(1),3–17.

    Kaufman,J.C.,Plucker,J.A.,&Baer,J.(Eds.).(2008).Essentials of creativity assessment.Hoboken,NJ:Wiley.

    Kim,K.H.(2008).Meta-analyses of the relationship of creative achievement to both IQ and divergent thinking test scores.The Journal of Creative Behavior,42(2),106–130.

    Kim,K.H.(2011).Proven reliability and validity of the Torrance Tests of Creative Thinking(TTCT).Psychology of Aesthetics,Creativity,and the Arts,5(4),314–315.

    Kirton,M.(1976).Adaptors and innovators:A description and measure.Journal of Applied Psychology,61(5),622–629.

    Kwon,M.,Goetz,E.T.,&Zellner,R.D.(1998).Developing a computer–based TTCT:Promises and problems.The Journal of Creative Behavior,32(2),96–106.

    Lau,S.,&Cheung,P.C.(2010).Creativity assessment: Comparability of the electronic and paper–and–pencil versions of the Wallach–Kogan Creativity Tests.Thinking Skills and Creativity,5(3),101–107.

    Laughlin,P.R.,Doherty,M.A.,&Dunn,R.F.(1968). Intentional and incidental concept formation as a function of motivation,creativity,intelligence,and sex.Journal of Personality and Social Psychology,8,401–409.

    Lebuda,I.,&Karwowski,M.(2013).Tell me your name and I'll tell you how creative your work is:Author's name and gender as factors influencing assessment of products' creativity in four different domains.Creativity Research Journal,25(1),137–142.

    Lee,C.S.,Huggins,A.C.,&Therriault,D.J.(2014).A measure of creativity or intelligence?Examining internal and external structure validity evidence of the Remote Associates Test.Psychology of Aesthetics,Creativity,and the Arts,8(4),446–460.

    Lee,C.S.,& Therriault,D.J.(2013).The cognitive underpinnings ofcreative thought:A latentvariable analysis exploring the roles of intelligence and working memory in three creative thinking processes.Intelligence, 41(5),306–320.

    Lee,S.(2008).Commentary:Reliability and validity of uniqueness scoring in creativity assessment.Psychology of Aesthetics,Creativity,and the Arts,2(2),103–108.

    Leon,S.A.,Altmann,L.J.P.,Abrams,L.,Gonzalez Rothi,L. J.,&Heilman,K.M.(2014).Divergent task performance in older adults:Declarative memory or creative potential?.Creativity Research Journal,26(1),21–29.

    Lillard,A.S.,Lerner,M.D.,Hopkins,E.J.,Dore,R.A., Smith,E.D.,&Palmquist,C.M.(2013).The impact of pretend play on children’s development:A review of the evidence.Psychological Bulletin,139(1),1–34.

    Long,H.Y.(2014).More than appropriateness and novelty: Judges’criteria of assessing creative products in science tasks.Thinking Skills and Creativity,13,183–194.

    Long,H.Y.,&Pang,W.G.(2015).Rater effects in creativity assessment:A mixed methodsinvestigation.Thinking Skills and Creativity,15,13–25.

    Ludwig,A.M.(1992).The creative achievement scale.Creativity Research Journal,5(2),109–119.

    Mednick,S.(1962).The associative basis of the creative process.Psychological Review,69(3),220–232.

    Mishra,P.,&Henriksen,D.(2013).A new approach to defining and measuring creativity:Rethinking technology &creativity in the 21st century.TechTrends,57(5),10–13.

    Ng,T.W.H.,&Feldman,D.C.(2012).A comparison of self–ratings and non–self–report measures of employee creativity.Human Relations,65(8),1021–1047.

    Nusbaum,E.C.,&Silvia,P.J.(2011).Are intelligence and creativity really so different?: Fluid intelligence, executive processes,and strategy use in divergent thinking.Intelligence,39(1),36–45.

    Paprika,Z.Z.,&Nagy,V.(2012).Assessment of creativity on the job market.Procedia Economics and Finance,3, 166–181.

    Pinheiro,I.R.,&Cruz,R.M.(2014).Mapping creativity: Creativity measurements network analysis.Creativity Research Journal,26(3),263–275.

    Plucker,J.A.,&Makel,M.C.(2010).Assessment of creativity.In J.C.Kaufman&R.J.Sternberg(Eds.),The Cambridge handbook of creativity(pp.48–73).New York: Cambridge University Press.

    Plucker,J.A.,& Renzulli,J.S.(1999).Psycometric approaches to the study of human creativity.In R.J. Sternberg (Ed.),Handbookofcreativity(pp.35–61). Cambridge,UK:Cambridge University Press.

    Plucker,J.A.,Qian,M.H.,&Wang,S.J.(2011).Is originality in the eye of the beholder?Comparison of scoring techniques in the assessment of divergent thinking.The Journal of Creative Behavior,45(1),1–22.

    Podsakoff,P.M.,MacKenzie,S.B.,Lee,J.Y.,&Podsakoff, N.P.(2003).Common method biases in behavioral research: A critical review of the literature and recommended remedies.Journal of Applied Psychology,88(5),879–903.

    Prabhakaran,R.,Green,A.E.,&Gray,J.R.(2014).Thin slices of creativity:Using single–word utterances to assess creative cognition.Behavior Research Methods,46(3), 641–659.

    Pretz,J.E.,&McCollum,V.A.(2014).Self–perceptions of creativity do not always reflect actual creative performance.Psychology of Aesthetics,Creativity,and the Arts,8(2), 227–236.

    Primi,R.(2014).Divergentproductionsofmetaphors: Combining many–facet Rasch measurement and cognitive psychology in the assessment of creativity.Psychology of Aesthetics,Creativity,and the Arts,8(4),461–474.

    Redelinghuys,C.,&Bahill,A.T.(2006).A framework for the assessment of the creativity of product design teams.Journal of Engineering Design,17(2),121–141.

    Rudowicz,E.,&Hui,A.N.(1997).The creative personality: Hong Kong perspective.Journal of Social Behavior& Personality,12(1),139–157.

    Runco,M.A.,&Acar,S.(2012).Divergent thinking as an indicator of creative potential.Creativity Research Journal, 24(1),66–75.

    Runco,M.A.,Millar,G.,Acar,S.,&Cramond,B.(2010). Torrance tests ofcreative thinking as predictors of personal and public achievement:A fifty–year follow–up.Creativity Research Journal,22(4),361–368.

    Sarkar,P.,& Chakrabarti,A.(2011).Assessing design creativity.Design Studies,32(4),348–383.

    Sen,S.,Acar,S.,&Cetinkaya,C.(2014).Development of the Person–Environment Fit Scale(PEFSC):A new measure of creativity.Psychology of Aesthetics,Creativity,and the Arts,8(4),433–445.

    Silvia,P.J.(2008).Creativity and intelligence revisited:A latent variable analysis of Wallach and Kogan(1965).Creativity Research Journal,20(1),34–39.

    Silvia,P.J.(2011).Subjective scoring of divergent thinking: Examining the reliability of unusual uses,instances,and consequences tasks.Thinking Skills and Creativity,6(1), 24–30.

    Silvia,P.J.,Martin,C.,&Nusbaum,E.C.(2009).A snapshot of creativity:Evaluating a quick and simple method for assessing divergent thinking.Thinking Skills and Creativity,4(2),79–85.

    Silvia,P.J.,Nusbaum,E.C.,Berg,C.,Martin,C.,&O’Connor, A.(2009).Openness to experience,plasticity,and creativity: Exploring lower–order,high–order,and interactive effects.Journal of Research in Personality,43(6),1087–1090.

    Silvia,P.J.,Wigert,B.,Reiter-Palmon,R.,&Kaufman,J.C. (2012).Assessing creativity with self–report scales:A review and empirical evaluation.Psychology of Aesthetics, Creativity,and the Arts,6(1),19–34.

    Silvia,P.J.,Winterstein,B.P.,Willse,J.T.,Barona,C.M., Cram,J.T.,Hess,K.I.,… Richard,C.A.(2008). Assessing creativity with divergent thinking tasks:Exploring the reliability and validity of new subjective scoring methods.Psychology of Aesthetics,Creativity,and theArts,2(2),68–85.

    Simonton,D.K.(2003).Expertise,competence,and creative ability:The perplexing complexities.In R.J.Sternberg& E.L.Grigorenko(Eds.),The psychology of abilities, competencies,and expertise(pp.213–239).New York: Cambridge University Press.

    Stemler,S.E.(2004).A comparison of consensus,consistency, and measurementapproaches to estimating interrater reliability.Practical Assessment,Research&Evaluation, 9(4).Retrieved April 12,2015 from http://PAREonline. net/getvn.asp?v=9&n=4

    Sternberg,R.J.,&Lubart,T.I.(1992).Creativity:Its nature and assessment.School Psychology International,13(3), 243–253.

    Sternberg,R.J.,&Lubart,T.I.(1996).Investing in creativity.American Psychologist,51(7),677–688.

    Storm,B.C.,Angello,G.,&Bjork,E.L.(2011).Thinking can cause forgetting:Memory dynamics in creative problem solving.Journal of Experimental Psychology:Learning, Memory,and Cognition,37(5),1287–1293.

    Taft,R.,&Rossiter,J.R.(1967).The Remote Associates Test:Divergent or convergent thinking?Psychological Reports,19(3),1313–1314.

    Tan,M.,Mourgues,C.,Bolden,D.S.,&Grigorenko,E.L. (2014).Makingnumberscometo life:Twoscoring methods for creativity in aurora's cartoon numbers.The Journal of Creative Behavior,48(1),25–43.

    Torrance,E.P.(1972).Predictive validity of the Torrance tests of creative thinking.The Journal of Creative Behavior, 6(4),236–262.

    Torrance,E.P.,&Goff,K.(1989).A quiet revolution.The Journal of Creative Behavior,23(2),136–145.

    Treffinger,D.J.,Renzulli,J.S.,&Feldhusen,J.F.(1971). Problems in the assessment of creative thinking.The Journal of Creative Behavior,5(2),104–112.

    Wang,C.C.,Ho,H.C.,Cheng,C.L.,&Cheng,Y.Y.(2014). Application of the Rasch Model to the measurement of creativity:The creative achievement questionnaire.Creativity Research Journal,26(1),62–71.

    Wang,H.C.,Chang,C.Y.,&Li,T.Y.(2008).Assessing creative problem–solving with automated text grading.Computers&Education,51(4),1450–1466.

    Wolfe,E.W.(2004).Identifying rater effects using latent trait models.Psychology Science,46(1),35–51.

    Wolfe,E.W.,&McVay,A.(2012).Application of latent trait modelsto identifying substantively interesting raters.Educational Measurement:Issues and Practice,31(3),31–37. Zeng,L.,Proctor,R.W.,& Salvendy,G.(2011).Can traditional divergent thinking tests be trusted in measuring and predicting real–world creativity?.Creativity Research Journal,23(1),24–37.

    Zeng,L.,Proctor,R.W.,&Salvendy,G.(2012).User–based assessment of website creativity:A review and appraisal.Behaviour&Information Technology,31(4),383–400.

    猜你喜歡
    計(jì)分測驗(yàn)研究者
    帶定性判斷的計(jì)分投票制及其公理刻畫
    高等教育中的學(xué)生成為研究者及其啟示
    引導(dǎo)素質(zhì)教育的新高考計(jì)分模式構(gòu)想:線性轉(zhuǎn)化計(jì)分模式
    基于單片機(jī)的中國式摔跤比賽計(jì)分器開發(fā)設(shè)計(jì)
    電子制作(2019年9期)2019-05-30 09:42:06
    研究者稱,經(jīng)CRISPR技術(shù)編輯過的雙胞胎已出生。科學(xué)將如何回應(yīng)?
    英語文摘(2019年2期)2019-03-30 01:48:40
    研究者調(diào)查數(shù)據(jù)統(tǒng)計(jì)
    中華手工(2018年6期)2018-07-17 10:37:42
    《新年大測驗(yàn)》大揭榜
    趣味(語文)(2018年7期)2018-06-26 08:13:48
    兩個(gè)處理t測驗(yàn)與F測驗(yàn)的數(shù)學(xué)關(guān)系
    考試周刊(2016年88期)2016-11-24 13:30:50
    計(jì)分考核表在績效管理中的應(yīng)用效果
    醫(yī)生注定是研究者
    原平市| 慈利县| 达拉特旗| 张家界市| 出国| 新乡县| 永寿县| 长泰县| 仁布县| 南开区| 富锦市| 福建省| 定安县| 玛纳斯县| 通海县| 读书| 修武县| 恩平市| 武隆县| 万宁市| 静乐县| 河北省| 陇南市| 盐津县| 会东县| 分宜县| 巴林左旗| 九龙城区| 建水县| 修水县| 沙坪坝区| 商河县| 闻喜县| 科技| 阆中市| 南陵县| 玉田县| 湘乡市| 清水河县| 疏附县| 孟津县|