• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Apriori算法的科技期刊約稿組稿機(jī)制

      2015-10-10 01:30:42包震宇
      學(xué)報(bào)編輯論叢 2015年0期
      關(guān)鍵詞:上海師范大學(xué)約稿項(xiàng)集

      包震宇

      (上海師范大學(xué)學(xué)報(bào)期刊雜志社,上海200234)

      基于Apriori算法的科技期刊約稿組稿機(jī)制

      包震宇

      (上海師范大學(xué)學(xué)報(bào)期刊雜志社,上海200234)

      基于Apriori算法設(shè)計(jì)了一套用于確定組織承辦專家研討會(huì)主題的生成方案,以此為專家學(xué)者建立良好學(xué)術(shù)交流平臺(tái),從而增強(qiáng)科技期刊社約稿組稿工作的針對(duì)性,提高約稿組稿工作的效率。將該設(shè)計(jì)方案用于《上海師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》2001—2010年文章信息庫(kù),提取適合約稿組稿的主題。結(jié)果表明:方案較好地反映了10年間學(xué)報(bào)發(fā)表論文的部分學(xué)科傾向,為將來(lái)承辦相關(guān)專業(yè)化學(xué)術(shù)研討會(huì)提供了扎實(shí)的理論依據(jù),亦為期刊社提供了準(zhǔn)確的約稿組稿的工作方向。

      約稿組稿;Apriori算法;學(xué)術(shù)研討會(huì)主題

      眾所周知,唯有高質(zhì)量的稿件,才能在充斥著參差不齊的刊物的大環(huán)境中,吸引更多的關(guān)注[1]。對(duì)于科技期刊來(lái)說(shuō),約稿組稿更需要一定的針對(duì)性[2]。在眾多約稿形式中,承辦高質(zhì)量的學(xué)術(shù)研討會(huì)已然成為最佳選擇之一。

      小型會(huì)議的與會(huì)人員數(shù)量相對(duì)較少,研究方向卻高度統(tǒng)一[3]。這種極具學(xué)術(shù)價(jià)值的研究成果,而對(duì)于一份刊物而言,是一筆非常珍貴的學(xué)術(shù)財(cái)富,也是刊物編輯重點(diǎn)約稿組稿的對(duì)象[4]。由此,承辦某一特定領(lǐng)域的小型會(huì)議可以視為刊物編輯部約稿組稿工作的一條新思路[5]。

      要承辦小型學(xué)術(shù)研討會(huì),首要任務(wù)就是尋找研究對(duì)象關(guān)聯(lián)度極高的專家群[6]。本文作者在建立一套稿件信息數(shù)據(jù)庫(kù)的基礎(chǔ)上,基于Apriori算法的基本思想,對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行對(duì)比分析,為確定學(xué)術(shù)研討會(huì)主題提供可靠的理論依據(jù)。

      1 Apriori算法基本思想

      Argawl等于1993年首先提出了挖掘顧客交易數(shù)據(jù)庫(kù)中項(xiàng)集間的關(guān)聯(lián)規(guī)則問(wèn)題,設(shè)計(jì)了基于頻繁集理論的Apriori算法。諸多的研究人員對(duì)關(guān)聯(lián)規(guī)則的挖掘問(wèn)題進(jìn)行了大量的研究,包括對(duì)原有算法的優(yōu)化及算法的應(yīng)用與推廣[7-8]。

      Apriori算法使用逐層搜索的迭代方法,即“K-項(xiàng)集”用于搜索“K+1-項(xiàng)集”。首先,找出頻繁項(xiàng)集“1-項(xiàng)集”的集合,記為L(zhǎng)1。L1用于尋找頻繁“2-項(xiàng)集”的集合L2,而L2用于找L3,如此下去,直到不能找到“K-項(xiàng)集”。換而言之,首先產(chǎn)生頻繁1-項(xiàng)集L1,然后是頻繁2-項(xiàng)集L2,直到有某個(gè)r值使得Lr為空,算法停止。

      假定存在事務(wù)數(shù)據(jù)表如表1所示,則其頻繁項(xiàng)集產(chǎn)生過(guò)程如圖1所示。

      由圖 1可知,該事務(wù)數(shù)據(jù)庫(kù)實(shí)例的頻繁集為{A,B,C}和{A,B,E},置信度計(jì)算結(jié)果如表 2所示。

      表1 事務(wù)數(shù)據(jù)庫(kù)實(shí)例

      圖1 Apriori算法執(zhí)行示意圖

      2 Apriori算法在約稿組稿機(jī)制中的應(yīng)用

      為突出本研究的實(shí)驗(yàn)效果,采用《上海師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》2001—2010年的真實(shí)出版數(shù)據(jù)(大約7 000條),實(shí)際應(yīng)用中可選擇最近幾年的數(shù)據(jù),提高實(shí)驗(yàn)結(jié)果與近期熱點(diǎn)的關(guān)聯(lián)性。

      表2 頻繁集的置信度計(jì)算表

      2.1數(shù)據(jù)預(yù)處理

      在原有數(shù)據(jù)庫(kù)中截取文章表(tb_article)中的作者名(FirstAuthor)與關(guān)鍵字(Keywords)字段,以此作為原始粗糙集,并對(duì)該粗糙集進(jìn)行縱向、橫向?qū)傩约s簡(jiǎn)。

      縱向約簡(jiǎn):遍歷數(shù)據(jù)表的作者名字段,若遇到同一作者的2篇文章,則合并2條記錄的關(guān)鍵字字段內(nèi)容,并刪除一條記錄;

      橫向約簡(jiǎn):在縱向約簡(jiǎn)后的粗糙集上,遍歷關(guān)鍵字字段,刪除同一記錄中的重復(fù)內(nèi)容。

      這里,假設(shè)數(shù)據(jù)表中同名作者為同一人。實(shí)際應(yīng)用中,可在作者名后加一位數(shù)字或加上第二作者名,以此區(qū)分同名作者的不同身份。

      至此,得到了數(shù)據(jù)預(yù)處理后的待操作項(xiàng)集,如圖2所示。

      圖2 數(shù)據(jù)預(yù)處理后的項(xiàng)集

      2.2Apriori算法的實(shí)際操作

      算法的實(shí)現(xiàn)步驟如下:

      按Apriori算法的基本思想對(duì)項(xiàng)集進(jìn)行遍歷分析,計(jì)算出所有關(guān)鍵字的出現(xiàn)次數(shù),以此作為 1-項(xiàng)集。其中,出現(xiàn)次數(shù)較多的幾個(gè)詞語(yǔ)有:“方程”(60)、“函數(shù)”(71)、“數(shù)據(jù)庫(kù)”(33)、“向量”(44)、“宇宙”(37)等。這里,可以設(shè)置最小支持度為10,刪除出現(xiàn)頻率較低的詞語(yǔ),計(jì)算出頻繁的1-項(xiàng)集,從而減少算法執(zhí)行的時(shí)間花費(fèi)。

      將頻繁的1-項(xiàng)集排列組合,成為2-項(xiàng)集,并計(jì)算其支持度,然后依照最小支持度進(jìn)行“剪枝”,得出頻繁的2-項(xiàng)集:<方程,線性>(42)、<宇宙,理論>(17)、<中國(guó),隱翅蟲>(28)等。

      重復(fù)生成k-項(xiàng)集,并將其約簡(jiǎn)為頻繁的k-項(xiàng)集,直到無(wú)法找到k+1-項(xiàng)集。最終得到的頻繁項(xiàng)集一共有23條,如<微分,線性,方程,穩(wěn)定性>(16)、<中國(guó),隱翅蟲,新記錄,物種>(14)等。

      算法設(shè)計(jì)代碼如圖3所示。

      圖3 算法設(shè)計(jì)樣例

      2.3對(duì)約稿組稿機(jī)制的啟示

      由算法設(shè)計(jì)實(shí)驗(yàn)可知,在2001—2010這10年間,《上海師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》發(fā)表的論文中,<微分,線性,方程,穩(wěn)定性>、<中國(guó),隱翅蟲,新記錄,物種>這兩個(gè)專題的關(guān)鍵字相對(duì)關(guān)聯(lián)度較高,可以結(jié)合相關(guān)專業(yè)舉辦小規(guī)模的學(xué)術(shù)研討會(huì),為該領(lǐng)域?qū)W術(shù)專家提供良好而又專業(yè)的學(xué)術(shù)交流平臺(tái),使他們能深入探討學(xué)術(shù)相關(guān)話題,并趁此機(jī)會(huì)增大這方面的學(xué)術(shù)論文約稿組稿力度,應(yīng)該會(huì)有不錯(cuò)的效果。

      在此過(guò)程中,對(duì)于與會(huì)專家學(xué)者而言,既得到了一個(gè)暢所欲言的交流平臺(tái),彼此匯報(bào)各自的研究進(jìn)展,并在獲取其他學(xué)者研究動(dòng)向的同時(shí),又可拓展思路,為今后的研究工作打下基礎(chǔ);對(duì)于主辦此次學(xué)術(shù)會(huì)議的期刊社來(lái)說(shuō),可增強(qiáng)與這些專家們的友誼,設(shè)置專欄,組織策劃本次會(huì)議的專題報(bào)道,提升這次學(xué)術(shù)會(huì)議學(xué)術(shù)價(jià)值,也提高了期刊社的知名度與影響力,可謂是一個(gè)雙贏的結(jié)果。

      3 結(jié)論與展望

      現(xiàn)如今,一家科技期刊不能僅依靠傳統(tǒng)的發(fā)展模式來(lái)維持,尤其是在約稿組稿工作上,期刊社編輯要提高自身的約稿組稿積極性,自動(dòng)與專家聯(lián)系交流。在專業(yè)性組稿方面,更是需要結(jié)合創(chuàng)新意識(shí),借助相關(guān)軟件支持,在原有信息庫(kù)中挖掘有一定關(guān)聯(lián)度的規(guī)則作為約稿組稿的工作方向,使約稿組稿工作變得更有針對(duì)性,提高工作效率,達(dá)到事半功倍的效果。

      本文作者結(jié)合數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則算法——Apriori算法,試圖將算法融入到約稿組稿的工作中,并對(duì)此項(xiàng)研究開展了一系列的理論與實(shí)踐的論證。實(shí)驗(yàn)結(jié)果表明,在原有數(shù)據(jù)庫(kù)中的信息中,確實(shí)存在關(guān)聯(lián)度較高的規(guī)則,這為期刊社有針對(duì)性地開展約稿組稿工作提供了確鑿的依據(jù)。

      本研究基于Apriori算法,設(shè)計(jì)了一套簡(jiǎn)易程序,以2001—2010這10年間《上海師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》發(fā)表的論文作為基礎(chǔ)數(shù)據(jù)庫(kù),實(shí)現(xiàn)了算法思想在具體操作中的應(yīng)用。但限于數(shù)據(jù)量較少(約7 000條)的影響,只檢索到2條學(xué)科關(guān)聯(lián)度較高的集合,未來(lái)將收集擴(kuò)大基礎(chǔ)數(shù)據(jù)庫(kù),以期挖掘更多潛在關(guān)聯(lián)學(xué)科。

      另外,Apriori算法需要遍歷多次數(shù)據(jù)表,這將嚴(yán)重影響算法執(zhí)行的效率,在今后的研究中,作者將試圖改進(jìn)算法的運(yùn)行機(jī)制,壓縮時(shí)間成本,降低算法的復(fù)雜度,以期達(dá)到更好的效果。

      [1]林松清,佘詩(shī)剛.科技學(xué)術(shù)期刊的組稿及其審理方法[J].編輯學(xué)報(bào),2012,24(5):476-478.

      [2]卓選鵬,趙大良.莫嘆專家賜稿難 轉(zhuǎn)變思路譜新篇[J].中國(guó)科技期刊研究,2012,23(1):137-138.

      [3]顏巧元,劉義蘭,王菊香,等.試論稿件處理中科技期刊編輯對(duì)作者的人文關(guān)懷[J].中國(guó)科技期刊研究,2013,24(4):780-783.

      [4]吳學(xué)軍,趙衛(wèi)星.科技期刊計(jì)劃組稿的模式——以《上海電機(jī)學(xué)院學(xué)報(bào)》為例[J].編輯學(xué)報(bào),2011,23(1):58-60.

      [5]曹昭君,陳蔓,衛(wèi)李靜,等.組稿與專題策劃的新思維[J].江漢大學(xué)學(xué)報(bào):自然科學(xué)版,2012,40(4):167-168.

      [6]劉剛,李朝前,陳曉鋒,等.會(huì)議與科技期刊約稿[J].江漢大學(xué)學(xué)報(bào):自然科學(xué)版,2012,40(4):172-174.

      [7]崔旭,劉小麗.基于粗糙集的改進(jìn)Apriori算法研究[J].計(jì)算機(jī)仿真,2013,30(1):329-332,385.

      [8]亓文娟,晏杰.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則Apriori算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013,22(4):121-124.

      猜你喜歡
      上海師范大學(xué)約稿項(xiàng)集
      苗語(yǔ)典型存在動(dòng)詞初探
      約稿啟事
      約稿啟事
      約稿啟事
      發(fā)展教育,讓每一位師生都得到充分和諧的發(fā)展——上海師范大學(xué)附屬中學(xué)
      《實(shí)用臨床醫(yī)學(xué)》約稿
      上海師范大學(xué)學(xué)生篆刻作品入選全國(guó)大展
      échange humain sous le contexte de la mondialisation
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      一種頻繁核心項(xiàng)集的快速挖掘算法
      布尔津县| 新余市| 天祝| 永年县| 陵川县| 公安县| 溆浦县| 柘荣县| 本溪市| 通榆县| 客服| 大荔县| 尉犁县| 乐陵市| 通河县| 陈巴尔虎旗| 扶风县| 玛多县| 右玉县| 休宁县| 平乐县| 宁波市| 蓝田县| 西安市| 博客| 新沂市| 海口市| 瑞安市| 太白县| 调兵山市| 博乐市| 望江县| 乐昌市| 木里| 河南省| 静宁县| 峡江县| 志丹县| 洪泽县| 渭源县| 扎兰屯市|