顧彥慧 王道勝 王永根 龍?jiān)骑w 蔣鎖良 周俊生 曲維光
?
基于空間短文本對象的檢索策略
顧彥慧1,2,?王道勝3王永根1,2龍?jiān)骑w4蔣鎖良1,2周俊生1,2曲維光1,2
1.南京師范大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 南京 210023; 2.江蘇省信息安全保密技術(shù)工程研究中心, 南京 210023; 3.南京師范大學(xué)文學(xué)院, 南京 210097; 4.香港理工大學(xué)電子計(jì)算學(xué)系, 香港; ? E-mail: gu@njnu.edu.cn
針對傳統(tǒng)空間文本檢索策略中的效率和有效性問題, 對如何從給定的空間文本對象集合中快速有效地檢索出top-個(gè)近似結(jié)果進(jìn)行研究。基于一個(gè)空間檢索的通用框架, 提出一種基于空間文本對象的快速策略, 用于滿足用戶對效率與有效性的要求。實(shí)驗(yàn)結(jié)果證明該策略優(yōu)于現(xiàn)有方法。
空間文本對象; 語義相似; top-
在基于位置的應(yīng)用中, 檢索相似的空間文本對象是一個(gè)重要的研究課題, 如街旁、Foursquare服務(wù)等, 這里與位置信息有關(guān)的內(nèi)容得到利用。在某個(gè)地圖上, 對于一個(gè)查詢, 檢索系統(tǒng)需要找到與之最相關(guān)的空間文本對象集合, 對于集合中的每一個(gè)元素, 要同時(shí)考慮空間最相近并且語義最相似。在最近的研究中, 有很多研究致力于檢索空間文本對象??偟恼f來, 空間對象的索引方式可以歸納為以下幾類: 1)基于R-tree的策略[1-4]; 2)基于網(wǎng)格的策略[5]; 3)基于空間填充曲線的策略[6-7]。對于文本信息, 主要使用基于倒排文件的策略[1-2]和基于簽名文件的策略[8]。為了檢索相似的空間文本對象, 一種直接的方法就是融合空間索引以及文本索引。根據(jù)融合策略的不同, 大體上可以分為面向空間索引的策略[6]和面向文本索引的策略[9]。然而, 這些策略是一種松散的策略, 只是把空間索引和文本索引簡單地融合在一起, 空間消耗比較大, 檢索的效率也不高。為了克服松散融合的不足, 文獻(xiàn)[1,2,7] 提出緊密融合的策略。
由于緊密融合策略能夠無縫地將兩種不同的索引(空間索引和文本索引)組合到一個(gè)統(tǒng)一的框架中, 因此在這個(gè)框架中, 每個(gè)頂點(diǎn)是兩種相似度的組合(空間相似度與文本相似度)。文獻(xiàn)[2]中引入一個(gè)新型的索引結(jié)構(gòu), 稱為IR-tree, 每個(gè)R-tree的頂點(diǎn)與的子樹對象內(nèi)容的概要相關(guān)聯(lián)。然而, 對于空間文本對象來說, 這種文本描述往往很短, 并且有時(shí)幾乎沒有相同詞存在。對于空間文本對象來說, 文本信息比較短, 若使用傳統(tǒng)的詞頻計(jì)算的方式來計(jì)算文本之間的相似度, 不能得到精確的結(jié)果[1-2], 因此傳統(tǒng)的基于詞頻計(jì)算策略[10-13]不大適用于計(jì)算文本之間的相似度??紤]到空間文本對象的實(shí)際情況, 本文提出一種基于語義相似的文本相似度計(jì)算策略來融合相應(yīng)的空間信息, 從而得到比較精確的檢索結(jié)果。
本文提出一種快速有效地檢索相似空間文本對象的策略, 其中心思想在于建立一個(gè)完整的結(jié)構(gòu), 能無縫地融合空間索引和文本索引。實(shí)驗(yàn)結(jié)果表明, 由于考慮了空間文本對象文本的屬性, 本文提出的策略能有效地提高空間文本對象的檢索精度, 并且能保持較高的速度。
1 問題的提出
1.1 準(zhǔn)備知識
假設(shè)為一空間文本數(shù)據(jù)集合。每個(gè)空間對象∈被定義為一個(gè)對象對(.,.), 其中.是一個(gè)二維的地理位置(可以用經(jīng)度和維度表示),.是一個(gè)文本描述, 也就是用戶在某個(gè)地理位置的文本表達(dá)。算法要解決的問題是, 檢索出與查詢最相似的top-個(gè)空間文本對象。對于一個(gè)查詢=〈.,.,〉, 在給定的空間文本對象集合中尋找個(gè)對象, 這些對象按照相似度進(jìn)行排序(這里的相似度同時(shí)考慮了空間相似度和文本相似度), 即
具體地, 對于某查詢, 對象的排序值可以用下式計(jì)算:
,
其中,S(.,.)是對象.與.之間的歐氏 距離,T(.,.)是這兩個(gè)對象之間的文本距離,。
1.2 空間臨近與文本相似
空間臨近S被定義為標(biāo)準(zhǔn)化的歐氏距離, 即
dist(.,.)是查詢對象與所有數(shù)據(jù)集中對象的歐氏距離。文本之間的相似度計(jì)算可以使用現(xiàn)有方法, 如語言模型[1], 余弦策略[9]或BM25[1]。因此, 文本之間的距離可以定義為
T= 1 ? Sim(.,.)。
從前面的分析可以得知, 現(xiàn)有的基于詞頻以及共現(xiàn)的模式需要有很多相同的詞出現(xiàn)在相似的文本中, 這種方式不適合計(jì)算兩個(gè)短文本之間的相似度, 因?yàn)閮蓚€(gè)短文本之間雖然語義相似, 但往往只有很少的共同的詞[10-13]。為了克服短句的不足, 很多研究致力于解決短文本相似度的計(jì)算問題, 總的來說可以分為基于知識的策略[12]、基于語料庫的策 略[10-11]、基于語法的策略[11]以及混合策略[10,13]。
為了計(jì)算文本之間的相似度S(.,.), 我們使用最新的短文本相似度計(jì)算方法來組合不同的相似度計(jì)算策略[10,13]。需要強(qiáng)調(diào)的是, 短文本由詞組成, 因此計(jì)算短文本間的相似度歸根到底是計(jì)算詞與詞之間的相似度[10,13]。
1.3 通用框架模型
有很多工作致力于研究快速檢索top-空間文本對象, 本文在其中選取一個(gè)最具代表性的工作[1]作為研究對象。文獻(xiàn)[1]中使用一個(gè)混合索引結(jié)構(gòu)IR-tree, 融合了空間信息以及文本信息。IR-tree本質(zhì)上是一棵R-tree, 每個(gè)頂點(diǎn)關(guān)聯(lián)一個(gè)倒排文件索引, 這個(gè)索引包含此頂點(diǎn)所有子樹的信息。IR-tree的每個(gè)頂點(diǎn)能總結(jié)此頂點(diǎn)所有子節(jié)點(diǎn)的文本信息, 即此頂點(diǎn)能描述子節(jié)點(diǎn)的所有信息。同時(shí), 此頂點(diǎn)能估計(jì)出查詢與所有在子樹中對象的相關(guān)程度, 并給出邊界。因此, top-檢索的結(jié)果使用最佳優(yōu)先搜索和優(yōu)先隊(duì)列來實(shí)現(xiàn)。
2 本文提出的策略
考慮到文本的語義相似性, 本文提出一種快速有效的空間文本對象的檢索方法。在介紹本文的策略之前, 首先討論現(xiàn)有的集中空間文本對象的檢索方法。
2.1 基準(zhǔn)策略
若要快速有效地得到top-的空間文本對象, 主要的挑戰(zhàn)在于如何對空間信息以及文本信息進(jìn)行索引。一種簡單的方法就是利用R-tree來計(jì)算對象的空間相近程度, 利用倒排文件的方式來計(jì)算文本的相似性[14]。然后, 把兩種索引結(jié)合起來, 得到top-的空間文本對象。但是, 計(jì)算數(shù)據(jù)集中所有的候選對象是非常耗時(shí)的。另一種解決方法是基于倒排文件和R-tree來計(jì)算空間相近度以及文本相似度, 最終生成一個(gè)top候選對象的集合。然而, 這種方式也比較耗時(shí), 因?yàn)樵陬A(yù)先不知道查詢的情況下, 不能在第一步確定需要計(jì)算多少個(gè)候選對象來滿足最終的top-結(jié)果, 即不能保證第一步查找的對象能滿足后面的值。
2.2 基于語義的策略
本文的主要目的是將語義信息融合到索引結(jié)構(gòu)中, 并能很好地融合空間相近性與語義相似性。在文獻(xiàn)[1]中, 由于緊密融合了倒排文件索引以及R-tree, 在文本信息與空間信息的融合上取得較好的效果。對于給定的兩個(gè)短文本和, Sim(,)與短文本中代表性的詞對有關(guān)。設(shè)1,2, …,t和1,2, …,t是和的詞。如果≤, 則相似度值可以表示為
這里Sim表示代表性詞對之間的相似度, 其值可以從代表性的詞對之間獲得。因此, 為文本信息建立的倒排表必須滿足以下條件: 1)所有詞都必須定義; 2)接續(xù)列表必須與詞相關(guān)。然而, 如果一個(gè)查詢包含多個(gè)詞1,2, …,t, 如何從中獲取相關(guān)詞? 由于本文提出的策略是從倒排表中獲取排序列表, 每個(gè)詞與排序列表有關(guān), 因此很容易應(yīng)用閾值算法[15]來獲得與查詢最相關(guān)的文本。文獻(xiàn)[1]中將空間索引與文本索引融合在同一索引結(jié)構(gòu)中。根據(jù)索引建立的方式, 本文中融合文本的語義信息。
2.2.1 索引建立
IRS策略 IRS策略是將語義信息融合到IR-tree中(即使用了語義相似度的IR-tree)。IRS的建立利用了在R-tree中普遍使用的插入操作[16]。此操作包含選擇葉節(jié)點(diǎn)和分裂節(jié)點(diǎn), 并保證節(jié)點(diǎn)的子節(jié)點(diǎn)包含節(jié)點(diǎn)中所有的文本信息。每個(gè)節(jié)點(diǎn)包含一個(gè)指向倒排表的指針。在IRS的索引結(jié)構(gòu)中, 葉子節(jié)點(diǎn)包含一組實(shí)體, 記為(,,.), 這里為數(shù)據(jù)集中的空間文本對象,為對象的矩形邊界,.是對象的文本描述。在子節(jié)點(diǎn)中, 存儲指向倒排表的指針。非葉節(jié)點(diǎn)包含一組實(shí)體, 記為(,,.), 這里為子節(jié)點(diǎn)的地址,為包含所有矩形的最小邊界矩形,.為此矩形的文本描述。本文融合了每個(gè)空間文本對象的語義信息, 所以在倒排表中, 每個(gè)詞對應(yīng)一組文本列表對象, 這些對象按照詞語文本之間相似度的倒序排列。在IRS 中, 文本信息總結(jié)了所有子節(jié)點(diǎn)中的文本內(nèi)容, 所以能預(yù)估與查詢相關(guān)的范圍。
DIRS策略 從IRS策略可以看出, 索引建立時(shí)只考慮空間信息, 即最小矩形是否與空間位置有關(guān)。在實(shí)際情況中, 對于一個(gè)查詢, 距離查詢最近的不一定是用戶最終想得到的結(jié)果, 因此在索引建立時(shí)需要同時(shí)考慮空間信息和文本信息。與IRS策略相似的是, 非葉節(jié)點(diǎn)包含一組實(shí)體, 記為(,,.)。與R-tree操作相同, 對于一個(gè)新的空間文本對象, 為了選擇合適的插入路徑, DIRS同時(shí)考慮了空間信息和文本信息。記每個(gè)節(jié)點(diǎn)的條目為En1, En2, …, En。令new是新插入的空間文本對象, 在R-tree中, En的面積由于新空間文本對象new的加入而變大。本文使用一個(gè)衡量指標(biāo)EnlargeRec(En)來描述面積的增加值:
EnlargeRec(En) = Rec(Ennew.) ? Rec(En),
其中, Rec(Ennew.)是En融入了新空間文本對象new后的新實(shí)體??紤]了文本信息后, 面積增加可以用下式表示:
其中,是調(diào)節(jié)空間信息與文本信息的參數(shù), Recmax是包含所有空間文本對象的最小邊界矩形。
據(jù)報(bào)道,我國護(hù)理科研在心理護(hù)理、人文護(hù)理等的研究遠(yuǎn)遠(yuǎn)落后于發(fā)達(dá)國家,我國在對照顧者的護(hù)理方面與國外相比差距甚遠(yuǎn)[4]。因此,重視患者照顧者的早期心理狀況,盡早介入照顧者的心理干預(yù),能有效減輕照顧者的身心壓力,有助于促進(jìn)患者的康復(fù)。
不同于R-tree, 在建立DIR索引的插入操作中, 選取子樹時(shí)要考慮文本信息, 使EnlargeRec(En)的值最小。同樣, 在分裂操作中也需要考慮文本的信息, 即在建立索引的整個(gè)過程中同時(shí)考慮到空間信息與文本信息。
2.2.2 查詢過程
最佳優(yōu)先遍歷算法[17]和優(yōu)先隊(duì)列用于存儲訪問過的頂點(diǎn)和空間文本對象。我們用min(,)表示查詢與矩形之間的邊界, Simdist(,)表示與每個(gè)空間文本對象之間的距離, 詳細(xì)說明見表1。需要說明的是, Simdist(,)算法僅計(jì)算查詢與算法遍歷過的對象或矩形。我們用一個(gè)例子來說明DIRS與IRS策略的不同, 具體過程見表2和3。
表1 查詢Q與對象以及矩形的距離值
表2 基于IRS策略的查詢過程
表3 基于DIRS策略的查詢過程
從表2可以看出, 為了得到top-2對象2,1, IRS策略的檢索過程遍歷5,6,1,2,3,4, 也就是遍歷整棵樹中大部分的節(jié)點(diǎn)。這是因?yàn)镮RS策略在建立索引的時(shí)只考慮空間信息, 忽視了文本的語義信息。
從表3可以看出, DIRS策略的檢索過程僅需遍歷5,1,3就能得到最終的top結(jié)果。這是因?yàn)镈IRS在索引建立時(shí)考慮了文本的語義信息, 使得索引結(jié)構(gòu)更加準(zhǔn)確, 查詢的過程只需要遍歷很少的節(jié)點(diǎn), 即只需要5步, 少于IRS策略的7步。
3 實(shí)驗(yàn)分析
我們通過實(shí)驗(yàn), 從效率和有效性兩個(gè)方面檢驗(yàn)本文提出的策略。實(shí)驗(yàn)在16-core Intel? Xeon? E5530服務(wù)器上進(jìn)行, 操作系統(tǒng)為Debian 2.6.26-2, 所有程序使用C語言編寫, 利用GNU gcc編譯器編譯。
本文使用文獻(xiàn)[18]中使用的數(shù)據(jù)集。此數(shù)據(jù)集共有225098個(gè)用戶, 22506721個(gè)唯一的空間文本對象(這里的對象既含有空間信息, 又含有文本信息)。為了檢驗(yàn)本文所提策略的有效性, 將IR-tree沒有融入語義信息作為基準(zhǔn)策略, 記為baseline, 將IR-tree使用了語義信息記為IRS, 將文本信息索引加上語義融合記為DIRS。本文所用數(shù)據(jù)集的統(tǒng)計(jì)信息見表4。
表4 數(shù)據(jù)集統(tǒng)計(jì)信息
說明: “原始”表示從原始的數(shù)據(jù)集中抽取的文本結(jié)果, 沒有經(jīng)過任何預(yù)處理; “處理后”表示去除停用詞以及規(guī)則化后的結(jié)果。
3.1 有效性實(shí)驗(yàn)結(jié)果
在有效性試驗(yàn)中, 我們隨機(jī)選擇5個(gè)查詢, 分別計(jì)算在基準(zhǔn)策略、IRS以及DIRS三種策略下的精度。從前面的分析可以看出, 影響有效性的因素有兩個(gè)。一個(gè)影響因素是在計(jì)算過程中調(diào)節(jié)融合空間相近程度與文本相近程度的參數(shù), 這個(gè)參數(shù)的作用主要是調(diào)節(jié)空間相近與文本相似這兩個(gè)因素的權(quán)重。這是由于在實(shí)際的系統(tǒng)中, 人們對空間相似度與文本相似的關(guān)心程度不同, 因此需要調(diào)節(jié)這個(gè)權(quán)重來計(jì)算出更加精確的結(jié)果。另一個(gè)影響因素是索引建立時(shí), 用來調(diào)節(jié)文本加強(qiáng)程度的參數(shù)。由于本文所提策略在索引建立初期就考慮文本因素對于整個(gè)索引建立的影響, 因此就是為了調(diào)節(jié)文本因素對索引建立影響程度的參數(shù)。我們通過交叉驗(yàn)證實(shí)驗(yàn), 選測和的最佳值。
和的取值都在0.1~0.9之間。從實(shí)驗(yàn)結(jié)果得到: 對于IRS,=0.68; 對于DIRS,=0.68,=0.2。有效性實(shí)驗(yàn)結(jié)果如表5所示, 可以看出, IRS策略和DIRS策略由于考慮了語義信息, 所以明顯優(yōu)于基準(zhǔn)策略。
表5 有效性實(shí)驗(yàn)結(jié)果
3.2 不同參數(shù)下實(shí)驗(yàn)結(jié)果
由于本文的實(shí)驗(yàn)結(jié)果與兩個(gè)重要的參數(shù)和有關(guān), 因此我們分別選取和在0.1~0.9區(qū)間, 按照粒度0.1來驗(yàn)證, 結(jié)果如表6和7所示。可以看到, 相比于IRS策略, 由于DIRS策略在索引建立時(shí)已經(jīng)考慮了文本之間的信息, 所以能大幅度減少訪問時(shí)間。從表6和7還可以看出, 不同的和值對效率的影響主要表現(xiàn)在節(jié)點(diǎn)訪問的順序以及在某個(gè)節(jié)點(diǎn)訪問的時(shí)間長短上, 所以和這兩個(gè)參數(shù)對基準(zhǔn)策略的影響不大, 而對IRS策略和DIRS策略有一定的影響。因此, 為了平衡有效性與效率之間的關(guān)系, 如何選取和參數(shù)值也是一個(gè)重要的研究課題。
表6 不同α下效率實(shí)驗(yàn)結(jié)果
表7 不同δ下效率實(shí)驗(yàn)結(jié)果
3.3 效率實(shí)驗(yàn)結(jié)果
效率的比較使用有效性試驗(yàn)中最佳的參數(shù)配置, 通過以下的實(shí)驗(yàn)來檢驗(yàn): 不同的數(shù)據(jù)集大小以及不同的值。本文從數(shù)據(jù)集中隨機(jī)抽取10個(gè)對象作為查詢, 實(shí)驗(yàn)結(jié)果包括平均查詢時(shí)間, 結(jié)果如圖1和2所示??梢钥闯? 由于DIRS在索引建立時(shí)考慮了文本信息, 使得查詢訪問較少的節(jié)點(diǎn)就能得到最終的結(jié)果, 所以在性能上DIRS比IRS具優(yōu)勢。
4 總結(jié)
本文針對傳統(tǒng)空間文本檢索策略中的有效性問題, 對如何從給定的空間文本對象集合中快速有效地檢索出top-個(gè)近似結(jié)果進(jìn)行研究, 主要貢獻(xiàn)如下。
1)以空間文本對象檢索為研究對象, 提出一種基于語義的策略, 在空間文本兌現(xiàn)檢索過程中考慮到語義信息, 通過建立綜合的索引來無縫融合空間索引與文本索引。
2)提出一種快速有效的空間文本對象的檢索算法, 這種算法對于實(shí)際應(yīng)用系統(tǒng)非常重要, 因?yàn)橛脩舾觾A向于找到語義相似的對象。
3)對實(shí)際數(shù)據(jù)的實(shí)驗(yàn)表明, 與現(xiàn)有策略相比較, 本文提出的策略在速度以及有效性方面有較大優(yōu)勢。
[1]Cong G, Jensen C S, Wu D. Efficient retrieval of the top-most relevant spatial web objects // Proceedings of the VLDB Endowment. Lyon, 2009: 337–348
[2]Li Z, Lee K C K, Zheng B, et al. IR-tree: an efficient index for geographic document search. IEEE Transac-tions on Knowledge and Data Engineering, 2011, 23 (4): 585–599
[3]Zhang D, Chee Y M, Mondal A, et al. Keyword search in spatial databases: towards searching by document // Proceedings of IEEE International Conference on Data Engineering. Shanghai, 2009: 688–699
[4]Zhou Y, Xie X, Wang C, et al. Hybrid index structures for location-based web search // Proceedings of Inter-national Conference on Information and Knowledge Management. Bremen, 2005: 155–162
[5]Khodaei A, Shahabi C, Li C. Hybrid indexing and seamless ranking of spatial and textual features of web documents // Proceedings of International Con-ference on Database and Expert Systems Applica-tions. Bilbao, 2010: 450–466
[6]Chen Y Y, Suel T, Markowetz A. Efficient query processing in geographic web search engines // Proceedings of ACM SIGMOD International Con-ference on Management of Data. Chicago, 2006: 277–288
[7]Christoforaki M, He J, Dimopoulos C, et al. Text vs. space: efficient geo-search query processing // Procee-dings of International Conference on Information and Knowledge Management. Glasgow, 2011: 423–432
[8]Felipe I D, Hristidis V, Rishe N. Keyword search on spatial databases // Proceedings of IEEE International Conference on Data Engineering. Cancun, 2008: 656–665
[9]Rocha-Junior J B, Gkorgkas O, Jonassen S, et al. Efficient processing of top-spatial key-word queries // Proceedings of International Symposium on Spatial and Temporal Databases. Minneapolis, 2011: 205–222
[10]Islam A, Inkpen D. Semantic text similarity using corpusbased word similarity and string similarity. ACM Transactions on Knowledge Discovery from Data, 2008, 2(2): 1-25
[11]Li Yuhua, McLean D, Bandar Z, et al. Sentence similarity based on semantic nets and corpus statistics. IEEE Transactions on Knowledge and Data Engineering, 2006, 18(8): 1138-1150
[12]Tsatsaronis G, Varlamis I, Vazirgiannis M. Text relatedness based on a word thesaurus. Journal of Artificial Intelligence Research, 2010, 37(1): 1–40
[13]Gu Yanhui, Yang Zhenglu, Xu Guandong, et al. Exploration on efficient similar sentences extraction. World Wide Web, 2014, 17(4): 595-626
[14]Martins B, Silva M J, Andrade L. Indexing and ranking in GEO-IR systems // Proceedings of the Workshop on Geographic Information Retrieval. Bremen, 2005: 31–34
[15]Fagin R, Lotem A, Naor M. Optimal aggregation algorithms for middleware // Proceedings of ACM Symposium on Principles of Database Systems. Santa Barbara, 2001: 102–113
[16]Guttman A. R-trees: a dynamic index structure for spatial searching // Proceedings of ACM SIGMOD International Conference on Management of Data. Boston, 1984: 47-57
[17]Hjaltason G R, Samet H. Distance browsing in spatial databases. ACM Transactions on Database Systems, 1999, 24(2): 265-318
[18]Cheng Z, Caverlee J, Lee K, et al. Exploring millions of footprints in location sharing services // Procee-dings of International Conference on Web and Social Media. Barcelona, 2011: 81–88
Similar Spatial Textual Objects Retrieval Strategy
GU Yanhui1,2,?, WANG Daosheng3, WANG Yonggen1,2, LONG Yunfei4, JIANG Suoliang1,2, ZHOU Junsheng1,2, QU Weiguang1,2
1. School of Computer Science and Technology, Nanjing Normal University, Nanjing 210023; 2. Jiangsu Research Center of Information Security & Privacy Technology, Nanjing 210023; 3. School of Chinese Language and Culture, Nanjing 210097; 4. Department of Computing, The Hong Kong Polytechnic University, Hong Kong; ? E-mail: gu@njnu.edu.cn
Based on the efficiency and effectiveness issue of traditional simiar spatial textual objects retrieval, a semantic aware strategy which can effectively and efficiently retrieve the top-similar spatial textal objects is proposed. The efficient retrieval strategy which is based on spatial textual objects is built on a common framework of spatial object retrieval, and it can satisfy the efficiency and effectiveness issues of users. Extensive experimental evaluation demonstrates that the performance of the proposed method outperforms the state-of-the-art approach.
spatial textual object; semantic similar; top-
10.13209/j.0479-8023.2016.008
TP391
2015-06-19;
2015-09-03; 網(wǎng)絡(luò)出版日期: 2015-09-30
國家自然科學(xué)基金(61272221, 61472191)、國家社會科學(xué)基金(11CYY030, 10CYY021)、江蘇省社會科學(xué)基金(12YYA002)和江蘇省高校自然科學(xué)基金(14KJB520022)資助