楊 毅,馮文賀
(1.烏拉爾聯(lián)邦大學 計算機詞典學實驗室,俄羅斯 葉卡捷琳堡 620000;2. 廣東外語外貿大學 語言工程與計算實驗室,廣東 廣州 510006)
小句(clause, клауза)是篇章翻譯的基本單位。研究表明,在機器翻譯系統(tǒng)中,基于小句的翻譯比基于大句(sentence)的翻譯的翻譯結果的可接受率高出45%[1]。由此,基于小句的翻譯模型也成為篇章機器翻譯研究的重要課題[2]。統(tǒng)計翻譯的根基在于有充分的雙語對齊樣本和雙語語法知識。相應地,基于小句的雙語對齊語料庫與語法標注庫的研制與分析就成為面向篇章機器翻譯的基礎性重要課題。
漢俄翻譯中,漢語小句的俄語對應單位復雜多樣,選擇何種對應單位是漢語小句俄譯的關鍵問題。如例1中,漢語小句C1~C5的俄語對應單位分別為 R1~R5。其中R1為副動詞短語,R2和R4是簡單句組成部分,R3是前置詞短語,R5是主從復合句。
例1C1保持經濟中高速增長,C2推動產業(yè)邁向中高端水平。C3實現全面建成小康社會目標,C4到2020年國內生產總值和城鄉(xiāng)居民人均收入比2010年翻一番,C5“十三五”時期經濟年均增長保持在6.5%以上。
R1Поддерживая умеренно высокие темпы экономического роста,R2стимулировать выход всех отраслей экономики на средний и высокий уровень развития.R3Для достижения намеченных целей полного построения среднезажиточного обществаR4нужно удвоить к 2020 году ВВП и среднедушевые доходы городского и сельского населения по сравнению с 2010 годом.R5Это значит, что среднегодовой прирост китайской экономики в период 13-й пятилетки должен быть не ниже 6.5%.
如例1所示,如能提供漢俄小句對齊樣本,并進一步給出對應小句的語法知識,將為雙語小句轉換提供非常有效的知識指導,也將為機器翻譯等研究奠定基礎。至今,漢俄平行語料庫已有很多[3-5],但這些平行語料庫一般基于操作性強的句子(一般以句號等為標志),甚至段落對齊,而基于小句對齊的平行語料庫僅開始初步實踐[6-7],漢俄小句語法知識的標注資源幾乎沒有。
本文標注漢語小句與其俄語對應單位,并進行統(tǒng)計分析?;静襟E如下: 首先,在漢俄平行文本上,以一定標準切分出漢語小句,以漢語小句切分為依據,對齊切分出俄語對應單位,形成漢俄小句對齊語料庫(第二部分);其次,制定俄語對應單位的語法分析原則及體系,實現漢俄小句語法標注語料庫(第三部分);最后,基于標注語料庫分析俄語對應單位的統(tǒng)計分布(第四部分)。
本文主要采用馮文賀等在創(chuàng)建漢英小句對齊語料庫中[8]提出的雙語小句對齊切分方法及原則,即: 首先,依據一定標準切分漢語小句;其次,以漢語小句切分為依據,按照語義對應原則對齊切分俄語,得到漢語小句的俄語對應單位。
漢語研究對小句(clause, клауза)至今沒有統(tǒng)一的定義與切分標準。本文采用李艷翠等[9]對漢語“子句”的定義: “子句是篇章分析的基本單位,含傳統(tǒng)單句和復句中的分句。結構上,子句至少包含一個謂語部分,至少表達一個命題;功能上,子句對外不作為其他子句結構的語法成分,子句和子句間發(fā)生命題關系;形式上,子句間一定有標點分割,通常是逗號、分號和句號等。實際語料中,一些與典型子句在結構、功能、形式上類似的傳統(tǒng)所謂短語在特定條件下也作為子句處理。”該標準已被應用于建立漢語篇章結構語料庫[10]和漢英篇章結構語料庫[11]及自動分析研究,并取得較好效果。
以漢語小句切分為依據,在俄語翻譯文本中得到語義上與漢語小句對應的俄語篇章單位。例如,在例2中,漢語切分為C1~C5共五個小句,語義上對應的俄語對應單位切分為R1~R5。在語法上,R1、 R2、 R3、R5是典型小句,R4則是句組。如按照俄語本身性質,R4可以進一步分為兩個小句: “стремились к тому, чтобы ......”和“проводились ......”。由此可見,漢語小句的俄語對應單位切分并非是按照俄語小句標準切分而來,而是以漢語小句為標準的切分。
例2C1我們實施積極的財政政策和穩(wěn)健的貨幣政策,//C2堅持正確處理保持經濟平穩(wěn)較快發(fā)展、調整經濟結構和管理通脹預期的關系,/C3更加注重把握好政策實施的重點、力度和節(jié)奏,//C4努力做到調控審慎靈活、適時適度,/C5不斷提高政策的針對性、靈活性和前瞻性。
R1Мы проводили активную финансовую и уравновешенную монетарную политику, //R2продолжали правильно разрешать отношения между поддержанием ровного и относительно быстрого развития экономики, урегулированием экономической структуры и управлением ожидаемой инфляцией. /R3Придавали большее значение правильному определению главных участков реализации политики, степени ее воздействия и ритмичности осуществления, //R4стремились к тому, чтобы регулирование и контроль были взвешенными и гибкими, проводились в подходящий момент и в разумной мере. /R5Непрерывно повышали целенаправленность политики, ее гибкость и опережаемость.
基于以上切分原則,選取2016年《中國政府工作報告》的漢俄雙語文本,進行漢俄小句切分。以下對俄語對應單位進行語法分析。
根據一定分析原則和語法體系對俄語對應單位進行語法分析與標注,形成俄語對應單位的語法標注庫。
實踐表明,按照漢語小句切分的俄語對應單位并不全都是典型句法單位,對此,俄語對應單位語法單位性質的認定需要重新制定分析原則。
第一,認定對象主體以“整體為主,局部為輔,整體優(yōu)先局部”為原則。與漢語小句對應的俄語對應單位結構復雜,包含多種句法結構。如例3中,結構上,R1是簡單句,R2是副動詞短語,R3為主從復合句;整體上,R1~R3為并列復合句。該部分的判定以其所在整體的句法性質而定。所以,R1、R2和R3被認定為并列復合句組成部分。
例3C1新修訂的環(huán)境保護法必須嚴格執(zhí)行,//C2對超排偷排者必須嚴厲打擊,/C3對姑息縱容者必須嚴肅追究。
R1Необходимо строго соблюдать пересмот-ренный Закон об охране окружающей среды,//R2сурово карая согласно закону за превышение нормативов предельно допустимых выбросов и нелегальные выбросы, /R3а также строго спрашивая по закону с тех, кто попустительствует этим правонарушениям.
第二,以漢語小句為依據切分的俄語對應單位中有時會出現省略現象,進而影響到該語法性質的判斷,對其性質認定以將省略部分補充完整后的整體為對象分析。如例2中,R2省略了主語(мы),分析中應補出,并認定R2為雙部句。
第三,帶有同等謂語的句子在俄語語法研究中一直存有爭議,其爭議的焦點是這類句子應當視為簡單句還是復合句[12]。同等謂語分為名詞性合成謂語和動詞性合成謂語。在標注過程中,我們把動詞性合成謂語中的同等謂語部分標注為動詞短語,如例4中,R1、R2、R3、R4為主從復合句組成部分,R1為無人稱句,R2、R3為作為R1同等謂語的動詞短語。
例4C1必須毫不動搖堅持以經濟建設為中心,/C2推動科學發(fā)展,/C3妥善應對挑戰(zhàn),//C4使中國經濟這艘巨輪破浪遠航。
R1Нам необходимо без малейших колебаний отводить экономическому строительству центральное место, //R2стимулировать научное развитие, //R3должным образом реагировать на риски и вызовы с тем, /R4чтобы обеспечивать китайской экономике, подобной гигантскому кораблю, дальнее плавание вперед навстречу волнам.
對名詞性合成謂語的認定則將省略部分補充完整后分析,這是由于名詞性合成謂語雖無時態(tài)的變化,卻有數和人稱的變化,見例5。
例5C1取消和下放311項行政審批事項,C2取消123項職業(yè)資格許可和認定事項,C3徹底終結了非行政許可審批。
R1Были отменены либо делегированы вниз полномочия по 311 пунктам административного утверждения,R2аннулированы 123 пункта лицензи-рования и сертификации профессиональных квалиф-икаций,R3окончательно отменено неадминистративное утверждение.
基于俄語傳統(tǒng)句法理論對俄語對應單位進行分析,結合語料分析實踐,形成俄語對應單位的語法性質體系。
首先,根據句法完整性,把俄語對應單位分為: 句子(簡單句,并列復合句,主從復合句,無連接詞句,句組)和句子組成部分(簡單句組成部分,并列復合句組成部分,主從復合句組成部分,無連接詞句組成部分)。
其次,根據是否包含述謂核心,把俄語對應單位分為: 無述謂核心、單一述謂核心和多述謂核心。無述謂核心包括名詞短語、動詞短語、前置詞短語、副詞短語、副動詞短語和形動詞短語;單一述謂核心包括單部句(無人稱句、不定式句、確定人稱句)和雙部句(簡單謂語、動詞合成謂語、名詞合成謂語)。
傳統(tǒng)俄語句法理論對句子類型的分析通常建立在述謂理論(предикативность)基礎上。述謂核心(предикативное ядро)由主語和謂語構成,也叫述謂結構。根據述謂核心的多少區(qū)分簡單句和復合句,只有一個述謂核心的是簡單句,有兩個或以上的述謂核心的是復合句。
基于以上分析原則和分析體系,對俄語對應單位進行語法標注,形成俄語對應單位的語法標注庫。
漢語小句的俄語對應單位可能是句子,也可能是句子的組成部分。句子具有獨立的表述功能,以句號等句末點號為收尾標點,又含獨句[例6]和句組[例7]兩類。句子的組成部分不具獨立表述功能,需聯(lián)合其他組成部分共同構成完整的句子,以逗號等句間點號為收尾標點,又含并列復合句組成部分,無連接詞句組成部分和各種主句、從句等。
例6C1人民群眾關心的醫(yī)療、教育、養(yǎng)老、食品藥品安全、收入分配、城市管理等方面問題較多,C2嚴重霧霾天氣在一些地區(qū)時有發(fā)生。
R1Осталось немало беспокоящих народные массы проблем в области медобслуживания, образования, обеспечения достойной старости, безопасности пищевых продуктов и медикаментов, распределения доходов, городского управления и т.д.R2По-прежнему острой остается ситуация с загрязнением окружающей среды, некоторые районы время от времени окутывал густой смог.
例7促進大數據、云計算、物聯(lián)網廣泛應用。
Последовательно продвигать вперед массовую предпринимательскую и инновационную деятельн-ость. Стимулировать широкое распространение техн-ологий больших данных, облачных вычислений и Интернета вещей.
圖1為俄語對應單位的句子/句子組成部分統(tǒng)計分布,分析可知: 漢語小句的俄語對應單位以句子組成部分多(967,74.85%),句子少(325,25.15%),前者約為后者的3倍。說明漢俄翻譯中,漢語小句多譯為俄語句子組成部分。
圖1 句子/句子組成部分的統(tǒng)計分布
無述謂核心的俄語對應單位主要存在于句子組成部分中,包括名詞短語[例8]、動詞短語[例9]、前置詞短語[例10]、副詞短語[例11]、副動詞短語[例12]和形動詞短語[例13]。
例8C1積極的財政政策注重加力增效,/C2擴大結構性減稅范圍,//C3實行普遍性降費,//C4盤活財政存量資金。
R1Активная финансовая политика с акцентом на наращивании интенсивности и повышении эффективности /R2позволила расширить сферы структурного сокращения налогообложения, //R3перейти к тотальному снижению денежных сборов //R4и оживить неиспользованные госбюджетные резервы. (名詞短語)
例9C1加快推進產業(yè)結構優(yōu)化升級,/C2實施一批技術水平高、帶動能力強的重大工程。
R1В связи с этим нужно ускорять оптимизацию и модернизацию структуры производств, /R2реализовывать серию важных программ, имеющих высокий технический уровень и играющих мощную стимулирующую роль.(動詞短語)
例10C1為應對持續(xù)加大的經濟下行壓力,/C2我們在區(qū)間調控基礎上,實施定向調控和相機調控。
R1В противовес прессингу со стороны нисходящего тренда в экономике /R2на основе определения разумных пределов нам удалось осуществить целенаправленное и своевременное регулирование.(前置詞短語)
例11C1部分企業(yè)生產經營困難,C2地區(qū)和行業(yè)走勢分化,C3財政收支矛盾突出,C4金融等領域存在風險隱患。
R1Часть предприятий сталкивалась с трудностями в своей производственной и хозяйственной деятель-ности, /R2сильно расходились тренды развития разных регионов и отраслей, /R3налицо острые противоречия между госбюджетными доходами и расходами, //R4базовые институты рынка капитала далеки от совершенства, наблюдались потенциальные риски в финансовой и других сферах. (副詞短語)
例12С1保持經濟中高速增長,С2推動產業(yè)邁向中高端水平。
R1Поддерживая умеренно высокие темпы экономического роста,R2стимулировать выход всех отраслей экономики на средний и высокий уровень развития. (副動詞短語)
例13C1今年要實現大病保險全覆蓋,/C2政府加大投入,//C3讓更多大病患者減輕負擔。
R1В текущем году предстоит полностью охватить все сельское и неработающее городское население страхованием на случай серьезных заболеваний, /R2соответственно увеличатся прави-тельственные расходы, //R3направленные на облегчение бремени еще большего числа пациентов с серьезными заболеваниями. (形動詞短語)
圖2 無述謂核心類型的統(tǒng)計分布
圖2為無述謂核心的俄語對應單位的統(tǒng)計分布,無述謂核心的俄語對應單位共計357個,占漢語小句俄語對應單位總數的27.63%。分析可知,在無述謂核心的俄語對應單位中,以動詞短語(183,51.26%)居多,副動詞短語(68,19.05%)、前置詞短語(62,17%)和名詞短語(36,10.08%)居中,形動詞短語(7,1.96%)和副詞短語(1,0.28%)較少。由此可見,俄語中動詞、副動詞和前置詞短語通常能夠表達漢語小句的意義,翻譯中應把握它們之間的轉化關系。
單一述謂核心是指句中只包含一組主謂結構。單一述謂核心的俄語對應單位包括簡單句和各種句子的組成部分。根據主謂表達手段的不同,單一述謂核心句法單位可以是單部句: 無人稱句[例14]、不定式句[例15]、確定人稱句[例16],也可以是雙部句: 簡單謂語[例17]、動詞合成謂語[例18]、名詞合成謂語[例19]。
例14C1深化中外人文交流,/C2加強國際傳播能力建設。
R1Наряду с углублением гуманитарных обменов Китая с другими странами /R2нужно наращивать коммуникационные возможности в международных масштабах. (無人稱句)
例15C1促進兩岸文教、科技等領域交流,/C2加強兩岸基層和青年交流。
R1Активизировать межбереговые обмены в таких областях, как культура и образование, наука и техника и др. /R2Расширять низовые и молодежные обмены между двумя берегами. (不定式句)
例16C1讓我們更加緊密地團結在以習近平同志為總書記的黨中央周圍,/C2凝心聚力,//C3奮發(fā)進取,……
R1Давайте еще теснее сплотимся вокруг ЦК партии во главе с его генеральным секретарем товарищем Си Цзиньпином, /R2сосредоточим все наши силы //R3и со всей энергией устремимся вперед,……(確定人稱句)
例17過去一年,我國發(fā)展面臨多重困難和嚴峻挑戰(zhàn)。
В прошлом году развитие Китая пережило немало трудностей и суровых вызовов. (簡單謂語)
例18我們要持之以恒,建設天藍、地綠、水清的美麗中國。
Мы должны прилагать неустанные усилия к построению прекрасного Китая под голубыми небесами, с зелеными лугами и лесами и чистыми водами.(動詞合成謂語)
例19C1取消存款利率浮動上限,/C2推出存款保險制度,/C3建立人民幣跨境支付系統(tǒng)。
R1Был снят верхний предел колебания процентных ставок по депозитам, /R2введена система депозитного страхования, /R3создана система трансграничных платежей в китайских юанях.(名詞合成謂語)
圖3是漢語小句對應的俄語單一述謂核心單位類型統(tǒng)計分布,單一述謂核心的俄語對應單位共計892個,占漢語小句俄語對應單位總數的69.04%。分析可知: 單一述謂核心的俄語對應單位中,以簡單謂語(284,31.84%)最多,無人稱句(185,20.74%)、名詞合成謂語(214,23.99%)和不定式句(143,16.03%)次之,動詞合成謂語(63,7.06%)和確定人稱句(3,0.3%)最少。這說明,漢語小句翻譯成俄語簡單句或其他句子組成成分時,除一般動詞外,多借助無人稱系詞、名詞合成謂語和不定式動詞。
圖3 單一述謂核心單位類型統(tǒng)計分布
漢語小句對應的俄語句法單位可能含有多個述謂核心: 并列復合句[例20]、主從復合句[例21]、無連接詞復合句[例22]和句組[例23]。
例20C1完成鐵路投資8 000億元以上、公路投資1.65萬億元,/C2再開工20項重大水利工程,//C3建設水電核電、特高壓輸電、智能電網、油氣管網、城市軌道交通等重大項目。
R1Капиталовложения в железные дороги превысят 800 млрд. юаней, а инвестиции в автодорожное строительство составят 1.65 трлн. Юаней. /R2Начато строительство 20 новых крупных гидросооружений, //R3будут реализованы крупные проекты в сфере гидроэнергетики и ядерной энергетики, электропередачи сверхвысокого напряжения, интеллектуальных электросетей, строительства сетей нефте- и газопроводов, городского рельсового транспорта и т. д. (并列復合句)
例21C1把適合作為地方收入的稅種下劃給地方,/C2在稅政管理權限方面給地方適當放權。
R1Некоторые виды налогов, доходы по которым целесообразно должны были бы поступать в местные бюджеты, будут зачислены в категории местных налогов. /R2Кроме того, нужно в разумной мере увеличивать полномочия местных правительств в области налогового администрирования. (主從復合句)
例22合理確定增值稅中央和地方分享比例。
В частности, продвигать реформу по разграничению полномочий и расходных обязат-ельств Центра и регионов, установить для них разумные пропорции распределения поступлений от НДС.(無連接詞復合句)
例23對行政事業(yè)性收費、政府定價或指導價經營服務性收費、政府性基金、國家職業(yè)資格,實行目錄清單管理。
Предстоит установить перечень административных сборов, перечень платежей за эксплуатационные услуги, тарифы которых назначаются или предлага-ются правительством, перечень правительственных фондов, а также список национальных професс-иональных квалификационных уровней. Ускоренно формировать единую, открытую, конкурентную и упорядоченную рыночную систему в интересах преодоления регионального протекционизма.(句組)
此外,研究發(fā)現在復合句中還存在一些嵌套現象,如[例24]中,整體上,R1與R2標注為并列復合句組成部分;述謂核心上,R1為表目的主從復合句。
例24С1我們既要讓人民的物質生活更殷實,С2又要讓人民的精神生活更豐富。
R1Словом, нужно сделать так, чтобы материальная жизнь народа стала более зажиточной,R2а духовная - более богатой и насы-щенной.
圖4為漢語小句對應的俄語多述謂核心類型的統(tǒng)計分布。由圖可知: 多述謂核心類型的俄語對應單位既可存在于句子中,也可存在于句子組成部分中。其中,主從復合句(23,47.92%)居多,并列復合句(8,16.67%)次之,句組(6,12.50%)和無連接詞復合句(6,12.50%)為少。這說明,當漢語小句需要譯為多述謂核心結構的俄語對應單位時,主要譯為主從復合句。
俄語對應單位在語法類型上呈現為九大類,在述謂核心上呈現為10大類,其分布情況見表1。分析可知:
圖4 多述謂核心類型的統(tǒng)計分布
表1 漢語小句對應俄語單位的述謂特征與句法類型分布表
(1) 漢語小句譯為只包含有一個述謂核心的簡單句或句子組成部分時,多數譯為雙部句(561,43.42%),少數譯為單部句(331,25.62%);其中,只有在漢語小句譯為簡單句組成部分時,單部句(114,8.82%)多于雙部句(79,6.11%)。
(2) 漢語小句多譯為單一述謂核心的俄語對應單位(892,69.04%),很大程度上多于無述謂核心(357,27.63%)和多述謂核心(43,3.33%)??梢钥闯?,由漢語小句切分的俄語對應單位多呈現為單一述謂核心的簡單句。這說明,簡單句是漢俄翻譯的重點。
(3) 漢語小句譯為簡單句組成部分時,多以無述謂中心的短語(279,21.59%)表示。其中,動詞短語最多(144,11.15%)、副動詞短語(51,3.95%)和前置詞短語(50,3.87%)次之,形動詞短語最少(5,0.39%)??梢钥闯觯诰渲凶魍戎^語的動詞短語外,通常是借助副動詞、前置詞、形動詞等手段構成的單位。由此,用副動詞、前置詞、形動詞等來表達漢語謂語概念,是漢俄政府文本翻譯的特點。
(4) 漢語小句可譯為包含多個述謂核心的俄語復合句(37,2.86%)或句組(6,0.47%)。其中,主從復合句多(12,0.93%),并列復合句(6,0.47%)和無連接詞復合句(6,0.47%)次之,句組(5,0.39%)少。這說明,總體上漢語小句在譯為俄語時,通常會含有一個或多個述謂核心。
(1) 漢俄小句對齊標注語料庫是漢英小句對齊標注語料庫研究[8]的延伸與發(fā)展。一方面,隨著漢俄機器翻譯的發(fā)展,目前在句子或段落層面對齊的平行語料庫無法提供足夠的對齊信息,所以需要基于漢俄平行語料進行進一步的對齊與分析;另一方面,未來在漢語小句切分的基礎上,應直接建立俄英對應句法單位的對齊。
(2) 本文的分析體系僅適用于漢-俄單方向文本的研究 ,即漢語為源語,俄語為目的語。這是由于: 漢俄小句的結構與形態(tài)有重要差異,漢譯俄與俄譯漢的小句轉換并不相同。因此,有必要區(qū)分翻譯方向,建立俄-漢小句對齊語料庫。具體為: 在俄漢平行語料上,切分出俄語小句,以俄語小句為標準切分漢語對應單位,形成俄漢小句對齊語料庫,從而構建小句層面的雙向對齊。小句(клауза)不是傳統(tǒng)俄語句法研究單位,為此,需要提出具有操作性的俄語小句定義。
(3) 本文中對俄語對應單位的語法性質的標注限于結構層面的討論,主要是在傳統(tǒng)俄語句法分析框架內對句法單位的分析和討論,主要是基于結構和意義層面。下一步工作中,需要對各個句法單位在篇章功能上進行分析。
(4) 本文僅標注漢俄小句對齊語料庫中俄語對應單位的語法性質,這對于指導漢語小句選擇何種形式的俄語小句進行轉換有一定的意義。不過,無法確定漢語小句在何種形式下轉換為何種俄語對應單位。為此,在之后的工作中,將對漢俄小句對齊語料中的漢語小句也進行語法性質標注,以建立句法標注的對應關系。此研究除了應用在以小句為翻譯單位的研究中以外,還將指導在整句范圍內構建翻譯模型。
(5) 創(chuàng)建漢俄小句對齊標注語料庫是創(chuàng)建漢俄篇章結構語料庫[6-7]的基礎,是篇章結構視野下的篇章-句法聯(lián)合標注。小句對齊與其語法標注與篇章結構對齊將共同服務于漢俄篇章機器翻譯、語言對比研究及第二語言教學。
[1]王經益.面向計算機的英語關系從句漢譯研究[D].北京: 北京語言大學碩士學位論文, 2009.
[2]宋柔,葛詩利.面向篇章機器翻譯的英漢翻譯單位和翻譯模型研究[J].中文信息學報,2013,29(5): 125-135.
[3]陶源. 人文社科學術文本俄漢平行語料庫的創(chuàng)建與研究[J].語料庫語言學.2014(01): 78-93.
[4]崔衛(wèi),張嵐. 俄漢翻譯平行語料庫及其應用研究[J]. 解放軍外國語學院學報,2014(01): 81-87.
[5]樸哲浩,林立娟,嚴文穎. 基于雙語新聞平行語料庫的漢語新詞語俄譯規(guī)律研究[J]. 燕山大學學報(哲學社會科學版),2016(01): 138-144.
[6]Yang Y. Theoretical aspects of building a Chinese-Russian parallel corpus with discourse-structure annotation.New Russia: Traditions and Innovations language an science of language[C]//Proceedings of the Ekaterinburg; Moscow: The Cabinet Scientist, 2016: 651-660.
[7]Mukhin M Y, Yang Y. Building a Chinese-Russian parallel discourse structure corpus of official texts[J]. Bulletin of the South Ural State University. Ser. Linguistics, 2016: 23-31.
[8]Feng W, Yang Y, Li Y, et al. Study on the English corresponding unit of Chinese clause[C]//Proceedings of the Springer: NLPCC-ICCPOL, 2016: 129-140.
[9]李艷翠,馮文賀,周國棟等.基于逗號的漢語子句識別研究[J].北京大學學報(自然科學版),2013(1): 7-14.
[10]Li Y, Feng W, Sun J, et al. Building Chinese discourse corpus with connective-driven dependency tree structure[C]//Proceedings of EMNLP, 2014.
[11]馮文賀.漢英篇章結構平行語料庫的對齊標注研究[J].中文信息學報, 2013: 158-165.
[12]王磊.試論俄語“共戴句”[J].中國俄語教學, 1995: 21-24.