摘要:DNA存儲領域是一種融合DNA和存儲介質的新興技術,已引起各國家、企業(yè)和高校的關注與研究。本文以智慧芽專利庫檢索得到DNA存儲領域專利作為研究基礎,從專利視覺,對DNA存儲領域的專利申請趨勢、技術分布、技術主題以及申請人進行梳理分析,以期為相關企業(yè)和高校在DNA存儲領域的專利布局提供借鑒。
關鍵詞:DNA存儲;存儲介質;專利分析;專利3D地圖
一、引言
近二十年來,隨著移動互聯(lián)網、人工智能等技術蓬勃發(fā)展,帶來數(shù)據(jù)量指數(shù)級增長。國際數(shù)據(jù)公司統(tǒng)計,2018年全球數(shù)據(jù)總量已經達到了33ZB,2025年預測將達到163ZB[1]。然而,目前主流存儲介質發(fā)展與生產速度明顯滯后于數(shù)據(jù)量的增長[2]。海量數(shù)據(jù)的拷貝、傳輸和保存也面臨巨大的挑戰(zhàn)。因此,亟需一種新型存儲介質以應對上述挑戰(zhàn)。
脫氧核糖核酸DNA作為遺傳信息存儲載體[3],利用腺嘌呤A、胸腺嘧啶T、胞嘧啶C和鳥嘌呤G四個堿基組成代碼進行存儲,具備存儲密度高、維護能耗低、保存壽命長等優(yōu)勢[3-6]。因此,DNA存儲在數(shù)據(jù)存儲領域成為一種極具吸引力的存儲介質。
DNA存儲是利用DNA作為介質,將數(shù)字信息在二進制碼、四進制堿基序列和實際DNA片段之間的轉化與流動[7-8];DNA存儲領域主要包括[9]:①編碼:將數(shù)字信息通過編碼映射成A/T/C/G堿基序列,包括壓縮、糾錯和轉換3個流程。②合成:通過人工合成技術包括第一代化學合成法[10-11]、第二代微陣列DNA合成法[12]和第三代酶合成法[13],按照順序得到DNA片段。③存儲:將DNA片段選擇合適載體如體內或體外存儲。④檢索:利用特異性雜交技術如基于聚合酶鏈式反應PCR或磁珠分離技術,同特定引物序列提取DNA分子。⑤測序:利用基因測序技術包括第一代Sanger法[14]、第二代大規(guī)模平行測序法及第三代單分子測序法[15-16],對提取的DNA分子測序得到DNA序列。⑥解碼:將DNA序列信息解碼轉換回原始數(shù)字信息[17-18]。
基于上述背景,本文將以DNA存儲作為研究對象,結合專利數(shù)據(jù)對全球范圍內相關技術的發(fā)展趨勢、技術分類、技術主題以及申請人分布等多方面,結合圖表進行統(tǒng)計學分析,旨在為DNA存儲領域方面的專利布局提供理論基礎和數(shù)據(jù)支撐。
二、DNA存儲領域的專利技術分析
(一)數(shù)據(jù)庫的選擇
智慧芽專利數(shù)據(jù)庫收錄了全球158個國家/地區(qū),總數(shù)超過1.7億余條專利數(shù)據(jù),每天實時更新以及對原始數(shù)據(jù)進行全面深加工,能夠協(xié)助用戶完成各類專業(yè)分析動作,滿足用戶深度的專利分析需求。
(二)檢索要素選擇
本文基于智慧芽專利數(shù)據(jù)庫,檢索日期為2022年8月16日,由于DNA存儲屬于新型技術,數(shù)據(jù)量較小,直接采用中英文關鍵詞,使用檢索式:脫氧核糖核酸or DNA or Deoxyribonucleic Acid進行專利檢索,利用PatSnap同族智能去重,手動去除無關、異常等數(shù)據(jù),最終得到5476條檢索結果。
(三)專利申請發(fā)展趨勢
不同年份的專利申請量能夠反映出該技術領域的技術發(fā)展趨勢[19]。根據(jù)事物發(fā)展的普遍規(guī)律,專利技術數(shù)據(jù)同樣可以分為四個階段,即技術萌芽時期、技術成長時期、技術成熟時期、技術衰退時期[19-20]。發(fā)明專利保護期限為20年,專利數(shù)據(jù)從申請到公布最長存在18個月延遲,因此2021-2022年專利數(shù)據(jù)存在不完整,僅供參考。綜上所述,本文將時間限定在2000-2022年進行檢索,以便全面地獲取此領域的專利數(shù)據(jù)。
圖1是DNA存儲領域專利申請趨勢??芍?,DNA存儲領域的整體專利申請一直處于增長趨勢??傮w可以分為兩個階段,第一階段在2000-2012年,屬于緩慢增長階段即技術萌芽時期,從最初的24件經過12年緩慢增長到154件,這與當時的DNA存儲領域技術不成熟以及未引起政府和科學界的重視有關。第二階段從2013年至今,屬于快速增長階段即技術成長期,從2013年的228件到2020年的691件只經歷7年時間,專利申請量明顯增多。其原因一方面是2012年哈佛大學Church課題組發(fā)表論文,介紹如何使用DNA來存儲一本書[21],2013年歐洲生物信息學研究所Goldman等發(fā)表論文,證實利用DNA存儲多媒體文件同時引入糾錯機制[22],引發(fā)科學界對DNA存儲領域巨大關注,另一方面是世界各國陸續(xù)開始實施多項促進DNA存儲領域發(fā)展的政策手段。綜上所述,可以預見,在技術與政策的驅動下,DNA存儲研究已經進入快速發(fā)展期,在未來很長一段時間內,專利申請量會一直處于穩(wěn)步上升,并最終推動進入技術成熟期。
(四)專利技術分類排名
IPC分類號是根據(jù)專利申請涉及的技術方案所屬的領域來確定的,通過分類號可以粗略地確定專利申請內容,大致反映專利所涉及技術主題。因此,分析某領域內專利涉及的所有IPC分類號以及這些IPC分類號下專利申請量,就能得出該領域的技術構成以及該領域內申請人關注的技術方向[23]。
圖2是DNA存儲領域IPC前10大類。DNA存儲領域,專利申請主要集中在C12即生物化學、啤酒、烈性酒、果汁酒、醋、微生物學、酶學、突變或遺傳工程,G06即計算,推算或計數(shù)這2個大類,這2個領域的專利申請量占比高達64%。其余包括G01即測量、測試;G16即特別適用于特定應用領域的信息通信技術[ICT];A61即醫(yī)學或獸醫(yī)學、衛(wèi)生學等。
(五)專利技術主題分布圖
利用智慧芽專利數(shù)據(jù)庫的專利聚類和3D專利地圖分析功能,結合NBER標簽,對DNA存儲領域做進一步智能分析。在3D專利地圖中,按粉紅色、深灰色、淺灰色、白色代表該技術區(qū)域內專利申請數(shù)量逐級遞減。粉紅色表明專利數(shù)量最密集,涉及該技術主題的專利申請量最多,是技術研發(fā)的熱點[24]。白色表明專利數(shù)量最稀少,涉及該技術主題的專利申請量最少,是研發(fā)技術的空白點[24]。
圖3是DNA存儲領域的3D專利地圖??芍?,DNA存儲領域的3D專利地圖有多達10處粉紅色,其中有8處都涉及生物技術、有4處涉及計算機硬件&軟件,這與之前IPC大類主要分布在C12和G06相吻合;技術主題具體包括化學、核技術、測量&測試、信息存儲等,這也與之前分類號G01、A61以及G16的分布情況也是一致的。
這說明目前DNA存儲領域發(fā)展呈多樣化,觸及的6個技術環(huán)節(jié)即編碼、合成、存儲、檢索、測序和解碼均在齊頭并進的快速發(fā)展布局,這也說明DNA存儲領域已引起各方持續(xù)關注,呈現(xiàn)出創(chuàng)新活躍度增高、創(chuàng)新能力加強的現(xiàn)象。
(六)專利申請人專利量排名
專利申請人擁有專利申請量的多少,某種程度上反映其在此技術領域的創(chuàng)新水平[20]。圖4是DNA存儲領域的主要申請人。從申請量排名來看,排名前10的申請人,有4位中國申請人,值得注意,第1位是深圳華大基因,這表示中國企業(yè)已在DNA存儲領域開始布局,目前發(fā)展趨勢良好。從申請人類型來看,企業(yè)與高校申請人平分秋色。國外主要以企業(yè)為主包括美國生物科技公司億明達,而國內主要集中在高校如中國科學院深圳先進技術研究院,由此可以判斷出國內外申請人在DNA存儲領域側重方向不同,國外申請人更重視將其盡可能商業(yè)化,以獲得經濟價值,而中國申請人技術主要集中在理論研究與實驗階段。
(五)專利申請國家排名
專利申請國家的排名可以反映該國家/地區(qū)的發(fā)展前景。專利申請量越多,意味著該技術在該國家的發(fā)展前景越廣闊,也在一定程度代表該技術在該國家的重視創(chuàng)新程度越高。
圖5是DNA存儲領域專利申請國家排名趨勢??芍?,中國以絕對優(yōu)勢列為第一,美國緊隨其后。申請人在專利布局時,將中國和美國作為重點國家,歐洲例如荷蘭、德國、英國等國家由于其知識產權發(fā)展相對成熟,也是申請人專利申請的重點區(qū)域。
根據(jù)圖5的數(shù)據(jù)量計算,可知中國專利申請量遠超其他地區(qū)的申請量總和。這表明,中國專利申請量主要是依靠中國申請人來實現(xiàn),具體而言,中國申請人主要是在中國進行專利申請,并未在海外國家/地區(qū)進行專利布局。這可能跟中國申請人主要是高校研究院有關,高校研究院一般選擇國內專利申請作為其研究成果,而其海外研究成果則主要選擇在海外期刊發(fā)表期刊,并無進行國外專利申請的意識。
三、結束語
本文通過2000-2022年DNA存儲領域專利申請趨勢、技術分類排名、技術分類分布圖、申請人排名以及申請國家/地區(qū)排名進行研究分析,得出如下結論:
抓住機遇:從專利申請趨勢來看,目前DNA存儲領域屬于一種新型技術,不同于傳統(tǒng)技術,該領域發(fā)展還處在技術成長期,將來會有源源不斷的藍海領域被發(fā)現(xiàn)。因此,中國申請人應當抓住一切可能的機遇,提高技術研發(fā)實力,爭取成為全球技術發(fā)展的領頭羊。
加強布局:從專利申請國家排名來看,DNA存儲領域,中國和美國是全球最大的目標市場,然而中國申請人很少在海外市場布局。因此,中國申請人要提高專利布局意識,積極在海外國家進行專利申請,借此發(fā)展和提升在海外國家的競爭力和市場潛力。
提高效益:從專利申請人類型來看,DNA存儲領域,中國專利權人主要是高校,目前各大高校普遍存在大量專利申請閑置,沒有投入商業(yè)用途,無法帶來經濟效益。而企業(yè)則存在研發(fā)能力一般,缺乏基礎性實驗數(shù)據(jù)的問題。因此,促進企業(yè)與高校合作,實現(xiàn)強強聯(lián)合,將專利技術盡可能轉變成經濟力量,讓專利發(fā)揮其應有的經濟作用。
作者單位:吳瓊樂 國家知識產權局專利局專利審查協(xié)作四川中心
參? 考? 文? 獻
[1]ZHIRNOV V,ZADEGAN R M,SANDHU G S,et al.Nucleic acid memory[J].Nature Materials,2016,15(4):366-370
[2]宋琪,丁陳君,吳曉燕,陳方,等.DNA存儲領域國際發(fā)展態(tài)勢分析.世界科技研究與發(fā)展[J],2021,43(1):24-42.
[3]CEZE L, NIVALA J, STRAUSS K.Molecular digital data storage using DNA[J].Nature Reviews Genetics,2019,20(8):456-66.
[4]MEISER L C, ANTKOWIAK P L,KOCH J,et al.Reading and writing digital data in DNA[J].Nature Protocols,2020,15(1):86-101.
[5]DONG Y,SUN F,PING Z,et al.DNA storage:research landscape and future prospects[J].National Science Review,2020,7(6):1092-1107.
[6]SELBERG J, MARCELLA G,ROLANDI M,et al.The potential for convergence between Synthetic Biology and Bioelectronics[J].Cell Systems, 2018, 7(3): 231-244.
[7]CEZE L, NIVALA J, STRAUSS K. Molecular digital data storage using DNA[J]. Nature Reviews Genetics, 2019, 20(8):456-66.
[8]MEISER L C, ANTKOWIAK P L, KOCH J, et al. Reading and writing digital data in DNA[J]. Nature Protocols, 2020, 15(1):86-101.
[9]許鵬,方剛,石曉龍,劉文斌,等.DNA存儲及其研究進展[J].電子與信息學報.2020,42(6):1326-1331.
[10]LEPROUST E M, PECK B J, SPIRIN K, et al. Synthesis of high-quality libraries of long (150mer) oligonucleotides by a novel depurination controlled process[J]. Nucleic Acids Research,2010, 38(8): 2522-2540.
[11]CARUTHERS M H. The chemical synthesis of DNA/RNA:our gift to science[J]. The Journal of Biological Chemistry,2013, 288(2): 1420-1427.
[12]KOSURI S, CHURCH G M. Large-scale de novo DNA synthesis:technologies and applications[J]. Nature Methods, 2014,11(5): 499-507.
[13]LEE H H, KALHOR R, GOELA N, et al. Terminator-free template-independent enzymatic DNA synthesis for digital informationstorage[J]. Nature Communications, 2019, 10(1): 2383.
[14]SANGER F, NICKLEN S, COULSON A R. DNA sequencing with chain-terminating inhibitors[J]. Proceedings of the National Academy of Sciences of the United States of America, 1977,74(12): 5463-5467.
[15]LOMAN N J, QUICK J, SIMPSON J T. A complete bacterial genome assembled de novo using only nanopore sequencing data[J]. Nature Methods, 2015, 12(8): 733-735.
[16]JAIN M, FIDDES I T, MIGA K H, et al. Improved data analysis for the MinION nanopore sequencer[J]. Nature Methods,2015, 12(4): 351-356.
[17]韓明哲,陳為剛,宋理富,李炳志,元英進,等.DNA信息存儲:生命系統(tǒng)與信息系統(tǒng)的橋梁[J].合成生物學.2021,2(3):209-322.
[18]陳大明,張學博,劉曉,馬悅,熊燕,等.從全球專利分析看DNA 合成與信息存儲技術發(fā)展趨勢[J].合成生物學. 2021, 2(3): 399-411.
[19]楊鐵軍.專利分析可視化[M].北京:知識產權出版社,第2-3頁,2017, 4.
[20]謝志明,張媛,賀正楚,等. 新能源汽車產業(yè)專利趨勢分析[J]. 中國軟科學,2015(9):127-141.
[21]CHURCH G, GAO Y, KOSURI S. Next-generation digital information storage in DNA [J]. Science, 2012, 337(6102): 1628-1628.
[22]GOLDMAN N, BERTONE P, CHEN S, et al. Towards practical,high-capacity, low-maintenance information storage in synthesized DNA[J]. Nature, 2013, 494: 77-79.
[23]陳軍,張韻君,王健.基于專利分析的中美人工智能產業(yè)發(fā)展比較研究[J].情報雜志,2019,38(1):41-47.
[24]張建升.區(qū)塊鏈技術中專利申請狀況及發(fā)展趨勢分析[J].中國發(fā)明與專利,2018, 03(15):123-128.
吳瓊樂(1988-),女,碩士,國家知識產權局專利局專利審查協(xié)作四川中心,專利審查員,研究方向:數(shù)據(jù)存儲領域。