姚秦川
當年,美國《紐約時報》為了便于報紙以后的管理,方便讀者查閱,決定將那些已經出版并保存了幾十年的舊報紙全部電子化。不過,這項工作到底該如何操作,卻讓工作人員頗感頭疼。
最簡單可行的辦法就是掃描那些舊報紙,進行光學字符識別。不過,因為那些舊報紙有油墨的痕跡和折疊的印記,并且顏色發(fā)黃變暗,再加上幾十年前的字體與現(xiàn)在的字體有很大的區(qū)別,所以辨識起來極為費勁。除此之外,更令人擔心的是,由于那些報紙保存的時間久遠,紙張變得非常脆弱,稍有不甚,就會損壞整張報紙。當時,《紐約時報》的工作人員就關于要不要用掃描的辦法來完成這項工作進行了多次會議,會議上大家各執(zhí)一詞,沒有一個統(tǒng)一的結果。最終,報社高層領導決定,基于保護報紙的考慮,他們不打算采用掃描的辦法,同時為了盡快找到簡單可行的辦法,報社在報紙上刊登了啟事,希望廣大市民能獻計獻策,解決這個棘手的問題。
啟事發(fā)出去后,很快便有市民來到報社,說他想到了一個主意,不過是一種笨辦法,那就是報社派出專門的打字員,逐字逐句地重新敲打報紙上的內容。然后,報社安排專職人員進行校對。這個辦法雖然行得通,但實際操作起來并不容易,不僅進展速度非常緩慢,而且效果也不理想。最終,這個辦法被報社否定了,但他們還是對這位市民給予了獎勵——免費贈閱半年的《紐約時報》。時間一天天過去,就在報社領導都對解決這個問題失去信心時,卡內基梅隆大學的博士生路易斯·馮·安得知了此事,他打電話給報社,主動將此難題包攬了過來。
路易斯之所以敢接手這件棘手的事情,是因為在兩年前,他發(fā)明了一件新鮮的事物——驗證碼,這是區(qū)分當下程序使用者是計算機還是人的公共全自動程序。同時,該程序還具有可防止惡意破解密碼、刷票等功能。最值得贊賞的是,它操作簡單,一個人就可以完成復雜的工作。在路易斯將自己發(fā)明的驗證碼推向市場后,立即在全世界廣受歡迎,同時它也被應用到了各行各業(yè)。
《紐約時報》的領導商量后,決定將此任務交給路易斯完成。路易斯在接手了這個艱巨的任務后想到,全世界每天都有幾億個驗證碼在被校驗,如果把《紐約時報》的文章切成小片,再把它們當作驗證碼發(fā)給全世界的人,這些人在使用驗證碼的時候,不知不覺中就幫助報紙完成了輸入和校對。
不僅如此,對于那些難以識別的字符,系統(tǒng)可以發(fā)給多個校驗者,當幾個人傳回的數(shù)據(jù)一致時,就說明識別的結果是正確的。然后,再將它們返回系統(tǒng)重新整合,一切便萬事大吉。最終,路易斯利用這個簡單又便利的辦法,將《紐約時報》幾十年的報紙全部實現(xiàn)了電子化,解決了困擾《紐約時報》多時的難題。他也因為此事,被當年的《紐約時報》授予“年度創(chuàng)新人物獎”。
(徐珍摘自《知識窗》)