互聯(lián)網(wǎng)是個繁忙的地方。據(jù)統(tǒng)計,互聯(lián)網(wǎng)上每秒有6000條推特發(fā)出,有4萬多次谷歌搜索,還有超過200萬封電子郵件被發(fā)送。但這些數(shù)據(jù)只是略微提示了這個網(wǎng)絡的規(guī)模。截至2014年9月,互聯(lián)網(wǎng)上有約10億個網(wǎng)站,這一數(shù)字始終在變動。在這個大部分人熟悉的互聯(lián)網(wǎng)之下還有一個“深層網(wǎng)絡”,它包括搜索引擎沒有編入索引的部分。
將“表面”網(wǎng)絡的時刻變化與深層網(wǎng)絡的不可定量性結合起來就會很容易地發(fā)現(xiàn),要估算互聯(lián)網(wǎng)規(guī)模是一項困難的任務。據(jù)統(tǒng)計,截至2016年3月中旬,在線網(wǎng)頁至少有46.6億個。這只涵蓋了可搜索到的網(wǎng)頁,并不包括深層網(wǎng)絡。那么,互聯(lián)網(wǎng)包含多少信息呢?加利福尼亞大學戴維斯分校傳播學教授馬丁·希爾伯特說,“對于這個問題可以從三個角度來看——互聯(lián)網(wǎng)存儲信息、傳播信息并計算信息。”
2014年,研究人員在《超級運算技術前沿與創(chuàng)新》雜志上發(fā)表了一項研究,估計互聯(lián)網(wǎng)的存儲量為100萬艾字節(jié)。一個字節(jié)是包含8個比特的數(shù)據(jù)單位,相當于單詞中的一個字母。1艾字節(jié)相當于100億億字節(jié)。評估互聯(lián)網(wǎng)傳播能力的一個方式是計量它的流量。根據(jù)思科公司的視覺網(wǎng)絡指數(shù)項目,互聯(lián)網(wǎng)現(xiàn)在進入“澤字節(jié)時代”。1澤字節(jié)是1000個艾字節(jié)。思科公司估計,到2016年底,全球互聯(lián)網(wǎng)流量將達到每年1.1澤字節(jié),到2019年將達到每年2澤字節(jié)。思科公司稱,1澤字節(jié)相當于看3.6萬年的高清視頻,相當于把在線影片租賃提供商奈飛公司的所有列表播放3177次。
研究人員估計,要把整個網(wǎng)絡(包括深層網(wǎng)絡)的內(nèi)容都打印出來的話,需要砍伐掉2%的亞馬遜雨林來造紙。在研究中,他們對在線文本的規(guī)模做了假設,他們估計平均每個網(wǎng)頁需要30張A4紙來打印。根據(jù)這一假設,互聯(lián)網(wǎng)上的所有文本將需要1.36×1000億張紙來打印。希爾伯特說,互聯(lián)網(wǎng)的規(guī)模是個活動目標,它在飛速增長。面對這些海量信息的時候只有一點值得欣慰:我們計算能力的提高比數(shù)據(jù)存儲的速度還要快。
全球數(shù)據(jù)存儲量每三年翻一番,而計算能力每一年半就翻一番。從很多方面來看,人工智能已經(jīng)超過了人類的認知能力。“計算能力的提高是唯一讓在線數(shù)據(jù)暴增變得有用的事,我們正從信息時代走向知識時代?!毕柌卣f。