• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于網(wǎng)頁(yè)的語(yǔ)料庫(kù)自動(dòng)生成

    2010-12-31 00:00:00曹英徐衛(wèi)
    電腦知識(shí)與技術(shù) 2010年23期


      摘要:網(wǎng)頁(yè)文本信息的抽取是網(wǎng)絡(luò)信息搜索的重要組成部分,通過網(wǎng)頁(yè)文本抽取生成完備精簡(jiǎn)的語(yǔ)料庫(kù)對(duì)網(wǎng)頁(yè)信息的分析起著至關(guān)重要的作用。目前網(wǎng)頁(yè)解析的技術(shù)有很多,常用的技術(shù)有基于正則表達(dá)式的靜態(tài)網(wǎng)頁(yè)文本抽取,基于HTML文件流分析的靜態(tài)文本解析,基于DoM樹的動(dòng)態(tài)網(wǎng)頁(yè)分析和基于sAx的動(dòng)態(tài)網(wǎng)頁(yè)分析。
      關(guān)鍵詞:網(wǎng)頁(yè);抽?。赫Z(yǔ)料庫(kù)
      中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2010)23-6438-

    涿鹿县| 巩留县| 巢湖市| 济源市| 宁明县| 女性| 辽阳市| 唐河县| 六枝特区| 香格里拉县| 五原县| 牡丹江市| 枞阳县| 上高县| 耒阳市| 万州区| 新津县| 乡城县| 宾川县| 晴隆县| 南溪县| 海口市| 建湖县| 武川县| 巴林左旗| 左云县| 定日县| 湘潭市| 屏东县| 乡宁县| 昔阳县| 天峨县| 化德县| 永修县| 东光县| 江川县| 东海县| 平安县| 龙岩市| 兰州市| 扎鲁特旗|