更多“關(guān)于各種網(wǎng)絡(luò)爬蟲,以下說法不正確的是()?!毕嚓P(guān)的問題
第1題
()只會(huì)在需要的時(shí)候爬行新產(chǎn)生或發(fā)生更新的頁面,并不重新下載沒有發(fā)生變化的頁面,可有效減少數(shù)據(jù)下載量,及時(shí)更新已爬行的網(wǎng)頁,減小時(shí)間和空間上的耗費(fèi),但是增加了爬行算法的復(fù)雜度和實(shí)現(xiàn)難度。
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
點(diǎn)擊查看答案
第2題
()是指對(duì)已下載網(wǎng)頁采取增量式更新和只爬行新產(chǎn)生的或者已經(jīng)發(fā)生變化網(wǎng)頁的爬蟲,它能夠在一定程度上保證所爬行的頁面是盡可能新的頁面。
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
點(diǎn)擊查看答案
第3題
(),又稱主題網(wǎng)絡(luò)爬蟲,是指選擇性地爬行那些與預(yù)先定義好的主題相關(guān)頁面的網(wǎng)絡(luò)爬蟲。
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
點(diǎn)擊查看答案
第4題
()采集的目標(biāo)是那些大部分內(nèi)容不能通過靜態(tài)鏈接獲取的、隱藏在搜索表單后的,只有用戶提交一些關(guān)鍵詞才能獲得的Web頁面。
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
點(diǎn)擊查看答案
第5題
()實(shí)現(xiàn)的兩個(gè)主要目標(biāo)為保持本地頁面集中存儲(chǔ)的頁面為最新頁面和提高本地頁面集中頁面的質(zhì)量。
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
點(diǎn)擊查看答案
第6題
()又稱全網(wǎng)爬蟲,爬行對(duì)象從一些種子URL擴(kuò)充到整個(gè)Web,主要為門戶站點(diǎn)搜索引擎和大型Web服務(wù)提供商采集數(shù)據(jù)。
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
點(diǎn)擊查看答案
第7題
如果要采集指定的數(shù)據(jù),則需要使用到(),又稱主題網(wǎng)絡(luò)爬蟲,是指選擇性地爬行那些與預(yù)先定義好的主題相關(guān)頁面的網(wǎng)絡(luò)爬蟲。
A、增量式網(wǎng)絡(luò)爬蟲
B、聚焦網(wǎng)絡(luò)爬蟲
C、DeepWeb爬蟲
D、全網(wǎng)爬蟲
點(diǎn)擊查看答案
第8題
如果要采集指定的數(shù)據(jù),則需要使用到(),因?yàn)樗恍枰佬信c主題相關(guān)的頁面,極大地節(jié)省了硬件和網(wǎng)絡(luò)資源,保存的頁面也由于數(shù)量少而更新快。
A、聚焦網(wǎng)絡(luò)爬蟲
B、聚焦網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
點(diǎn)擊查看答案
第9題
()爬行過程中最重要部分就是表單填寫及處理。
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
點(diǎn)擊查看答案