聚焦爬蟲爬行策略實(shí)現(xiàn)的關(guān)鍵是評(píng)價(jià)()的重要性,不同的方法計(jì)算出的重要性不同,由此導(dǎo)致鏈接的訪問順序也不同。
A、頁面內(nèi)容
B、頁面內(nèi)容和鏈接
C、鏈接
D、表單信息
A、頁面內(nèi)容
B、頁面內(nèi)容和鏈接
C、鏈接
D、表單信息
第1題
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
第2題
A、通用網(wǎng)絡(luò)爬蟲通常采用并行工作方式,但需要較長(zhǎng)時(shí)間才能刷新一次頁面。
B、通用網(wǎng)絡(luò)爬蟲適用于為搜索引擎搜索廣泛的主題,有較強(qiáng)的應(yīng)用價(jià)值。
C、聚焦爬蟲根據(jù)一定的網(wǎng)頁分析算法過濾與主題無關(guān)的鏈接,保留有用的鏈接并將其放入等待抓取的URL隊(duì)列。
D、增量式爬蟲在需要的時(shí)候爬行新產(chǎn)生或發(fā)生更新的頁面,并重新下載所有頁面
第3題
第5題
A、深度優(yōu)先策略
B、廣度優(yōu)先策略
C、PageRank優(yōu)先策略
D、隨機(jī)爬行策略
第6題
A、聚焦網(wǎng)絡(luò)爬蟲
B、聚焦網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲
第7題
A、表層網(wǎng)頁是指?jìng)鹘y(tǒng)搜索引擎可以索引的頁面,以超鏈接可以到達(dá)的靜態(tài)網(wǎng)頁為主構(gòu)成的Web頁面。
B、深層網(wǎng)頁是那些大部分內(nèi)容不能通過靜態(tài)鏈接獲取的、隱藏在搜索表單后的,只有用戶提交一些關(guān)鍵詞才能獲得的Web頁面。
C、深層網(wǎng)頁中包含的信息遠(yuǎn)遠(yuǎn)少于表層網(wǎng)頁。
D、深層網(wǎng)頁爬蟲主要用于爬去因此在搜索表單后的深層網(wǎng)頁。
第8題
A、深度優(yōu)先策略
B、廣度優(yōu)先策略
C、PageRank優(yōu)先策略
D、隨機(jī)爬行策略
第9題
A、聚焦網(wǎng)絡(luò)爬蟲
B、增量式網(wǎng)絡(luò)爬蟲
C、通用網(wǎng)絡(luò)爬蟲
D、深層網(wǎng)絡(luò)爬蟲