第2題
A、網(wǎng)絡(luò)爬蟲還可以對網(wǎng)頁建立索引
B、有些網(wǎng)絡(luò)爬蟲能夠從網(wǎng)站抓取內(nèi)容聚合起來
C、有些網(wǎng)絡(luò)爬蟲甚至能發(fā)動(dòng)DDos攻擊、發(fā)送垃圾郵件等
D、隱藏在表單后的信息無法被網(wǎng)絡(luò)爬蟲發(fā)現(xiàn)
第5題
第6題
A、基于目標(biāo)網(wǎng)頁特征
B、基于領(lǐng)域概念
C、基于目標(biāo)數(shù)據(jù)模式
D、深層網(wǎng)絡(luò)爬蟲
第7題
A、網(wǎng)絡(luò)爬蟲實(shí)際上是一種"自動(dòng)化瀏覽網(wǎng)絡(luò)”的程序,或者說是一種網(wǎng)絡(luò)機(jī)器人
B、網(wǎng)絡(luò)爬蟲被廣泛用于互聯(lián)網(wǎng)搜索引擎或其他類似網(wǎng)站
C、傳統(tǒng)爬蟲從一個(gè)或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程中,不斷從當(dāng)前頁面上抽取新的URL放入隊(duì)列直到滿足系統(tǒng)的一定停止條件
D、目前互聯(lián)網(wǎng)上的信息分類大多數(shù)都是人工完成的
第8題
A、通用網(wǎng)絡(luò)爬蟲通常采用并行工作方式,但需要較長時(shí)間才能刷新一次頁面。
B、通用網(wǎng)絡(luò)爬蟲適用于為搜索引擎搜索廣泛的主題,有較強(qiáng)的應(yīng)用價(jià)值。
C、聚焦爬蟲根據(jù)一定的網(wǎng)頁分析算法過濾與主題無關(guān)的鏈接,保留有用的鏈接并將其放入等待抓取的URL隊(duì)列。
D、增量式爬蟲在需要的時(shí)候爬行新產(chǎn)生或發(fā)生更新的頁面,并重新下載所有頁面
第9題
A.搜索引擎對靜態(tài)頁面更友好
B.搜索引擎更喜歡原創(chuàng)內(nèi)容
C.搜索引擎對新站的排名更友好
D.搜索引擎對iframe的抓取比較困難
第10題
A.蜘蛛就是搜索引擎的網(wǎng)絡(luò)爬蟲
B.每個(gè)搜索引擎蜘蛛名稱不同
C.網(wǎng)站被搜索引擎降權(quán)后蜘蛛永遠(yuǎn)不會(huì)光臨此網(wǎng)站
D.站長可以通過技術(shù)等優(yōu)化來吸引蜘蛛爬行抓取
第11題
ADSR動(dòng)態(tài)評價(jià)產(chǎn)生的信譽(yù)積分是永遠(yuǎn)累加的
BDSR動(dòng)態(tài)評價(jià)會(huì)抓取半年內(nèi)的評分
CDSR動(dòng)態(tài)評分只能一個(gè)單號給一個(gè)
D描述相符程度是DSR動(dòng)態(tài)評分的一個(gè)因素