搜索引擎到底會不會抓取圖片、js、fhash內(nèi)容?
來源:昆明多彩網(wǎng)絡(luò)公司 日期:2010-08-18 閱讀: 發(fā)表評論
網(wǎng)頁組成內(nèi)容無非就是文字,圖片,js,動畫flash,視頻元素,早在幾年前,在搜索引擎發(fā)展初級階段的時候,搜索引擎的抓取內(nèi)容方式是及其原始和簡陋的,而且只能抓取網(wǎng)頁的title等頁頭部分。
當(dāng)時站長群也很少,而且做一個關(guān)鍵詞也非常容易,主要隨便修改一下網(wǎng)頁的標(biāo)題就可以達到很好的排名,隨著搜索引擎數(shù)據(jù)發(fā)掘技術(shù)的發(fā)展,搜索引擎慢慢會嘗試去抓取更多的東西,比如網(wǎng)頁的其他文字內(nèi)容,并且不再將網(wǎng)頁標(biāo)題作為唯一的排名標(biāo)準(zhǔn),并且加入了很多其他的算法來給一個網(wǎng)站在搜索引擎上綜合的排名。
目前來說,百度能夠很好的識別和把握中文內(nèi)容,不然也不會對外號稱自己是全球第一大中文搜索引擎,對圖片能夠有一定程度的識別,而對flash動畫和視頻抓取技術(shù)還比不上google;谷歌雖然不主張站長使用動畫來作為網(wǎng)站主要展示內(nèi)容的方式,但是經(jīng)過大家試驗,一些簡單的flash動畫內(nèi)的問題google能夠很好的識別,并將該元素內(nèi)抓取的內(nèi)容作為網(wǎng)站綜合排名的依據(jù),而百度似乎還是停留在文字和圖片基礎(chǔ)上。
谷歌對于一些單色背景圖片能夠很好的識別,比如黑色背景上打上白色的字,谷歌的識別幾乎達到了100%。
發(fā)表評論評論列表(有 條評論)