搜索引擎蜘蛛在對網(wǎng)站進行抓取的過程中會對網(wǎng)站更新頻率進行監(jiān)控參考,從而對下次抓取時間進行合理安排,這樣的策略可以有效提升搜索引擎Spider爬行效率,避免不必要的資源浪費。而對SEO來說,培養(yǎng)蜘蛛良好的抓取習(xí)慣更是能夠幫助模塊獲取穩(wěn)定排名維護的重要策略,那如何才能培養(yǎng)蜘蛛正確的抓取習(xí)慣?
眾所周知,搜索引擎在沒有任何輔助條件的情況下來判斷更新頻率是需要一段時間來觀察的,而大量的時間消耗對搜索引擎和SEO來說并無益處,在這個時候就需要網(wǎng)站運營人員配合給出一個更新頻率參照物,也就是頁面時間因子。
①前端時間因子:
這里的前端時間因子添加是便于蜘蛛在抓取過程中充分理解當(dāng)前頁面的更新時間。
②源碼時間因子:
而源碼內(nèi)的時間因子則是JSON-LD格式的提交方式,其作用是為了通知蜘蛛第一時間知曉頁面的發(fā)布、更新以及互動時間,便于及時抓取。
需要注意的是,前端時間因子如果不是期望抓取頻率在時、分、秒的策略中,建議只具體到日期即可,反之則具體到時分秒。
例如:更新時間:2020-6-29 和 更新時間:2020-6-29 13:11:42
通常我們在網(wǎng)站建設(shè)的時候會選擇合適的cms內(nèi)容管理系統(tǒng)或者自行開發(fā),而這些系統(tǒng)在便于對內(nèi)容重復(fù)修改的基礎(chǔ)上也具備更新功能,所以時間因子的觸發(fā)就要與頁面更新聯(lián)系起來,選擇合適的頻次對模塊進行更新效果事半功倍。
當(dāng)然,搜索引擎也不傻,它不會一味地只相信你告訴它的更新時間,搜索引擎自己也會對網(wǎng)頁整體變化進行判斷,而我們要做的就是通過頁面調(diào)用邏輯給網(wǎng)頁調(diào)取內(nèi)容進行更新,就如同我們首頁會在特定的時間范圍內(nèi)更新最新資訊的推薦入口一樣。
了解搜索引擎抓取的同學(xué)都清楚,單單依靠非主體內(nèi)容的配合更新是無法達到理想效果的,因為你的主體內(nèi)容并沒有發(fā)生變化,這個時候特定的頻次下,主體內(nèi)容豐富+相關(guān)內(nèi)容調(diào)用更新能使效果更佳理想。這里我們要注意,對百度而言它更喜歡在原有基礎(chǔ)上進行內(nèi)容豐富。
以商業(yè)化SEO站點為例,大型站點的數(shù)據(jù)甚至能達到幾百萬幾千萬條,很顯然我們無法做到對所有內(nèi)容都進行豐富,這個時候我們需要的是更新策略的細分。
我們以商品著陸頁為例,通常一個站點的核心內(nèi)容僅在整體網(wǎng)站內(nèi)容中占小部分的比例,而我們對站內(nèi)模塊更新的策略也不是針對每一個URL。
所以我們在更新策略中可以針對那些核心模塊進行差異化運營,甚至在核心模塊中還存在核心的20%占比。
網(wǎng)站地圖是網(wǎng)站抓取和更新的重要途徑之一,在更新和抓取的策略中,我們往往會忽視對網(wǎng)站地圖內(nèi)URL的更新頻次進行同步設(shè)置,這就好比你在問一個人問題,而他給了你兩個不同的答案,這個時候你對他給你的結(jié)果信任度并不會高。
搜索引擎也是同理,如果你在不同的途徑中告訴它相同的答案,那這個時候你給出的信息就會具備一定的參考價值。