駁“目錄的長(zhǎng)度(深度)影響SEO優(yōu)化效果”論
在全通公司工作也有兩年了,在這兩年里,有一個(gè)SEO優(yōu)化問(wèn)題是經(jīng)常被客戶提及:網(wǎng)站后臺(tái)的目錄太深了,足足有四個(gè)文件夾,很不利于SEO優(yōu)化的。面對(duì)這個(gè)問(wèn)題時(shí),小莫通常會(huì)選擇反問(wèn)他們一句:為什么覺(jué)得這會(huì)影響SEO優(yōu)化呢?他們對(duì)此的回答多半為:目錄深了,url就會(huì)變得很長(zhǎng),用戶體驗(yàn)也就不好了,甚至?xí)绊懙綑?quán)限和蜘蛛抓取。對(duì)此,小莫特意去搜索了相關(guān)的文章,的確也有這種說(shuō)法的文章。但是,由于小莫從事網(wǎng)站建設(shè)行業(yè)多年,也曾做過(guò)搜索引擎相關(guān)的系統(tǒng)開(kāi)發(fā)工作,對(duì)于蜘蛛原理也算是有一點(diǎn)了解。所以,今天就從技術(shù)層面來(lái)為大家分析一下,為什么小莫會(huì)覺(jué)得這些論調(diào)是錯(cuò)誤的。
在反駁相關(guān)問(wèn)題之前,我們還是先來(lái)了解一下網(wǎng)絡(luò)蜘蛛和網(wǎng)站權(quán)重的基本知識(shí)先吧。
網(wǎng)絡(luò)蜘蛛,別名網(wǎng)絡(luò)爬蟲(chóng),是一種按照一定的規(guī)則,自動(dòng)地抓取萬(wàn)維網(wǎng)信息的程序或者腳本。傳統(tǒng)的爬蟲(chóng)會(huì)從宇哥或若干初始網(wǎng)頁(yè)的url開(kāi)始,獲得初始網(wǎng)頁(yè)的url,在抓取網(wǎng)頁(yè)的時(shí)候,會(huì)不斷的從前一個(gè)頁(yè)面上抽取新的url放到隊(duì)列之中,直到滿足了系統(tǒng)的一定條件后,再對(duì)抓取到的頁(yè)面進(jìn)行不同的分析和處理,以提高智能化的搜索結(jié)果排名。如果把整個(gè)互聯(lián)網(wǎng)當(dāng)成一個(gè)網(wǎng)站,那么網(wǎng)絡(luò)蜘蛛就可以用這個(gè)原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁(yè)都抓取下來(lái)。
由于蜘蛛無(wú)法抓取互聯(lián)網(wǎng)上的所有網(wǎng)頁(yè),所以會(huì)對(duì)一些不是那么重要的網(wǎng)站設(shè)置訪問(wèn)層數(shù)。如,在圖1中,A為起始網(wǎng)頁(yè),屬于0層,B、C、D、E、F屬于第1層,G、H屬于第2層,I、J屬于第3層。如果網(wǎng)絡(luò)蜘蛛設(shè)置的訪問(wèn)層數(shù)為2的話,網(wǎng)頁(yè)I、J是不會(huì)被訪問(wèn)到的。這也讓有些網(wǎng)站上一部分網(wǎng)頁(yè)能夠在搜索引擎上搜索到,另外一部分不能被搜索到。但按如圖2中,假如J的層級(jí)在A層級(jí)中出現(xiàn),則J被視為和A一樣的同一級(jí),也會(huì)被抓取。所以,對(duì)于網(wǎng)站設(shè)計(jì)者來(lái)說(shuō),扁平化的網(wǎng)站結(jié)構(gòu)設(shè)計(jì)有助于搜索引擎抓取其更多的網(wǎng)頁(yè)。
圖一
圖二
網(wǎng)絡(luò)蜘蛛進(jìn)入一個(gè)網(wǎng)站時(shí),首先會(huì)去訪問(wèn)一個(gè)特殊的文本文件,那就是Robots.txt。一般來(lái)說(shuō),這個(gè)文件會(huì)放在網(wǎng)站服務(wù)器的根目錄下,網(wǎng)站的管理員可以通過(guò)Robots.txt來(lái)定義那些目錄是網(wǎng)絡(luò)蜘蛛不能爬行的,或者是哪些目錄是哪些搜索引擎蜘蛛無(wú)法爬行的。例如有些網(wǎng)站的可執(zhí)行文件目錄和臨時(shí)文件目錄不希望被搜索引擎搜索到,那么網(wǎng)站管理員就可以把這些目錄定義為拒絕訪問(wèn)目錄。Robots.txt語(yǔ)法很簡(jiǎn)單,例如如果對(duì)目錄沒(méi)有任何限制,可以用以下兩行來(lái)描述: User-agent: * Disallow:
當(dāng)然,Robots.txt也只是一個(gè)協(xié)議而已,如果網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)者不想遵守這個(gè)協(xié)議的話,網(wǎng)站管理員是無(wú)法阻止網(wǎng)絡(luò)蜘蛛對(duì)某些頁(yè)面的訪問(wèn)的。但是,一般來(lái)說(shuō),網(wǎng)絡(luò)蜘蛛都會(huì)遵守這個(gè)協(xié)議的。其實(shí),我們除了通過(guò)Robots.txt來(lái)拒接網(wǎng)絡(luò)蜘蛛的爬行之外,我們還可以通過(guò)其他方法來(lái)拒接網(wǎng)絡(luò)蜘蛛的爬行的。
網(wǎng)絡(luò)蜘蛛在下載網(wǎng)頁(yè)的時(shí)候,會(huì)去識(shí)別網(wǎng)頁(yè)的HTML代碼,在其代碼的部分,會(huì)有META標(biāo)識(shí)。通過(guò)這些標(biāo)識(shí),可以告訴網(wǎng)絡(luò)蜘蛛本網(wǎng)頁(yè)是否需要被抓取,還可以告訴網(wǎng)絡(luò)蜘蛛本網(wǎng)頁(yè)中的鏈接是否需要被繼續(xù)跟蹤。例如: 表示本網(wǎng)頁(yè)不需要被抓取,但是網(wǎng)頁(yè)內(nèi)的鏈接需要被跟蹤。
一般的網(wǎng)站都希望搜索引擎能更全面的抓取自己網(wǎng)站的網(wǎng)頁(yè),因?yàn)檫@樣可以讓更多的訪問(wèn)者能通過(guò)搜索引擎找到此網(wǎng)站。為了讓本網(wǎng)站的網(wǎng)頁(yè)更全面被抓取到,網(wǎng)站管理員可以建立一個(gè)網(wǎng)站地圖,即Site Map。許多網(wǎng)絡(luò)蜘蛛會(huì)把sitemap.htm文件作為一個(gè)網(wǎng)站網(wǎng)頁(yè)爬取的入口,網(wǎng)站管理員可以把網(wǎng)站內(nèi)部所有網(wǎng)頁(yè)的鏈接放在這個(gè)文件里面,那么網(wǎng)絡(luò)蜘蛛可以很方便的把整個(gè)網(wǎng)站抓取下來(lái),避免遺漏某些網(wǎng)頁(yè),也會(huì)減小對(duì)網(wǎng)站服務(wù)器的負(fù)擔(dān)。
在了解了網(wǎng)絡(luò)蜘蛛的基本原理之外,接下來(lái),我們就一起去了解一下,網(wǎng)站權(quán)重的基本知識(shí)吧。
網(wǎng)站權(quán)重,一般是指:搜索引擎對(duì)網(wǎng)站進(jìn)行評(píng)估評(píng)價(jià)后,給網(wǎng)站賦予的一定的權(quán)威值。一個(gè)網(wǎng)站的權(quán)重越高,那么這個(gè)網(wǎng)站在搜索引擎中所占的分量也就越大,關(guān)鍵詞排名也就越好。雖然說(shuō),基本每一個(gè)SEOER都會(huì)討論和研究網(wǎng)站權(quán)重。但是,在某些搜索引擎中,這個(gè)標(biāo)準(zhǔn)是不存在的。概括的說(shuō):就是網(wǎng)站與網(wǎng)站在搜索引擎眼中的分級(jí)制“待遇”的不同表現(xiàn)。誤區(qū):例如人們經(jīng)常討論的百度權(quán)重其實(shí)并不是百度官方給出的概念,而是一些第三方站長(zhǎng)網(wǎng)站推出的針對(duì)網(wǎng)站關(guān)鍵詞排名預(yù)計(jì)給網(wǎng)站帶來(lái)流量,劃分等級(jí)0-10第三方網(wǎng)站歡迎度評(píng)估數(shù)據(jù)。影響網(wǎng)站權(quán)重的因素較多,主要有以下幾種:
網(wǎng)站架構(gòu)
網(wǎng)站結(jié)構(gòu)不盡需要迎合搜索引擎的喜好,更要符合用戶體驗(yàn)的要求。而優(yōu)質(zhì)的網(wǎng)站架構(gòu)一般為扁平式,既:主頁(yè)>欄目頁(yè)>內(nèi)容頁(yè),同時(shí)站點(diǎn)還應(yīng)包含TAG標(biāo)簽,留言評(píng)論、文章搜索等。
域名類型
一般來(lái)說(shuō),gov和edu類型的域名的權(quán)重會(huì)比較高一點(diǎn)。因?yàn)椋眠@一類域名的站點(diǎn)基本為政府高校的網(wǎng)站,很少是草根個(gè)人的小站。其實(shí),com、net、org的域名權(quán)重相對(duì)較高,一些有國(guó)家和地區(qū)特點(diǎn)的域名后綴建議不要選。從用戶習(xí)慣來(lái)看,com已成為首選。最后域名的注冊(cè)年齡越久,搜索引擎給予的信任越高。
導(dǎo)入鏈接
雖然外鏈的時(shí)代已經(jīng)過(guò)去了。但是,外鏈對(duì)于網(wǎng)站來(lái)說(shuō),還是很重要的。只是在今時(shí)今日,我們不僅需要做好外鏈的數(shù)量,更需要做好外鏈的質(zhì)量。只有優(yōu)質(zhì)的外鏈,才能幫助到網(wǎng)站。如果一昧的提高外鏈的數(shù)量,則是很容易受到搜索引擎的懲罰的。
網(wǎng)站內(nèi)容
“外鏈為皇,內(nèi)容為王”這句話充分的表達(dá)出了,內(nèi)容對(duì)于網(wǎng)站權(quán)重的重要性。如果能長(zhǎng)時(shí)間為網(wǎng)站創(chuàng)造出優(yōu)質(zhì)的原創(chuàng)內(nèi)容的話,網(wǎng)站權(quán)重自然會(huì)蹭蹭往上加的。因?yàn)?,原?chuàng)內(nèi)容就是為搜索引擎注入新鮮的血液。如果,實(shí)在原創(chuàng)不出什么內(nèi)容的時(shí)候,那就偽原創(chuàng)一下。。切忌原封不動(dòng)的復(fù)制粘貼,尤其是機(jī)器采集后進(jìn)行所謂的自動(dòng)偽原創(chuàng),更有甚者前后兩段抄堆疊關(guān)鍵詞或者所謂的偽原創(chuàng),其實(shí)段落語(yǔ)句不通,用戶體驗(yàn)差,網(wǎng)站跳出率高,同樣也不會(huì)有好的權(quán)重。
收錄數(shù)量
堅(jiān)持更新站點(diǎn),合理布置鏈接誘餌,增加站點(diǎn)頁(yè)面的收錄數(shù)量。雖說(shuō)收錄數(shù)量與權(quán)重之間不是絕對(duì)關(guān)系,但你見(jiàn)過(guò)同類型同行業(yè)的網(wǎng)站收錄數(shù)量?jī)H有幾十的權(quán)重高于幾萬(wàn)的情況嗎?
關(guān)鍵詞排名
尤其是核心關(guān)鍵詞的排名。首先要明白搜索引擎為什么會(huì)給你的關(guān)鍵詞一個(gè)較高的排名,因?yàn)闄?quán)重高了。其次,認(rèn)真做好相關(guān)關(guān)鍵詞和長(zhǎng)尾關(guān)鍵詞的排名,這有利于提升網(wǎng)站的整體權(quán)重。
更新頻率
堅(jiān)持有規(guī)律的更新網(wǎng)站,除了會(huì)獲得及時(shí)的網(wǎng)頁(yè)快照外,還能增加搜索引擎的信任度,一個(gè)更新頻繁的網(wǎng)站比那些僵尸網(wǎng)站的權(quán)重肯定會(huì)高很多。同時(shí),應(yīng)注意更新時(shí)間和更新數(shù)量,避免之前積累的權(quán)重慢慢流失了。
內(nèi)容頁(yè)
內(nèi)頁(yè)是否和首頁(yè)以及網(wǎng)站主題有較為緊密的聯(lián)系,內(nèi)頁(yè)之間的銜接、關(guān)鍵字的布局,以及內(nèi)頁(yè)是否具有專業(yè)性,權(quán)威度如何。
網(wǎng)站的誠(chéng)信度
Google除PR值以外,還有一個(gè)誠(chéng)信指數(shù)。即通過(guò)對(duì)一些高質(zhì)量網(wǎng)站的分析,給出一個(gè)“誠(chéng)信”網(wǎng)站應(yīng)該有的一些指標(biāo),并用這些指標(biāo)來(lái)分析一個(gè)網(wǎng)站的誠(chéng)信度。
網(wǎng)站服務(wù)器
服務(wù)器穩(wěn)定是關(guān)鍵,如果說(shuō)搜索引擎抓取頁(yè)面時(shí)網(wǎng)站空間無(wú)法訪問(wèn),特別是新站,網(wǎng)站服務(wù)器不穩(wěn)定可能導(dǎo)致搜索引擎不收錄網(wǎng)站。其次是網(wǎng)站頁(yè)面的打開(kāi)速度,這些服務(wù)器因素對(duì)權(quán)重都有影響。
最后聲明下,權(quán)重跟排名不能劃為等號(hào);就像PR≠排名,當(dāng)然這只是SEO細(xì)節(jié)中的一個(gè)重要組成部分。權(quán)重的高低是影響關(guān)鍵詞排名其中的一項(xiàng)重要因素而已。
說(shuō)完了網(wǎng)絡(luò)蜘蛛和網(wǎng)站權(quán)重的基本原理之后,下面我們就用這些原理來(lái)闡述一下,域名路徑的長(zhǎng)短是否會(huì)影響到SEO優(yōu)化的效果呢?
首先,我們先去了解一下靜態(tài)路徑的規(guī)則:
靜態(tài)路徑的規(guī)則為:域名/靜態(tài)總目錄/語(yǔ)言目錄/主分類/子分類/內(nèi)容名.html,其實(shí)靜態(tài)總目錄是可以去掉或者修改的。如果為單語(yǔ)言的情況下面,語(yǔ)言目錄也是可以去掉的,但如果為多語(yǔ)言,則此目錄必須保留,以避免相同語(yǔ)言相同目錄及內(nèi)容的覆蓋。
在上面介紹中,我們說(shuō)過(guò)網(wǎng)絡(luò)蜘蛛抓取,是根據(jù)頁(yè)面訪問(wèn)層級(jí)來(lái)進(jìn)行抓取的,而不是目錄層級(jí),如下圖所示:
假如現(xiàn)在內(nèi)容J中有URL為:http://www.nuehe.cn/news/xingyeba/10519.html,如果此內(nèi)容的鏈接出現(xiàn)在J和出現(xiàn)在A層,那么可以分別理解為0層和3層,這種意義是不一樣。如果出現(xiàn)在A層中,那么網(wǎng)絡(luò)蜘蛛在第一次抓取中就比較容易尋獲取此URL,并進(jìn)行抓取保存,而如果出現(xiàn)在J層中,那么當(dāng)網(wǎng)絡(luò)蜘蛛只設(shè)定了二層后,就抓取不到了。這種層級(jí)關(guān)系的理解,不是域名文件夾的層級(jí)關(guān)系,而是瀏覽深度指向的層級(jí)。
所以說(shuō),網(wǎng)站后臺(tái)生成的靜態(tài)URL文件夾的多與少,其實(shí)對(duì)SEO優(yōu)化效果來(lái)說(shuō),基本是沒(méi)有影響的。但是,如果你的網(wǎng)站是英文網(wǎng)站的會(huì)啊,那么請(qǐng)注意了文件夾的生成文件名,是有一定的影響的。比如產(chǎn)品文件夾的名稱設(shè)定成products和設(shè)定成cb,那是有很大的關(guān)系的,所以切記一條:文件夾盡量取英文名或者英文代表關(guān)鍵字。
那有人又會(huì)說(shuō)了:既然您網(wǎng)絡(luò)蜘蛛沒(méi)有影響,那權(quán)重呢?總會(huì)有一定的影響吧?先前說(shuō)過(guò)了,網(wǎng)頁(yè)權(quán)重影響主要是內(nèi)容質(zhì)量、關(guān)鍵字、域名、點(diǎn)擊數(shù)量、收錄數(shù)量、服務(wù)器速度等因素,URL的長(zhǎng)短實(shí)際很少,如果不信,您要中以搜索一下百度或者谷歌,他們收錄中,同樣有非常長(zhǎng)的URL網(wǎng)頁(yè)。
談了這么多原理性之后,不知您還是否跟其它SEOER一樣,同樣認(rèn)為URL長(zhǎng)度影響質(zhì)量呢?如果您還堅(jiān)持您的觀點(diǎn),可以多了解一下搜索技術(shù)方面的文章,而不是SEO營(yíng)銷方面的文章,SEOER更不該誤人子弟,正確理解SEO的重要性,還是對(duì)您網(wǎng)站內(nèi)容的質(zhì)量、內(nèi)鏈著手吧!
百度口碑
100%好評(píng)
360安全認(rèn)證
安全可信賴
公安機(jī)關(guān)
公網(wǎng)備案