對于搜索引擎平臺優(yōu)化,很多seoer都沒問題,但是把網(wǎng)站能優(yōu)化到百度首頁的卻不多。經(jīng)過最近一段時間的注意發(fā)現(xiàn)很多網(wǎng)站排名都處于中低端,排名不是太理想。
那么百度各大搜索引擎的整個從業(yè)原理是怎樣的呢?seo教程自學(xué)網(wǎng)來告訴大家。
各大搜索引擎從業(yè)原理可分為四個部分:抓取、過濾、收錄、和排序,對此我是這樣認(rèn)為的。
一、抓取:
各大搜索引擎抓取程序蜘蛛可分為:百度蜘蛛(baidu spider)、谷歌蜘蛛(google spider)、360蜘蛛(360 spider)、雅虎蜘蛛(yahoo spider)、搜狗蜘蛛(sogou spider)等。
既然知道了搜索引擎的蜘蛛名稱,那么怎樣讓蜘蛛來抓取我們的網(wǎng)站文案呢?可分為以下三點:
1、外部鏈接:外部鏈接分為發(fā)布外鏈的鏈接和友情鏈接兩種,外鏈也是網(wǎng)站外部優(yōu)化的唯一方法,高權(quán)重的外鏈站可以給網(wǎng)站起到催化提升排名得作用,友情鏈接觀察優(yōu)質(zhì)的,也可以給網(wǎng)站帶來意想不到的排名;
2、提交鏈接:提交鏈接首要是新站剛上線未收錄的時候用,可以通過百度站長平臺提交網(wǎng)站首頁鏈接;
3、讓蜘蛛自己來:對于前兩點可以起到一定的排名作用,但是單憑前兩點也是不夠得,那么怎樣讓蜘蛛自己來抓取我們的網(wǎng)站文案呢?毋庸置疑,網(wǎng)站的文案是否是優(yōu)質(zhì)的、網(wǎng)站內(nèi)部布局是否合理、是否有網(wǎng)站地圖、服務(wù)器是否穩(wěn)定等等都占有一定的因素。
當(dāng)我們每天都在更新網(wǎng)站文案、發(fā)布外鏈的時候,那么怎樣才能知道蜘蛛有沒有來我們的網(wǎng)站抓取文案?
其一、可以通過百度平臺的抓取頻率(見上圖),只要每天有壓力反饋,那么就代表蜘蛛有來過我們的網(wǎng)站,同時抓取了一部分文案,回收到百度數(shù)據(jù)庫;
其二,通過服務(wù)期日志,通常命名位log的文件就是網(wǎng)站服務(wù)器日志。通過服務(wù)期日志可以看出,那些各大搜索引擎來過我們的網(wǎng)站,訪客的ip,還有一些就是我們的網(wǎng)站被攻擊掛馬了,也可以通過log文件看出攻擊我們網(wǎng)站人的ip以及篡改了那些頁面。
很多網(wǎng)站收錄少或是排名上不來原因也在于蜘蛛的抓取因素,首要分為路徑過長或是中文路徑。
路徑過長就是一個網(wǎng)頁的url太過于長,超過64字節(jié),那么后邊的鏈接蜘蛛就無法抓取。如果是靜態(tài)鏈接可能是網(wǎng)頁的層次太深,這樣各大搜索引擎會認(rèn)為該頁面不重要,從而可能影響網(wǎng)站收錄;如果是動態(tài)鏈接,層次過深也不利于優(yōu)化;
另一種影響蜘蛛抓取的因素是中文路徑,如果url是中文路徑,那么主機空間里的文件名稱也是中文命名,由于很多空間不支持中文命名的文件,這樣可能會導(dǎo)致網(wǎng)頁加載緩慢、或是加載的url亂碼,從而導(dǎo)致各大搜索引擎識別不了。
二、過濾:
各大搜索引擎為什么要過濾抓取的文案?
由于現(xiàn)在網(wǎng)絡(luò)快速的快速發(fā)展,并且網(wǎng)站數(shù)量的與日俱增,那么也就會出現(xiàn)大量的高重復(fù)文案、低質(zhì)量文案,有的文案中還存在著大量的死鏈接,這一步各大搜索引擎就是將這些低質(zhì)量的網(wǎng)頁過濾掉,為客戶提供有價值的文案。
既然各大搜索引擎要過濾網(wǎng)站文案,那么影響過濾的因素有那些呢?
1、識別:各大搜索引擎抓取來的網(wǎng)頁文案,有很多識別不了的,比如代碼、圖片、鏈接等等,所以我們就要對這一系列做出相應(yīng)的處理措施,代碼做到規(guī)范化、圖片添加alt屬性、鏈接盡可能采用靜態(tài)(偽靜態(tài)),不要出現(xiàn)中文路徑的url;
2、頁面質(zhì)量:很多站長都喜歡抄襲別人的文案,從而充實自己的網(wǎng)站,對于這一些各大搜索引擎剛開始是抓去收錄了,但是隔一段時間就會把這些低質(zhì)量的文案刪除掉,所以也就造成網(wǎng)站排名不穩(wěn)定、甚至下降。
三、收錄:
各大搜索引擎抓取了我們的網(wǎng)站文案,那么到底收錄了多少網(wǎng)站文案呢?
查詢網(wǎng)站收錄情況可以采用站長工具,但是站長工具只能作為參考,具體的可以采用site:指令,查看關(guān)聯(lián)域,比如:site:chenbaowen(帶www和不帶www的收錄是不同的),這個關(guān)乎到網(wǎng)站的首選域;另一種做法就是通過百度站長平臺工具查詢網(wǎng)站收錄情況。
很多網(wǎng)站收錄少但又有很多網(wǎng)站收錄較多這是什么原因?
對于新站,剛開始收錄少是很正常的,畢竟新站在百度眼里沒有樹立起信任、也沒有權(quán)威,只要定時更新優(yōu)質(zhì)的文案,和優(yōu)質(zhì)的外部鏈接即可;
對于老站,收錄很少的網(wǎng)站有很多,通常一個網(wǎng)頁超過一個半月沒有收錄,那么就要看一下網(wǎng)頁文案質(zhì)量是否偏低、文案是否太少等原因。
百度蜘蛛將各個網(wǎng)站文案收進(jìn)數(shù)據(jù)庫,進(jìn)行相應(yīng)的關(guān)鍵詞權(quán)重計算,這樣已達(dá)成排名的效果。
四、排序:
網(wǎng)站的排名是樹立在各大搜索引擎的基礎(chǔ)優(yōu)化上,百度將計算好的關(guān)鍵詞權(quán)重排在百度頁,就是大家經(jīng)常在乎的排名上升下降。
想要做好關(guān)鍵詞的排名就要做好以下幾點:
網(wǎng)站搭建布局、模板代碼優(yōu)化、url鏈接靜態(tài)、鏈接縮短、圖片文字并茂、文案短句子、圖片alt屬性、高權(quán)重的外部鏈接、優(yōu)質(zhì)的友情鏈接,只要做好這些。然后就是循序漸進(jìn)的更新網(wǎng)站文案、網(wǎng)站外鏈,排名就會慢慢的上來。
網(wǎng)賺項目總結(jié):
對于做搜索引擎平臺優(yōu)化,在我自己看來首要就是一再力、執(zhí)行力、以及腦子要轉(zhuǎn)到快,這樣才不會在網(wǎng)絡(luò)的大潮中拍死。引言:
對于搜索引擎平臺優(yōu)化,很多seoer都沒問題,但是把網(wǎng)站能優(yōu)化到百度首頁的卻不多。經(jīng)過最近一段時間的注意發(fā)現(xiàn)很多網(wǎng)站排名都處于中低端,排名不是太理想。
那么百度各大搜索引擎的整個從業(yè)原理是怎樣的呢?seo教程自學(xué)網(wǎng)來告訴大家。
各大搜索引擎從業(yè)原理可分為四個部分:抓取、過濾、收錄、和排序,對此我是這樣認(rèn)為的。
一、抓取:
各大搜索引擎抓取程序蜘蛛可分為:百度蜘蛛(baidu spider)、谷歌蜘蛛(google spider)、360蜘蛛(360 spider)、雅虎蜘蛛(yahoo spider)、搜狗蜘蛛(sogou spider)等。
既然知道了搜索引擎的蜘蛛名稱,那么怎樣讓蜘蛛來抓取我們的網(wǎng)站文案呢?可分為以下三點:
1、外部鏈接:外部鏈接分為發(fā)布外鏈的鏈接和友情鏈接兩種,外鏈也是網(wǎng)站外部優(yōu)化的唯一方法,高權(quán)重的外鏈站可以給網(wǎng)站起到催化提升排名得作用,友情鏈接觀察優(yōu)質(zhì)的,也可以給網(wǎng)站帶來意想不到的排名;
2、提交鏈接:提交鏈接首要是新站剛上線未收錄的時候用,可以通過百度站長平臺提交網(wǎng)站首頁鏈接;
3、讓蜘蛛自己來:對于前兩點可以起到一定的排名作用,但是單憑前兩點也是不夠得,那么怎樣讓蜘蛛自己來抓取我們的網(wǎng)站文案呢?毋庸置疑,網(wǎng)站的文案是否是優(yōu)質(zhì)的、網(wǎng)站內(nèi)部布局是否合理、是否有網(wǎng)站地圖、服務(wù)器是否穩(wěn)定等等都占有一定的因素。
當(dāng)我們每天都在更新網(wǎng)站文案、發(fā)布外鏈的時候,那么怎樣才能知道蜘蛛有沒有來我們的網(wǎng)站抓取文案?
其一、可以通過百度平臺的抓取頻率(見上圖),只要每天有壓力反饋,那么就代表蜘蛛有來過我們的網(wǎng)站,同時抓取了一部分文案,回收到百度數(shù)據(jù)庫;
其二,通過服務(wù)期日志,通常命名位log的文件就是網(wǎng)站服務(wù)器日志。通過服務(wù)期日志可以看出,那些各大搜索引擎來過我們的網(wǎng)站,訪客的ip,還有一些就是我們的網(wǎng)站被攻擊掛馬了,也可以通過log文件看出攻擊我們網(wǎng)站人的ip以及篡改了那些頁面。
很多網(wǎng)站收錄少或是排名上不來原因也在于蜘蛛的抓取因素,首要分為路徑過長或是中文路徑。
路徑過長就是一個網(wǎng)頁的url太過于長,超過64字節(jié),那么后邊的鏈接蜘蛛就無法抓取。如果是靜態(tài)鏈接可能是網(wǎng)頁的層次太深,這樣各大搜索引擎會認(rèn)為該頁面不重要,從而可能影響網(wǎng)站收錄;如果是動態(tài)鏈接,層次過深也不利于優(yōu)化;
另一種影響蜘蛛抓取的因素是中文路徑,如果url是中文路徑,那么主機空間里的文件名稱也是中文命名,由于很多空間不支持中文命名的文件,這樣可能會導(dǎo)致網(wǎng)頁加載緩慢、或是加載的url亂碼,從而導(dǎo)致各大搜索引擎識別不了。
二、過濾:
各大搜索引擎為什么要過濾抓取的文案?
由于現(xiàn)在網(wǎng)絡(luò)快速的快速發(fā)展,并且網(wǎng)站數(shù)量的與日俱增,那么也就會出現(xiàn)大量的高重復(fù)文案、低質(zhì)量文案,有的文案中還存在著大量的死鏈接,這一步各大搜索引擎就是將這些低質(zhì)量的網(wǎng)頁過濾掉,為客戶提供有價值的文案。
既然各大搜索引擎要過濾網(wǎng)站文案,那么影響過濾的因素有那些呢?
1、識別:各大搜索引擎抓取來的網(wǎng)頁文案,有很多識別不了的,比如代碼、圖片、鏈接等等,所以我們就要對這一系列做出相應(yīng)的處理措施,代碼做到規(guī)范化、圖片添加alt屬性、鏈接盡可能采用靜態(tài)(偽靜態(tài)),不要出現(xiàn)中文路徑的url;
2、頁面質(zhì)量:很多站長都喜歡抄襲別人的文案,從而充實自己的網(wǎng)站,對于這一些各大搜索引擎剛開始是抓去收錄了,但是隔一段時間就會把這些低質(zhì)量的文案刪除掉,所以也就造成網(wǎng)站排名不穩(wěn)定、甚至下降。
三、收錄:
各大搜索引擎抓取了我們的網(wǎng)站文案,那么到底收錄了多少網(wǎng)站文案呢?
查詢網(wǎng)站收錄情況可以采用站長工具,但是站長工具只能作為參考,具體的可以采用site:指令,查看關(guān)聯(lián)域,比如:site:chenbaowen(帶www和不帶www的收錄是不同的),這個關(guān)乎到網(wǎng)站的首選域;另一種做法就是通過百度站長平臺工具查詢網(wǎng)站收錄情況。
很多網(wǎng)站收錄少但又有很多網(wǎng)站收錄較多這是什么原因?
對于新站,剛開始收錄少是很正常的,畢竟新站在百度眼里沒有樹立起信任、也沒有權(quán)威,只要定時更新優(yōu)質(zhì)的文案,和優(yōu)質(zhì)的外部鏈接即可;
對于老站,收錄很少的網(wǎng)站有很多,通常一個網(wǎng)頁超過一個半月沒有收錄,那么就要看一下網(wǎng)頁文案質(zhì)量是否偏低、文案是否太少等原因。
百度蜘蛛將各個網(wǎng)站文案收進(jìn)數(shù)據(jù)庫,進(jìn)行相應(yīng)的關(guān)鍵詞權(quán)重計算,這樣已達(dá)成排名的效果。
四、排序:
網(wǎng)站的排名是樹立在各大搜索引擎的基礎(chǔ)優(yōu)化上,百度將計算好的關(guān)鍵詞權(quán)重排在百度頁,就是大家經(jīng)常在乎的排名上升下降。
想要做好關(guān)鍵詞的排名就要做好以下幾點:
網(wǎng)站搭建布局、模板代碼優(yōu)化、url鏈接靜態(tài)、鏈接縮短、圖片文字并茂、文案短句子、圖片alt屬性、高權(quán)重的外部鏈接、優(yōu)質(zhì)的友情鏈接,只要做好這些。然后就是循序漸進(jìn)的更新網(wǎng)站文案、網(wǎng)站外鏈,排名就會慢慢的上來。
網(wǎng)賺項目總結(jié):
對于做搜索引擎平臺優(yōu)化,在我自己看來首要就是一再力、執(zhí)行力、以及腦子要轉(zhuǎn)到快,這樣才不會在網(wǎng)絡(luò)的大潮中拍死。
上一篇:營銷:網(wǎng)站站內(nèi)鏈接優(yōu)化的三個典型范例拆析
標(biāo)題:營銷:各大搜索引擎的整個搜索從業(yè)原理
地址:http://www.galaxydg.com.cn/xinwen/37195.html
免責(zé)聲明:文芳閣軟文營銷平臺所轉(zhuǎn)載內(nèi)容均來自于網(wǎng)絡(luò),不為其真實性負(fù)責(zé),只為傳播網(wǎng)絡(luò)信息為目的,如有異議請及時聯(lián)系btr2030@163.com,本人將予以刪除。