對(duì)于網(wǎng)絡(luò)上眾多的搜索引擎工作原理貼,上海SEO蝸牛博客表示尊重同時(shí)也想說一句:親,你的總結(jié)不全面,讓我借道于你,把你的內(nèi)容總結(jié)起來,再融入蝸牛的見解,讓大家更明白搜索引擎到底是怎樣的一個(gè)工作原理吧。
那么從文章發(fā)表到搜索結(jié)果展現(xiàn)要經(jīng)過哪些過程呢?
一、蜘蛛爬行
首先,文章發(fā)表之后,第一步是要想辦法讓蜘蛛過來爬行網(wǎng)頁,我們可以通過在網(wǎng)站地圖上面加上我們想要被爬行的網(wǎng)址,定時(shí)更新網(wǎng)頁,向搜索引擎提交,發(fā)外鏈的方式來讓蜘蛛抓取網(wǎng)站上面的內(nèi)容。詳情參考:如何讓搜索引擎快速爬取你的更新
二、抓取-存儲(chǔ)
搜索引擎會(huì)通過自身系統(tǒng)的算法,來決定對(duì)哪些網(wǎng)站施行抓取,以及抓取的內(nèi)容和頻率值。搜索引擎的計(jì)算過程會(huì)參考您的網(wǎng)站在歷史中的表現(xiàn),比如內(nèi)容是否足夠優(yōu)質(zhì),是否存在對(duì)用戶不友好的設(shè)置,是否存在過度的搜索引擎優(yōu)化行為等等。
當(dāng)您的網(wǎng)站產(chǎn)生新內(nèi)容時(shí),Baiduspider會(huì)通過互聯(lián)網(wǎng)中某個(gè)指向該頁面的鏈接進(jìn)行訪問和抓取,如果您沒有設(shè)置任何外部鏈接指向網(wǎng)站中的新增內(nèi)容,則Baiduspider是無法對(duì)其進(jìn)行抓取的。對(duì)于已被抓取過的內(nèi)容,搜索引擎會(huì)對(duì)抓取的頁面進(jìn)行記錄,并依據(jù)這些頁面對(duì)用戶的重要程度安排不同頻次的抓取更新工作。
需您要注意的是,有一些抓取軟件,為了各種目的,會(huì)偽裝成Baiduspider對(duì)您的網(wǎng)站進(jìn)行抓取,這可能是不受控制的抓取行為,嚴(yán)重時(shí)會(huì)影響到網(wǎng)站的正常運(yùn)作。
三、分析,篩選
當(dāng)你網(wǎng)站的內(nèi)容被蜘蛛存儲(chǔ)到自己的數(shù)據(jù)庫之后,會(huì)對(duì)它進(jìn)行分析和,互聯(lián)網(wǎng)上是否有相同的內(nèi)容,相同度有多高。你的內(nèi)容是否有欺騙搜索引擎的行為,或是否有損害用戶體驗(yàn)的行為,搜索引擎會(huì)根據(jù)內(nèi)容進(jìn)行篩選,將垃圾內(nèi)容刪除,將有用的內(nèi)容保留。
四、索引(正常索引)
索引就是我們常說到的搜索引擎的索引量,搜索引擎對(duì)抓取回來的內(nèi)容會(huì)逐一進(jìn)行標(biāo)記和識(shí)別,并將這些標(biāo)記進(jìn)行儲(chǔ)存為結(jié)構(gòu)化的數(shù)據(jù),比如網(wǎng)頁的tag、title、meta、descripiton、網(wǎng)頁外鏈及描述、抓取記錄。同時(shí),也會(huì)將網(wǎng)頁中的關(guān)鍵詞信息進(jìn)行識(shí)別和儲(chǔ)存,以便與用戶搜索的內(nèi)容進(jìn)行匹配。
五、排序
當(dāng)搜索引擎將網(wǎng)頁進(jìn)行篩選之后,就會(huì)對(duì)其進(jìn)行分詞,并根據(jù)內(nèi)容的質(zhì)量與原創(chuàng)度,給予到不同關(guān)鍵詞不同的排序,這就是我們搜索結(jié)果中的關(guān)鍵詞排名產(chǎn)生的過程。
六、搜索,展現(xiàn)
到第五步,搜索引擎的工作就完成了,第六步就是由用戶在搜索引擎的搜索框里面輸入我們的目標(biāo)關(guān)鍵詞,然后搜索引擎將我們需要的內(nèi)容按已排列好的順序?qū)⑵湔宫F(xiàn)給我們。此此為止,搜索引擎就完成了整個(gè)從發(fā)表文章到被用戶搜索到的全過程。
至于文章能排以什么位置,影響因素有很多很多,這個(gè)就要靠大家去學(xué)習(xí)去思考了。上海SEO蝸牛博客今天的分享就到這里,相信對(duì)于一些小白用戶,大家都明白了搜索引擎它從你文章發(fā)表到被別人搜索展現(xiàn)是怎么樣的一個(gè)過程了吧。如果大家有興趣,或是對(duì)蝸牛的觀點(diǎn)表示認(rèn)可,大家可以訪問 上海SEO ,與蝸牛共同探討SEO的技術(shù)與發(fā)展吧。
轉(zhuǎn)載請(qǐng)注明:?蝸牛SEO? ? 從文章發(fā)表到搜索展現(xiàn)全過程