欧美成人黄色小视频,国产人妖乱国产精品人妖,国产性天天综合网,台湾佬中文娱乐久久久

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

前沿科技 3年前 (2022) 虛像
8 0 0

Matrix 是少數(shù)派的寫作社區(qū),我們主張分享真實的產(chǎn)品體驗,有實用價值的經(jīng)驗與思考。我們會不定期挑選 Matrix 的優(yōu)質(zhì)文章,展示來自用戶的最真實的體驗和觀點。 文章代表作者個人觀點,少數(shù)派僅對標題和排版略作修改。

要說在中國知名度最高的網(wǎng)站,百度應(yīng)該是當之無愧的第一名;要說我們?nèi)粘J褂米铑l繁的網(wǎng)站,盡管每個人的使用習慣與工作需求不同,各大主流搜索引擎依舊名列前茅。

但是,你真的了解這些功能強大、在你的工作學習中不可或缺的互聯(lián)網(wǎng)「伴侶」嗎?你又真的會使用它們嗎?希望通過這篇小文章,帶領(lǐng)屏幕前的你們對目前主流搜索引擎的基本原理形成基本認知,并在此承諾不會涉及過多專業(yè)知識(畢竟我也不太懂……),更重要的是,希望用我的一點點經(jīng)驗和認知,幫助大家學會更好使用搜索引擎進行各種內(nèi)容的搜索。

搜索引擎的基本原理

(注意:這里所說搜索引擎是指狹義上的搜索工具,例如谷歌、百度、微軟必應(yīng)等,并非廣義搜索引擎,如專門搜索特定類型文件的搜索引擎,或是各大應(yīng)用內(nèi)部檢索內(nèi)容帖子的搜索功能,僅對狹義搜索引擎的基本原理進行敘述。)

先看定義,搜索引擎是指根據(jù)一定的策略,運用特定的計算機程序搜集互聯(lián)網(wǎng)上的信息,并對所搜集到的信息進行組織和處理,為用戶提供檢索服務(wù)的系統(tǒng)。從定義上來看,搜索引擎的功能實現(xiàn)主要經(jīng)歷以下三個步驟:

1. 從互聯(lián)網(wǎng)上獲取信息。搜索引擎主要通過特定計算機程序——蜘蛛系統(tǒng)程序(也就是人們通常所說的爬蟲)在互聯(lián)網(wǎng)聯(lián)通的各大服務(wù)器中爬取網(wǎng)頁,并沿著各種網(wǎng)頁中的所有 URL 爬到其他網(wǎng)頁,不斷延伸爬取的「觸角」,并把所有爬到的網(wǎng)頁收集回來。

2. 對所搜集到的信息進行組織處理并建立索引數(shù)據(jù)庫。由特定分析程序?qū)λ鸭降木W(wǎng)頁進行分析,提取網(wǎng)頁上的相關(guān)信息(包括 URL、網(wǎng)頁內(nèi)容及其關(guān)鍵詞、與其他網(wǎng)頁的關(guān)系等),并根據(jù)一定的相關(guān)度算法進行計算,得到網(wǎng)頁與特定關(guān)鍵詞的相關(guān)度,并依據(jù)相關(guān)度進行排序后建立索引數(shù)據(jù)庫。這里的相關(guān)度和排序便是你在某個搜索引擎搜索內(nèi)容時呈現(xiàn)出的答案排列依據(jù),不同搜索引擎依據(jù)不同的指標得出的內(nèi)容順序也不相同,例如某度前些年被曝出的廣告商可出錢購買特定排序,廣受網(wǎng)友抨擊。因此,所呈現(xiàn)搜索內(nèi)容的排序也是判斷一個搜索引擎是否能提升我們搜索效率的重要指標之一。

值得一提的是,現(xiàn)在的搜索引擎大多支持「超鏈分析」技術(shù),即不只是分析網(wǎng)頁本身內(nèi)容,還會分析索引數(shù)據(jù)庫中所有指向該網(wǎng)頁鏈接的 URL、標題、正文內(nèi)容,甚至鏈接周圍的相關(guān)文字等。這也就是為什么有時會出現(xiàn),即使網(wǎng)頁 A 中并沒有出現(xiàn)某個詞,但網(wǎng)頁 B 有鏈接指向網(wǎng)頁 A,且網(wǎng)頁 B 中某一部分出現(xiàn)了該關(guān)鍵詞,那么網(wǎng)頁 A 也會在用戶的搜索中被搜索引擎認為具有一定相關(guān)度,從而呈現(xiàn)在搜索結(jié)果中。「超鏈分析」技術(shù)將用戶搜索所得結(jié)果的覆蓋范圍與廣度提升上了新的臺階。

3. 為用戶提供檢索服務(wù)。用戶在搜索框輸入關(guān)鍵詞進行搜索后,搜索引擎依據(jù)數(shù)據(jù)庫中的索引將搜索結(jié)果的網(wǎng)頁鏈接和頁面內(nèi)容摘要組織起來呈現(xiàn)在用戶面前,用戶便可以依據(jù)摘要內(nèi)容點擊對應(yīng)鏈接,進入相關(guān)網(wǎng)頁進一步尋找自己想要的信息。

搜索引擎的分類

01 全文搜索引擎

我們?nèi)粘J褂米疃嗟模闶侨乃阉饕妫绻雀琛⑽④洷貞?yīng)、百度等。這些搜索引擎從互聯(lián)網(wǎng)上提取各個網(wǎng)站的信息,并建立自己的數(shù)據(jù)庫,當用戶輸入關(guān)鍵詞后檢索相匹配的信息,然后以一定的排列順序組織內(nèi)容將結(jié)果呈現(xiàn)于用戶電腦屏幕之上。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

微軟必應(yīng)搜索引擎

02 目錄索引類搜索引擎

最具代表性的目錄索引類搜索引擎就是大名鼎鼎的 Yahoo!了,這一類搜索引擎與常規(guī)意義上我們使用的搜索引擎不同,它們并不是以上文講述的工作流程運作,而僅僅是提供一系列按目錄分類的網(wǎng)站鏈接給用戶。用戶也可以不輸入任何關(guān)鍵詞進行查詢,僅通過在特定目錄下瀏覽網(wǎng)站鏈接列表以及人為提供的摘要信息選擇自己想要的網(wǎng)站進行深入查詢。通常而言,目錄索引類搜索引擎依托人工建立,并由人工對收錄網(wǎng)站進行分類,也就導(dǎo)致其搜索范圍較小,更新速度也相對更慢。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

Yahoo!

03 元搜索引擎

元搜索引擎在接受用戶查詢請求時,同時在其他多個搜索引擎上進行搜索,并將結(jié)果以特定排列順序返回給用戶,其搜索結(jié)果通常較為綜合全面,但也導(dǎo)致內(nèi)容繁雜,搜索命中率也相對較低。著名的元搜索引擎包括 InfoSpace、Dogpile 等,不同元搜索引擎所采用的對搜索結(jié)果的排列依據(jù)也各有特色。

除以上三類搜索引擎外,還有以下幾種搜索引擎類型:集合式搜索引擎、門戶搜索引擎、免費鏈接目錄等,篇幅有限就不在此贅述了,感興趣的朋友可以自行深入了解。

提升搜索效率的小技巧

01 選擇合適的搜索引擎

不同的搜索引擎對同一關(guān)鍵詞得到的搜索結(jié)果大為不同,也就造成了使用不同搜索引擎時帶來的搜索效率的高低之分。一般而言,對于不同搜索引擎,目前廣受認可的搜索效率與準確性排序為:谷歌 > 微軟必應(yīng) > 百度 > 其他一眾搜索引擎。

當然,正如「白菜蘿卜各有所愛」,對于搜索引擎的排序也沒有絕對的標準答案,不同用戶可依據(jù)各自的使用習慣和內(nèi)容偏好選擇適合自己的搜索引擎,所謂的搜索引擎「鄙視鏈」也不過是一句玩笑話。

只是,本著希望幫助到大家的初衷,我還是想依據(jù)個人體驗向大家提一些小小的建議:能用谷歌就用谷歌,用不了谷歌微軟必應(yīng)也是一個不錯的選擇,下面的內(nèi)容里我也將以微軟必應(yīng)為使用主體介紹一些搜索技巧。

注意:以下搜索技巧在谷歌、微軟必應(yīng)、百度等主流搜索引擎中均可使用。

02 關(guān)鍵詞 + 特定符號

其實我們大多數(shù)人都在或多或少使用一些搜索技巧,其中是所有最為廣泛的便是「關(guān)鍵詞搜索」,即用關(guān)鍵詞替代一整句話進行搜索,以獲得我們想要的信息。比如,你想查北京今天的天氣情況,只要搜索「北京 天氣」就行,而不用搜索「北京今天天氣怎么樣」。

而特定符號,則可以讓搜索引擎「讀懂」我們的話,常用的符號有下面這些:

「+」:查找包含前面帶「+」號的所有關(guān)鍵詞的網(wǎng)頁。例如,想要搜索少數(shù)派中關(guān)于 RSS 內(nèi)容,則可以使用「少數(shù)派 +RSS」,搜索結(jié)果會返回所有包含 RSS 關(guān)鍵詞并與少數(shù)派相關(guān)的網(wǎng)頁。注意:「+」號后面最好緊接著關(guān)鍵詞,中間盡量不出現(xiàn)空格。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「""」:在短語中查找完全匹配的字詞。如果你在搜索框中輸入這樣一段話:「微軟必應(yīng)中有哪些高級搜索技巧」,搜索引擎會將這段話自動拆分為若干個關(guān)鍵詞進行匹配。但是,如果我就是想要完全匹配輸入的內(nèi)容該如何是好呢?答案是使用「""」將想搜索的內(nèi)容框起來,即「" 你吃飯了嗎 "」。

此外,我在進行試驗的時候發(fā)現(xiàn),如果是用中文的「""」,微軟必應(yīng)依舊將輸入內(nèi)容切分為關(guān)鍵詞進行搜索,但如果使用英文中的「""」, 微軟必應(yīng)才會將輸入內(nèi)容視為一個不可分割的整體進行搜索,然后告訴我沒有我想要的內(nèi)容……

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「AND 或 &」:查找包含所有關(guān)鍵詞的網(wǎng)頁。其實我們?nèi)粘K阉鲿r在不同關(guān)鍵詞中間敲的「空格」鍵就發(fā)揮著上述作用。也就是說,當你用「空格」或「AND」或「&」連接一系列關(guān)鍵詞時,搜索引擎會盡可能返回包含所有關(guān)鍵詞的網(wǎng)頁內(nèi)容。一般情況下,這個技巧都用不上,因為搜索引擎已經(jīng)十分貼心地將「空格」設(shè)置為了此功能。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「NOT 或 -」:排除包含某個關(guān)鍵詞的網(wǎng)頁。當你不希望搜索結(jié)果中包含某個特定關(guān)鍵詞時,「NOT 或 -」便派上了用場。你只需要在你希望排除的關(guān)鍵詞前加上「-」,搜索引擎將會返回給你不包含這個關(guān)鍵詞的網(wǎng)頁內(nèi)容。例如,你不想看到關(guān)于少數(shù)派的搜索內(nèi)容中看見 RSS 的影子,那你只需要輸入「少數(shù)派 -RSS」,即可得到已排除 RSS 后你想要的答案。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「OR 或 |」:查找包含某個關(guān)鍵詞的網(wǎng)頁。「OR 或 |」與「AND 或 &」的不同是,前者希望根據(jù)多個關(guān)鍵詞中的任意一個進行搜索,而后者希望搜索結(jié)果中盡量包括所有多個輸入的關(guān)鍵詞。例如,輸入「少數(shù)派 OR RSS」后,搜索引擎將返回給你包括「少數(shù)派」或包括「RSS」的網(wǎng)頁內(nèi)容。

「 ( ) 」:查找或排除包含一組關(guān)鍵詞的網(wǎng)頁。當我希望搜索結(jié)果中包含或排除一大串關(guān)鍵詞時,難道要都加上「+」或「-」嗎?當然不用,「 ( ) 」可以幫助你解決這一困境,你只需要將你想要的關(guān)鍵詞用「 ( ) 」括起來,然后再前面加上你想要的符號,便可實現(xiàn)上述效果。因此,「 ( ) 」通常其他技巧搭配使用,從而讓你的搜索效率更高一點點。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

對了,微軟的官方文檔中還給出了以下注意事項:

NOT 和 OR 都必須大寫,否則搜索引擎將選擇忽略以加速全文搜索;

只有輸入的前 10 個關(guān)鍵詞可用于獲取搜索結(jié)果;

以上符號根據(jù)以下順序確定優(yōu)先級:「()」「""」「- 或 +」「&」「|」;

由于「OR」是優(yōu)先級最低的運算符,當其與其他運算符連用時,請為「OR」加上引號。

03 使用特定關(guān)鍵字

與使用特定符號對搜索內(nèi)容進行限定相同,微軟必應(yīng)還提供了若干個關(guān)鍵字用于更加強大的搜索定制過程。這些關(guān)鍵字與符號的主要區(qū)別在于,符號更多是向你提供輸入關(guān)鍵詞進行搜索時對關(guān)鍵詞的組合,而關(guān)鍵字則針對網(wǎng)頁內(nèi)容的某一具體特征進行限制。

看到這里或許你也不太明白是什么意思,我相信接下來的內(nèi)容可以解答你的困惑。以下是對各關(guān)鍵字作用的解讀與效果展示。注意:以下關(guān)鍵字的冒號后不需要加入空格。

「contains:」:確保搜索結(jié)果鎖定到帶有指定文件類型鏈接的網(wǎng)頁。例如,如果你想搜索包含 pdf 格式電子書的網(wǎng)站,你可以輸入「book contains:pdf」, 搜索引擎將返回給你所有包含 pdf 格式電子書的網(wǎng)站。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「ext:」:僅返回帶有指定文件擴展名的網(wǎng)頁。例如,如果你想搜索 pdf 格式的文檔,可以在輸入關(guān)鍵詞后輸入「ext:pdf」,搜索引擎將返回給你包含 pdf 格式該文檔的網(wǎng)頁。但是我在實測過程中發(fā)現(xiàn),這一技巧在微軟必應(yīng)中似乎并不好用,而在谷歌中支持度要更高一些,不過希望在微軟必應(yīng)中使用此技巧的朋友也不用擔心,下面要講的「filetype:」關(guān)鍵字同樣可以達到較好的效果。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

在 Google 中使用「ext:」

「filetype:」:僅返回以指定文件類型創(chuàng)建的網(wǎng)頁。與「ext:」不同的是,使用「filetype:」關(guān)鍵字將得到特定文檔鏈接,而非包含該文檔的網(wǎng)頁,提升了某些搜索過程的搜索效率。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「inanchor: 或 inbody: 或 intitle:」:這些關(guān)鍵字分別返回元數(shù)據(jù)包含指定術(shù)語(如站點的錨點、正文或標題)的網(wǎng)頁。每個關(guān)鍵字只能指定一個術(shù)語,可以根據(jù)需要串聯(lián)多個關(guān)鍵字條目。網(wǎng)頁中的錨點屬于超鏈接的一種,只不過我們?nèi)粘=佑|到的超鏈接可能更多是指向特定關(guān)鍵詞,用于跳轉(zhuǎn)頁面至其他關(guān)鍵詞的解釋網(wǎng)頁中;而錨點則是網(wǎng)頁內(nèi)部的超鏈接,在網(wǎng)頁中標記具體位置后,在特定位置設(shè)置錨點快速跳轉(zhuǎn)至該位置。例如,「回到頂部」按鈕就是可以快速跳轉(zhuǎn)至網(wǎng)頁最頂部位置的錨點。言歸正傳,當你希望指定網(wǎng)頁內(nèi)部特定元素時,可以使用上述三個關(guān)鍵字進行搜索限制。

「ip:」:查找指定 IP 地址托管的網(wǎng)站。IP 地址必須由點分隔為四部分。例如,想查詢 180.149.132.47 IP 地址下托管的網(wǎng)頁,只需輸入「ip:180.149.132.47」即可。

「language:」:返回指定語言的網(wǎng)頁,在「language:」關(guān)鍵字之后指定語言代碼。例如,輸入「RSS language:cn」以搜索語言為中文的 RSS 相關(guān)信息網(wǎng)頁。必應(yīng)提供了可使用的語言代碼列表:

https://help.bing.microsoft.com/#apex/bing/zh-CHS/10004/-1

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「loc: 或 location:」:返回來自指定國家或地區(qū)的網(wǎng)頁。可直接在「loc:」之后指定國家或地區(qū)代碼(代碼列表見前文語言代碼列表)。若要同時指定多個國家或地區(qū),可使用「OR」來組織語言。例如,想要搜索來自美國或英國有關(guān) RSS 的網(wǎng)頁,輸入「RSS ( loc:US OR loc:GB ) 」。

「prefer:」:為搜索關(guān)鍵詞添加重點,以幫助鎖定搜索結(jié)果。例如,若要查詢籃球的相關(guān)網(wǎng)頁,但搜索內(nèi)容主要限定在洛杉磯湖人球隊方面,可以輸入「basketball prefer:Los Angeles Lakers」。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「site:」:返回屬于指定站點的網(wǎng)頁,若要關(guān)注兩個或多個域,可以用「OR」來組織域。例如,要在少數(shù)派網(wǎng)站上查找關(guān)于 RSS 的網(wǎng)頁,可以輸入「RSS site:sspai.com」進行搜索。

在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧

「feed:」:查找輸入關(guān)鍵詞的 RSS 或 Atom 源。沒錯,微軟必應(yīng)甚至針對 RSS 源的查找定義了特殊的關(guān)鍵字用于搜索,可見 RSS 地位之重要。如果你想搜索有關(guān)籃球的 RSS 源,只需輸入「feed:basketball」。對于 RSS 用戶來說可以極大提升尋找心儀 RSS 源的搜索效率。

「hasfeed:」:在互聯(lián)網(wǎng)上查找包含有關(guān)搜索關(guān)鍵詞的 RSS 或 Atom 源的網(wǎng)頁。同樣也是一個用于搜索有關(guān)內(nèi)容 RSS 源的關(guān)鍵字。例如,如果你想搜索少數(shù)派中包含 RSS 源的網(wǎng)頁,可以輸入「site:sspai.com hasfeed:basketball」。

「url:」:檢查列出的域或網(wǎng)址是否在必應(yīng)的索引內(nèi)。由搜索引擎的基本原理我們可以得知,搜索引擎會將互聯(lián)網(wǎng)上爬取到的網(wǎng)頁按特定策略組織起來,建立索引數(shù)據(jù)庫。該關(guān)鍵字的作用便是幫助我們查詢某一網(wǎng)站是否被微軟必應(yīng)收錄進了索引數(shù)據(jù)庫中。例如,如果你想要驗證少數(shù)派是否在微軟必應(yīng)的索引數(shù)據(jù)庫中,可以輸入「url:sspai.com」進行查詢。

注:以上關(guān)鍵字用法均來自于微軟必應(yīng)官方文檔,其中介紹的某些特性和功能可能會因地區(qū)不同而無法使用,請根據(jù)實際情況取用。

寫在最后

以上內(nèi)容僅僅是使用搜索引擎進行內(nèi)容搜索過程中可能可以用于提升效率的一些小技巧,關(guān)于「搜索」本身則有更多實用技巧供我們發(fā)現(xiàn)與選擇,例如,在特定網(wǎng)站搜集想要的數(shù)據(jù),找一些功能強大的網(wǎng)站尋找各種資源,還可以用合適的上網(wǎng)方式擴大互聯(lián)網(wǎng)搜索范圍等。

「搜索」的世界很大,其本身就有許多技巧與方法供我們探索發(fā)現(xiàn),歡迎大家在評論區(qū)積極留言,向大家分享自己在多年搜索信息過程中總結(jié)的奇技淫巧。

原文地址:http://www.myzaker.com/article/62ea0d1f8e9f09103547dde0

版權(quán)聲明:虛像 發(fā)表于 2022年8月3日 pm2:12。
轉(zhuǎn)載請注明:在網(wǎng)上高效搜索的「秘密」,我想推薦這 3 個小技巧 | 快導(dǎo)航網(wǎng)

相關(guān)文章

主站蜘蛛池模板: 庆元县| 伊宁县| 南和县| 玉山县| 天峨县| 彝良县| 河东区| 武宁县| 曲沃县| 建平县| 宽城| 西和县| 察哈| 拜城县| 焦作市| 射阳县| 博罗县| 玉溪市| 鹰潭市| 宜春市| 蒙自县| 元阳县| 兴海县| 邵阳县| 沙坪坝区| 吉首市| 炎陵县| 河西区| 正镶白旗| 马龙县| 临邑县| 合江县| 桐庐县| 婺源县| 浪卡子县| 霍林郭勒市| 吉木萨尔县| 巴楚县| 黑龙江省| 盐城市| 息烽县|