新疆喜乐彩开奖基本走势
惠州網絡公司

SEO網頁質量間接測度指標

發布日期:2017-03-13 作者: 點擊:

青青電商網站權重研究系列文章之四:網頁質量間接測度指標。網頁質量、網站權重在SEO眼里是優化的基礎,一個缺乏基礎的網站,很難得到搜索引擎的重視。如何提升用戶以及搜索引擎對一個網站的評價,是重要的優化目標。相關系列文章:


1.網頁質量


2.結合網頁質量分析的搜索模式


3.網頁質量直接測度指標


1.基于網頁名譽度的評價指標


部分搜索引擎技術研究人員利用網頁所在網站的名譽度(reputation)來評價網頁質量。從概念上看,名譽度是指一種有助于別人判斷是否可以投資或者保護的重要個人資產。在一定程度上,可以將其看成質量的期望(expectation 0f quality)。因為具有較高名譽度的客體通常有助于提升別人與其進行交流的可能。一個網站的名譽度類似于一個組織或者個人的名譽度。它需要相應主體真實的先期展示,并通過在提供諸如排名等服務的第三方組織評價中得以表達。即便是人們無法知道這個網站的名譽度,也會在看到網站的一瞬間,通過對其可視化內容的大致掃描,對其名譽度做出自己的判斷,以決定離開還是繼續瀏覽。也有的搜索引擎技術研究人員從多維分析的角度,給出了網頁名譽度多維測度方法以間接測量網頁的質量,這些多維指標包含可信度(trust)、權威性(authority)、內容相關性(aboutness)、再次訪問的可能性(revisit)、可推薦程度(recommend)、可等級化(ranked)。


2.基于網站權威性的評價指標


有的搜索引擎技術研究人員聲稱網站的權威性(authority)在一定程度上直接影響著網站內容的質量,這種權威性來自于兩個方面:一個是專業能力;另一個是可信度。除此以外,有很多評價網絡信息的服務站點通常會強調網站內容的名譽度,具體指標包括相關度(relevance)、信息可靠性(reliability)、權威性(authority)、內容質量(quality of content)、可用性(usability)和客觀性(objectivity)等。近年來,諸如全球信息基礎設施裁定組織(Global Information Infrastruc.ture Award)等一些機構的排名服務也開始涉足網站質量的評價,包括對作者資質等情況的評價。


3.基于用戶相關度反饋信息的評價指標


搜索過程主要由用戶發出查詢開始,檢查返回的命中結果,并選擇其中的一部分內容做進一步的瀏覽,這既可以通過當前檢索結果頁面上的鏈接來進行,也可以通過在打開的命中網頁中繼續點擊瀏覽。這些在搜索時選中并瀏覽的網頁序列構成了用戶檢索點擊流,它可以作為測量用戶相關度反饋的信息源,被稱為用戶相關度反饋信息。從定義上看,相關度反饋主要是指檢索用戶可以向檢索系統提供自己是否更喜歡某網頁的過程,從而間接反映查詢的相關度。它不僅可以改善當前用戶的搜索體驗,還可以提高所有檢索用戶的搜索質量。例如,可以提升被訪問次數最多的網頁權重等,而且也可以作為相關網頁質量的評價指標。


信息檢索系統收集用戶相關度反饋信息的方式主要有兩種:一種是顯式的方法,它要求用戶在檢索時主動地對和查詢相關的文檔做標記,這種方式雖然效果明顯,但是會增加用戶使用負擔,一般的用戶很難愿意配合這種信息收集行為;另一種是隱式的方法,它一般無需用戶主動提交,通過探測用戶行為,并以此來間接評價結果文檔的相關度。它建立在一個假設基礎之上,那就是用戶在檢索時會持續地進行隱式的結果相關性判斷。從理論上看,利用隱式方法得到的信息并不十分準確,從被觀察的檢索活動到相關度的判斷過程都有可能存在潛在的誤差,這顯然會導致將更多的不相關文檔標記為相關文檔。但是,隱式方式也具有顯式方法不可比擬的優點,如不增大用戶使用負擔。事實上,由于需要用戶主動提交,顯式方法所收集的信息相當有限。相比之下,利用隱式方法收集而來的信息更多,也更為詳細,而且即便是存在誤差,只要收集到足夠多的數據樣本,通過一些數據分析方法就可以很好地去除那些噪聲數據。


研究者已經提出了很多可以用于隱式收集相關度反饋信息的途徑,如在搜索結果文檔列表中點擊選擇某些文檔的行為、在網頁文本中的翻滾行為對網頁做書簽的行為、打印網頁的行為和瀏覽網頁所花費的時間。其中,有些指標也存在一定的爭議。例如,有的搜索引擎技術研究人員就認為,瀏覽每個網頁所花費的時間并不能有效代表用戶對這個網頁相關度的認可程度;甚至有些搜索引擎技術研究人員認為,瀏覽網頁所花費的時間根本就是一個不可靠的相關度反饋測量指標,主要原因在于存在一些和相關度沒有關系的因素于擾,如任務本身、文檔集合特點和檢索環境等都會影響瀏覽時間。



其他搜索引擎技術研究人員也提出了綜合的方法來改善隱式方法的分析效果如同時考慮瀏覽時間、是否打印網頁和保存網頁、翻滾網頁和保存書簽等用戶行為將能取得更好的效果。還有搜索引擎技術研究人員認為,在非試驗環境下,將用戶在查詢時發出的點擊數與用戶和檢索系統交互的全部時間結合起來,可以有效地揣度用戶對網頁文檔的滿意度。但是,從總體來看,相關試驗的效果并不是十分理想,即便是可行,但是相關數據的收集工作卻較難展開,甚至無法得到較為豐富的數據。因此,點擊流數據就稱為一種較好的隱式分析數據源,它在非試驗環境下易于收集,而且比其他幾種用于隱式收集相關度反饋信息的數據更為準確。它建立在一個假設之上,那就是被點擊的文檔應該比沒有被點擊的文檔更為相關很多搜索引擎技術研究人員在這方面做了研究,如使用點擊數據來訓練檢索算法,按照用戶點擊數量來對檢索結果重排序,也有搜索引擎技術研究人員從被點擊文檔中提取候選詞語來對查詢進行擴展以提高檢索精度。



從理論上看,利用點擊流進行分析是一種協同過濾技術。當利用相關度反饋信息服務所有檢索用戶時,原先檢索用戶認為的相關文檔就會被認為與其他用戶相關。如果這些用戶具有相同的查詢需求,則這種相關度反饋就會提高檢索效果。但是點擊流分析技術和一般的協同過濾技術也存在不同,主要在于一般的協同過濾技術主要是面向那些具有相對穩定興趣的用戶群體,所以便于基于他們先前的興趣來預測可能的興趣,而作為信息檢索用戶,他們每一次鍵入的查詢都可能具有完全不一樣的語義。



在這方面的很多先前研究工作都往往集中于對搜索結果網頁中文檔的點擊情況進行分析,而缺乏對每個用戶整個搜索過程所涉及的全部文檔進行分析。有搜索引擎技術研究人員通過人工評價試驗發現,在搜索過程中產生的所有相關度反饋信息都可以有效地提高進一步查詢的精度和可信度,所以從用戶搜索過程中的全部網頁信息中提煉點擊流數據將是有效提高相關度反饋精準度的方法.


相關標簽:惠州網站建設

最近瀏覽:

在線客服
分享
歡迎給我們留言
請在此輸入留言內容,我們會盡快與您聯系。
姓名
聯系人
電話
座機/手機號碼
新疆喜乐彩开奖基本走势 网上重庆时时彩怎么样? 带你玩重庆时时彩的人 足彩混合投注什么意思 分分彩人工计划精准版 乐和彩官网 必富lg游戏官网 什么软件可以玩三公 重庆快乐十分爱彩乐 pk10怎么看走势图选号 不思议棋牌 金鹰时时彩全天计划 江西时时475 安徽时时选号 双色球基本走势图 今晚双色球开奖号查询 北京pk走势图