歡迎來到 常識詞典網 , 一個專業的常識知識學習網站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
只說搜索質量,召回率,索引量和相應速度是技術指標,在此不討論干這活兒累計兩年半.一年的Google quality rater,一年半淘寶搜索評測.Google的做法:1.單個item與關鍵詞匹配度(相關性)五個等級:vital:官方網站類useful:極其相關,或包含大量相關信息relevant:相關的slig-tly relevant:有點相關,提及的Off-Topic:完全無關附加:spam,-等幾個附件選項,獨立可選,但與以上不沖突網上流傳的那份Google的 < Quality Rater Guidelines > 說的就是這部分.jiang-aiming/seo/google...2.side by side(ranking)黑盒測試,兩組排序對比:同序位不同item的相關性對比同item不同排位對比偏主觀,兩組關系評級分為about t-e same,slig-tly better,better,muc- better.其余還有針對圖片的,-的評測,基本只做相關性評測.PS:還有專門的-評測,不過那個項目的活兒我沒接. :)淘寶的做法:因為是購物搜索,基本只做相關性評測,但也做A/B對比相關性等級基本只分為good,fair,bad.根據不同質量結果在A/B抽樣數據中的占比,評價算法調整的好壞.并根據bad case做進一步調優.side by side測試也做,但投入產出比太小.只在部分特殊項目中嘗試.另外,Ya-oo!是以DCG指標來衡量搜索結果質量baike.baidu/view...答案 2:
借用開復老師的答案:搜索的質量評估通常是看幾個指標:>相關度 -- 請受過訓練的人來評估每個引擎的前幾個結果是否相關,評估時不參考結果的來源、引擎的品牌等。指標有DCG等[1]。
索引規模 -- 每個引擎知道自己的規模,也就是有多少網頁(除去重復的),但是不知道對方的規模,可是可以根據兩方搜索結果的爬取,得知有多少網頁是我有他無,或他有我 無,從此得知大約兩個引擎的索引規模。比較有挑戰的一點是如果索引規模大了可能導致相關度下降(因為有些長尾結果會排序太靠前)。成熟的商業全網搜索引擎索引規模在10billion以上.
速度 -- 就是輸入搜索詞,得到結果的時間。很多測試告訴我們0.2秒的速度會導致用戶滿意度的落差,和未來使用的頻率。
新鮮度 -- 就是能爬到多新的內容,而且要有一定規模(只有新聞內容不算夠新)。
下一篇:上的二維碼掃描軟件掃描效果是否與-頭像素有關? 下一篇 【方向鍵 ( → )下一篇】
上一篇:美國校車一輛的成本是多少?市場價格多少? 上一篇 【方向鍵 ( ← )上一篇】
快搜