歡迎來到 常識詞典網 , 一個專業的常識知識學習網站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
傳統的聚類方法比如k-means對于高維數據的效果是很差的。因為在高維度下距離的度量包含了大量隨機擾動的結果。用PCA(或者LSI)降維以后那些隨機擾動所在的分量都被濾掉了,所以聚類會有提高。總的來說引入很多沒有信息量又帶來噪聲的維度總是會讓聚類變差的。 另外統計工具經過發展之后已經能夠處理高維的聚類問題了,比如LDA或者人工神經網絡一類的方法。答案 2:
同意勞兄的看法,鄙人一點淺顯的看法是在高維空間中任何兩點間的距離都是很遠的,那么即便聚類后作為特征仍然未必很好。而SVD類的工具要有效地多。下一篇:HR 們如何看待應屆生曾獲的獎學金? 下一篇 【方向鍵 ( → )下一篇】
上一篇:1900 年之前有用分數表述地震震級的方法嗎?如果有,是怎樣表述的? 上一篇 【方向鍵 ( ← )上一篇】
快搜