協作過濾推薦算法的稀疏性問題研究
海南大學 孫龍菲
論文主要工作如下:第一,闡述了推薦技術的相關知識及國內外研究與應用現狀,對協作過濾推薦算法及其所面臨的問題進行了研究分析,并從算法思想和算法性能兩個方面對現有改進的協作過濾推薦算法解決稀疏性問題進行了深入分析。第二,結合當前大數據環(huán)境下的數據冗余、動態(tài)變化等特點,以改善稀疏的數據集為目標,通過分析用戶瀏覽信息來優(yōu)化稀疏數據集。從各個領域追蹤每個IP地址獲取與用戶相關的客觀評分來填充數據集,從而減小候選近鄰數據集的稀疏度。第三,在既定的數據稀疏環(huán)境下,提高算法精度也可提高系統推薦質量。可以從兩個方面改進:一方面綜合多種因素,通過分析不同特征的用戶對項目的各種屬性的興趣度,綜合已評項目的屬性評分值預測沒有被評分的項目,提高項目相似度計算的準確性;另一方面考慮到用戶對項目評分的差異性問題,提出一種針對目標項目選擇近鄰的協作過濾推薦算法,基于項目類型評分建立初步的近鄰用戶集,在此基礎上針對每個目標項目構建用戶的精確近鄰,結合衍生的擴展鄰居,有效地改善了服務質量。最后,基于屬性論,提出一種基于項目屬性的協作過濾推薦算法,在數據集中對項目及其屬性研究分析,劃分出項目的屬性并計算屬性權重,利用基于屬性的重心剖分模型結合項目的屬性權重計算項目之間的相似度。實驗表明,優(yōu)化的算法對于數據集稀疏所導致的問題有所改善,提高了推薦精度。
