協(xié)作過(guò)濾推薦算法的稀疏性問(wèn)題研究
海南大學(xué) 孫龍菲
論文主要工作如下:第一,闡述了推薦技術(shù)的相關(guān)知識(shí)及國(guó)內(nèi)外研究與應(yīng)用現(xiàn)狀,對(duì)協(xié)作過(guò)濾推薦算法及其所面臨的問(wèn)題進(jìn)行了研究分析,并從算法思想和算法性能兩個(gè)方面對(duì)現(xiàn)有改進(jìn)的協(xié)作過(guò)濾推薦算法解決稀疏性問(wèn)題進(jìn)行了深入分析。第二,結(jié)合當(dāng)前大數(shù)據(jù)環(huán)境下的數(shù)據(jù)冗余、動(dòng)態(tài)變化等特點(diǎn),以改善稀疏的數(shù)據(jù)集為目標(biāo),通過(guò)分析用戶瀏覽信息來(lái)優(yōu)化稀疏數(shù)據(jù)集。從各個(gè)領(lǐng)域追蹤每個(gè)IP地址獲取與用戶相關(guān)的客觀評(píng)分來(lái)填充數(shù)據(jù)集,從而減小候選近鄰數(shù)據(jù)集的稀疏度。第三,在既定的數(shù)據(jù)稀疏環(huán)境下,提高算法精度也可提高系統(tǒng)推薦質(zhì)量。可以從兩個(gè)方面改進(jìn):一方面綜合多種因素,通過(guò)分析不同特征的用戶對(duì)項(xiàng)目的各種屬性的興趣度,綜合已評(píng)項(xiàng)目的屬性評(píng)分值預(yù)測(cè)沒有被評(píng)分的項(xiàng)目,提高項(xiàng)目相似度計(jì)算的準(zhǔn)確性;另一方面考慮到用戶對(duì)項(xiàng)目評(píng)分的差異性問(wèn)題,提出一種針對(duì)目標(biāo)項(xiàng)目選擇近鄰的協(xié)作過(guò)濾推薦算法,基于項(xiàng)目類型評(píng)分建立初步的近鄰用戶集,在此基礎(chǔ)上針對(duì)每個(gè)目標(biāo)項(xiàng)目構(gòu)建用戶的精確近鄰,結(jié)合衍生的擴(kuò)展鄰居,有效地改善了服務(wù)質(zhì)量。最后,基于屬性論,提出一種基于項(xiàng)目屬性的協(xié)作過(guò)濾推薦算法,在數(shù)據(jù)集中對(duì)項(xiàng)目及其屬性研究分析,劃分出項(xiàng)目的屬性并計(jì)算屬性權(quán)重,利用基于屬性的重心剖分模型結(jié)合項(xiàng)目的屬性權(quán)重計(jì)算項(xiàng)目之間的相似度。實(shí)驗(yàn)表明,優(yōu)化的算法對(duì)于數(shù)據(jù)集稀疏所導(dǎo)致的問(wèn)題有所改善,提高了推薦精度。
協(xié)作過(guò)濾推薦算法的稀疏性問(wèn)題研究
