商城
網(wǎng)站改版商品推薦行為方案規(guī)劃,當(dāng)我們商城需要改版商品的推薦時,首先基于用戶行為推薦進(jìn)行,基于固定的內(nèi)容無法獲取更加精準(zhǔn)的推薦商品,那么我們可以換個角度來看待這個問題。
網(wǎng)站建設(shè)公司認(rèn)為把基于商品與商品的固定關(guān)系轉(zhuǎn)變成參考人和商品、商品和商品之間的關(guān)系來進(jìn)行推薦策略的構(gòu)建,即基于用戶的行為來判斷商品的關(guān)系。用戶的行為具有復(fù)雜多變的特性,但不代表它沒有規(guī)律可循。常見的基于用戶行為的策略主要分為關(guān)聯(lián)規(guī)則和協(xié)同過濾。
?關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則是指通過收集的每個用戶的一段購買數(shù)據(jù),可以得出買過商品A的所有用戶以及這些用戶同時買了哪些其他商品,然后將這些商品合并就得出了一個同時被購買商品列表的排序?;谏唐妨斜磉M(jìn)行消重、去除低關(guān)聯(lián)商品等,最終實現(xiàn)推薦商品列表輸出。關(guān)聯(lián)規(guī)則的核心策略就是計算關(guān)聯(lián)度。關(guān)聯(lián)度有兩個常用指標(biāo):支持度和置信度。
●支持度(Support):買過商品A、同時買過商品B的人數(shù)/總的人數(shù)。
●置信度(Confidence):買過商品A、同時買過商品B的人數(shù)/買過商品A的人數(shù)。計算公式:關(guān)聯(lián)度=Support×Confidence。下面我們舉一個例子,看一下算法是如何運行的。Alice購買了商品item1,這個時候我們想計算item5是否應(yīng)該推薦。根據(jù)公式,我們來計算一下支持度和置信度。支持度Support=2/4,置信度Confidence=2/2,需要說明的是,計算時要除去Alice本人。這樣我們可以得到Support=0.5,Confidence=1,因此item5對于item1的關(guān)聯(lián)度就是0.5×1=0.5,

見表3-2。
從上面的例子我們可以看到,通過關(guān)聯(lián)度可以發(fā)現(xiàn)人們最常用的購買組合是哪些。這對于一些品類單一的商品結(jié)構(gòu)是非常適用的,策略的邏輯本身并不復(fù)雜,對技術(shù)的要求也不會特別高。但從計算量上來看,它需要對所有的商品進(jìn)行遍歷計算才能獲取所有的指標(biāo),這對于離線的數(shù)據(jù)挖掘成本來說過大了。
?協(xié)同過濾顯而易見,將關(guān)聯(lián)規(guī)則作為主要的算法是有些不合適的,我們需要尋找一個效率更高、成本更低的算法來作為主要的推薦算法,協(xié)同過濾就是目前主流的推薦算法。協(xié)同過濾的主要原理是運用群體的協(xié)同智慧,旨在通過一個群體的喜好判斷來確定單體的特征和情況。
網(wǎng)站建設(shè)公司提醒這個群體既可以是用戶群體,也可以是商品群體。協(xié)同過濾有幾個基本的假設(shè):
●用戶會對物品給出評價(隱性或顯性);
●用戶偏好一定時間內(nèi)不會發(fā)生變化。協(xié)同過濾的處理主要包括兩個部分:評測和群體搜索。我們來看一下協(xié)同過濾的處理流程,

如圖3-19所示。
獲取所有的用戶信息,用戶信息包括用戶自行填寫的內(nèi)容、評價和消費記錄等信息。對于新用戶,可以通過冷啟動的方式獲取數(shù)據(jù)。同時要對用戶的數(shù)據(jù)進(jìn)行一些基本的預(yù)處理,主要的預(yù)處理為降噪和歸一化。降噪主要是剔除一些異常數(shù)據(jù),比如用戶的誤操作、未支付訂單等;而歸一化的目的是保證推薦結(jié)果在進(jìn)行推薦計算的時候不會受到極值的影響而出現(xiàn)過大偏差。比如,訂單的數(shù)量就遠(yuǎn)大于收藏的數(shù)量,需要將這樣的信息通過處理變?yōu)橐粋€相對合理的區(qū)間范圍,一般會將歸一化的數(shù)據(jù)分布變?yōu)椋?,1]區(qū)間。常用的歸一化方法有很多,比如對數(shù)歸一、指數(shù)歸一等。歸一化的概念和地圖的比例尺有些相似,其目的是在保證相對關(guān)系的情況下,將所有樣本縮放到一定范圍內(nèi),以便進(jìn)行計算。數(shù)據(jù)處理完畢后,推薦系統(tǒng)就會根據(jù)信息對用戶或商品進(jìn)行評估打分。
這里面主要是基于已知的用戶或者商品集合的信息,判斷與當(dāng)前用戶或商品的相似度。推薦算法基于不同的相似度得到每個集合的分值,根據(jù)計算的分值判斷與當(dāng)前用戶或商品的鄰近群體。通過將鄰近群體和當(dāng)前商品或用戶進(jìn)行比對,完成推薦結(jié)果的輸出。相似度的計算也是推薦算法的核心,相似度主要是指當(dāng)前群體和已知群體之間的鄰近程度。鄰近算法也是隨著技術(shù)發(fā)展逐步發(fā)展起來的,這里我們以KNN算法為例來看一下鄰近算法的原理。KNN(全稱K-NearestNeighbor,K-鄰近算法)意思是K個最近的鄰居,指的是每個樣本都可以用它最接近的K個鄰居來代表。該策略的思路是通過指定一個數(shù)量范圍K,判斷最相似的K個商品具備的共有特征,則認(rèn)為查詢的商品或用戶本身也具有這個特征。簡單地說,就是認(rèn)為你跟你附近K個最近的群體具有相同特征。

如圖3-20所示,首先我們將所有的樣本數(shù)據(jù)與當(dāng)前需要比對的樣本進(jìn)行距離測算,根據(jù)測算距離生成一個由近及遠(yuǎn)的列表。所有樣本比對完畢后,從當(dāng)前列表中選取K個樣本并判斷當(dāng)前樣本中多數(shù)項的屬性特征,將該屬性特征賦予被比對的商品,完成推薦結(jié)果輸出。我們通過圖3-16來看一下鄰近算法的運行原理。當(dāng)范圍K選取的是值C1時,我們認(rèn)為當(dāng)前比對樣本的特征應(yīng)該是圓形,因為在范圍內(nèi)圓形占多數(shù)項;而當(dāng)我們把范圍K的值調(diào)整為C2時,我們發(fā)現(xiàn)比對樣的特征變?yōu)榱苏叫?,因此KNN的鄰近算法會因為K的選取范圍而使結(jié)果產(chǎn)生巨大變化。圖3-20雖然目前的主流協(xié)同過濾還是使用計算相似度來進(jìn)行推薦,但策略上已經(jīng)發(fā)生了變化。協(xié)同過濾按維度分為基于用戶維度和基于商品維度?;谟脩艟S度(User-Based:RowSimilarity)是指以用戶為參照物來判斷和當(dāng)前用戶相似的用戶群體的喜好,從而向當(dāng)前用戶推薦相似用戶群體喜好且當(dāng)前用戶未曾購買的商品。如果我們把用戶和商品的關(guān)系列為一個矩陣,則按用戶維度來看,它也可以看做是行相似性。

從表3-3中可以看到,用戶A購買時,通過查詢比對,發(fā)現(xiàn)用戶A和用戶C是相似群體,因此根據(jù)用戶C的特征推薦商品D給用戶A。
深圳網(wǎng)站建設(shè)公司本文關(guān)于“網(wǎng)站改版商品推薦行為方案規(guī)劃”經(jīng)驗就分享到這里,謝謝關(guān)注,博納網(wǎng)絡(luò)編輯整理。