亚洲综合网伊人中文|亚洲一区二区无码动漫|成年性午夜免费视频网站不卡|色爱区综合激情五月综合色


詳細信息
當前位置: 首頁(yè)> 詳細信息
我們是怎么掉進(jìn)個(gè)性推薦的怪圈?
專(zhuān)欄:行業(yè)資訊
發(fā)布日期:2020-03-16
閱讀量:1991
作者:小科

你剛在微信和朋友討論AJ款式,看公眾號就刷到了AJ的廣告,淘寶首頁(yè)也驚喜般地出現了AJ推薦;晚上刷抖音總是刷個(gè)不停,感覺(jué)刷到的每一個(gè)視頻都有某個(gè)點(diǎn)能戳中自己,你陷入尋找刺激的循環(huán)。

為什這些APP都知道你在想要什么且清楚你的興奮點(diǎn),是他們監控你的聊天記錄?

不,是你的個(gè)人基礎信息和行為數據告訴了他們你需要這些,他們就把你的需要主動(dòng)給到你罷了。

那他們是怎么做到的呢?下面我們就來(lái)簡(jiǎn)單探討下個(gè)性推薦。這里是文章的結構圖,圖和文章可以對照看,方便理解。

首先,個(gè)性推薦系統是為了解決信息過(guò)載,通過(guò)個(gè)性化推薦提高信息分發(fā)的效率和準確性,使得用戶(hù)更有粘性而被廣泛使用的系統。通俗的說(shuō)他就是為了讓你更爽,你要什么我就給你什么。

這很美好,但這里有一個(gè)陷阱,意思是你不要什么我就少點(diǎn)給你或者不給你——你也就失去了與你意見(jiàn)相左的知識領(lǐng)域接觸的機會(huì ),單一的內容被推薦多了用戶(hù)也會(huì )感到疲勞。

個(gè)性推薦用在電商領(lǐng)域來(lái)說(shuō)應該叫“精準投放”——你想買(mǎi)什么淘寶就推薦給你什么,這像是雙贏(yíng)的感覺(jué)。

但對于內容領(lǐng)域(短視頻等)來(lái)說(shuō),只推薦你有興趣的內容,刺激你興奮點(diǎn)的同時(shí)也讓你接觸世界的邊界越來(lái)越窄,沉浸于自己營(yíng)造的狹小的世界;難道我們進(jìn)入這種回音室的怪圈之后就無(wú)法破解了嗎?

(回音室效應:一些意見(jiàn)相近的聲音不斷重復,令身處其中的多數人認為這些聲音就是事實(shí)的全部。)我們先不急著(zhù)解答,待我們逐步探討下個(gè)性推薦的內容后,自己就能解答以上的問(wèn)題;

獨立因素推薦

獨立因素推薦,就是推薦系統基于單個(gè)因素篩選的內容或商品推送給用戶(hù);我們在了解獨立因素推薦的同時(shí)也了解下推薦的兩種模式被動(dòng)推薦和主動(dòng)推薦;

被動(dòng)推薦

推薦是用戶(hù)被動(dòng)的接收信息,需要用戶(hù)去觸發(fā)而產(chǎn)生的推薦結果。

例如淘寶上用戶(hù)依據價(jià)格區間的獨立因素篩選商品,這種行為完全依據用戶(hù)有意識的自主操作告訴淘寶我需要特定獨立因素的商品,淘寶后臺會(huì )依據你的輸入信息進(jìn)而對前端的你進(jìn)行反饋。

假如用戶(hù)不是選一個(gè)因素而是同時(shí)選擇價(jià)了格區間+發(fā)貨地區+品牌這三個(gè)獨立因素時(shí),這時(shí)后臺進(jìn)行篩選,把同時(shí)具備這幾個(gè)獨立因素的商品推薦給用戶(hù),這只是多個(gè)獨立因素的簡(jiǎn)單物理標簽相的加可以說(shuō)還是屬于獨立因素推薦的范疇。(當然淘寶真實(shí)推薦結果更為復雜,因為有商品競價(jià)排名,這些都會(huì )影響推薦的結果,目前是舉例說(shuō)明)

與之類(lèi)似的還有網(wǎng)易云音樂(lè )的歌單廣場(chǎng),歌單廣場(chǎng)將歌單分為了流行、民謠、電子等不同的類(lèi)別,每一個(gè)類(lèi)別就是一個(gè)因素,用戶(hù)選擇哪個(gè)因素的標簽,后臺系統就更新屬于該因素的歌單的數據給到前端界面上展示,這類(lèi)都是獨立因素的被動(dòng)推薦。

主動(dòng)推薦
主動(dòng)推薦,由系統定時(shí)更新數據并主動(dòng)推薦到用戶(hù)面前,用戶(hù)打開(kāi)界面就能接觸到主動(dòng)推薦的結果;如網(wǎng)易云音樂(lè )的熱歌榜,抖音的人氣熱搜榜等就是主動(dòng)推薦的方式。

但這種熱榜這種統一推薦的方式有一定程度的成馬太效應——火的內容會(huì )得到更多的曝光越來(lái)越火,但大部分人喜歡的內容并不帶代表每一個(gè)用戶(hù)都是喜愛(ài)的,熱門(mén)推薦滿(mǎn)足用戶(hù)從眾心理的同時(shí)也忽略了用戶(hù)的個(gè)性差異體驗,所以就需要依據用戶(hù)個(gè)性的推薦來(lái)彌補,隨著(zhù)用戶(hù)對自我獨特性的感知越來(lái)越強,需要個(gè)性化定制的需求也越來(lái)越明顯。如何讓特定的內容滿(mǎn)足特定的用戶(hù),讓用戶(hù)開(kāi)開(kāi)心心的走進(jìn)個(gè)性推薦的陷阱里就是接下來(lái)我們要講的重點(diǎn)。

融合因素推薦
融合因素推薦就是將幾個(gè)不同的因素依據特定算法融合而產(chǎn)生新的屬性標簽,并推薦到與該屬性標簽匹配的用戶(hù)手機上。我們把融合因素推薦分為基于內容本身屬性推薦、基于內容屬性與用戶(hù)屬性協(xié)同推薦、基于相似用戶(hù)協(xié)同推薦這三種推薦方式。

基于內容本身屬性推薦(推薦對象一般是所有人)
還是以抖音熱門(mén)短視頻為例,我們需要做的是依據內容的本身屬性建立內容畫(huà)像,用數據模型來(lái)表示內容的特征。

由抖音熱搜榜可看到,我們把點(diǎn)贊數排名在前30的視頻放上熱搜榜。

當然決定點(diǎn)贊數的因素除了視頻內容本身的類(lèi)型及質(zhì)量外,很大的關(guān)鍵還在于平臺給多少人推薦了這個(gè)視頻,即有多少人可以刷到了這個(gè)視頻。平臺判斷一個(gè)視頻是否值得推薦給更多的用戶(hù)群體,又與歷史用戶(hù)對視頻的交互行為息息相關(guān)。

例如:

短視頻平臺將一個(gè)審核過(guò)后的新視頻先推薦給10w人的基礎用戶(hù)池進(jìn)行播放展示,如果這10w人有很多人進(jìn)行完全播放、點(diǎn)贊、評論、轉發(fā)等操作,平臺就判斷該視頻為優(yōu)質(zhì)內容進(jìn)而推薦給100w、1000w的用戶(hù)池如此類(lèi)推。

如果該視頻在10w的展示量中大部分用戶(hù)對該視頻不感冒,很少播放完或點(diǎn)贊,就會(huì )減少該視頻的展示量或不會(huì )再推薦給更多的用戶(hù)。

這形成一個(gè)優(yōu)質(zhì)內容能得到更多展示劣質(zhì)內容減少展示的良性循環(huán)。(用戶(hù)池也分不同種類(lèi)的用戶(hù)池,舉例用非真實(shí)數據)

這樣判斷一個(gè)視頻能否進(jìn)入到下一個(gè)用戶(hù)池的標準就成為了關(guān)鍵,現實(shí)中這個(gè)標準是根據模型動(dòng)態(tài)變化的,現在我們先進(jìn)行標準的性靜態(tài)分析這樣便于理解;根據下面初級的算法公式可看到一個(gè)視頻的優(yōu)質(zhì)程度與用戶(hù)對這個(gè)視頻的喜愛(ài)程度成正比,我們先用用戶(hù)的喜愛(ài)程度這個(gè)特性來(lái)反應視頻的優(yōu)質(zhì)程度。

視頻優(yōu)質(zhì)度=用戶(hù)喜愛(ài)度 X 視頻質(zhì)量基數 X 題材類(lèi)別基數 X 平臺廣告基數

影響用戶(hù)喜愛(ài)程度的獨立因素有用戶(hù)對視頻的平均播放時(shí)長(cháng)、點(diǎn)贊、評論、分享、關(guān)注以及不感興趣等操作,每一個(gè)操作都會(huì )為一個(gè)獨立因素增加數值;而且每個(gè)獨立因素對與平臺判斷用戶(hù)對視頻的喜愛(ài)程度的重要性是不同的,如,分享>評論>點(diǎn)贊。我們用權重來(lái)表示,對喜愛(ài)度高的因素進(jìn)行數據加權,數據加權一般有兩種常用方式;

自定義加權
產(chǎn)品經(jīng)理、運營(yíng)經(jīng)理依據平時(shí)的數據報表人為的定義這些獨立因素和設置權重因子的數值,這種方式比較直接也比較簡(jiǎn)單,但他局限于團隊的自身經(jīng)驗,沒(méi)有經(jīng)過(guò)大數據的驗證與現實(shí)還是有較大的偏差。

數據建模

數據建模簡(jiǎn)單的說(shuō)就是將時(shí)間變量、獨立因素、權重因子通過(guò)特定的算法公式進(jìn)行計算得出該視頻的一個(gè)優(yōu)質(zhì)度數值。根據這個(gè)數值進(jìn)行推薦和排名,隨著(zhù)時(shí)間變量的改變,獨立因子、甚至是權重因子也會(huì )依據一定的函數關(guān)系進(jìn)行改變,整個(gè)模型的輸入和輸出都是動(dòng)態(tài)變化的,而且我們不斷的采集用戶(hù)行為數據用來(lái)訓練模型使其更加接近現實(shí)預測的數值。

基于以上信息我們就可以粗劣的得出一張反映用戶(hù)對視頻喜愛(ài)程度的參考表,該表也可以反映出視頻的優(yōu)質(zhì)程度;

用戶(hù)喜愛(ài)度=(播放時(shí)長(cháng)量+點(diǎn)贊量+評論量+分享量 – 不感興趣量+…)X 權重因子 X 衰減因子

(正常情況下,需要對各個(gè)指標做線(xiàn)性方程回歸分析,確定各個(gè)指標具有獨立性后,再做權重分析,以上面表格是非真實(shí)數據)

根據以上思路我們可以對視頻進(jìn)行優(yōu)質(zhì)程度和類(lèi)型的評定,有了內容畫(huà)像現在只需找到對這個(gè)視頻內容感興趣的用戶(hù)把視頻推送給他就行了,下面就是我們要說(shuō)到的基于內容屬性與用戶(hù)屬性的協(xié)同的推薦。

基于內容屬性與用戶(hù)屬性協(xié)同推薦(推薦給特定屬性的人)
我們通過(guò)采集一個(gè)人的基礎信息和行為數據來(lái)對一個(gè)用戶(hù)做定性分析,得出一個(gè)用戶(hù)在互聯(lián)網(wǎng)及現實(shí)中的各種特征,所有特征整合在一起就成為一個(gè)代表現實(shí)中用戶(hù)的虛擬畫(huà)像。

構建用戶(hù)畫(huà)像數據會(huì )用到靜態(tài)和動(dòng)態(tài)兩類(lèi)數據:

1.靜態(tài)用戶(hù)畫(huà)像數據
我們在注冊APP時(shí)通常會(huì )輸入姓名、年齡、性別、允許獲取位置、這些基礎信息相對穩定。

2.動(dòng)態(tài)用戶(hù)畫(huà)像數據
用戶(hù)在平時(shí)生活對手機產(chǎn)生的操作行為,如你玩過(guò)的游戲、關(guān)注的公眾號、消費記錄,有沒(méi)有房貸車(chē)貸發(fā)過(guò)紅包買(mǎi)過(guò)保險,這些行為最后都會(huì )變成幾千個(gè)事實(shí)標簽,用這些事實(shí)標簽構建模型計算用戶(hù)的行為偏好。

(圖片來(lái)源于回形針PaperClip)

還是用上面提到的用戶(hù)對視頻的喜愛(ài)度的情況為例。

當用戶(hù)刷抖音看到一個(gè)標簽為美女類(lèi)的視頻點(diǎn)了一個(gè)贊,并不意為者該用戶(hù)就喜歡看美女可能是不小心點(diǎn)的,這就需要更多的行為來(lái)判斷該用戶(hù)對美女類(lèi)視頻的喜愛(ài)程度;根據前面提到的初級公式:

對美女的喜愛(ài)權重=(播放時(shí)長(cháng)量+點(diǎn)贊量+評論量+分享量 – 不感興趣量+…)X 權重因子 X 衰減因子

除了點(diǎn)贊、評論、分享,關(guān)注了某作者這些行為外還有一個(gè)時(shí)間的限定,短期行為無(wú)法代表長(cháng)期興趣,單次行為的權重會(huì )隨著(zhù)時(shí)間流逝不斷衰減,用戶(hù)每次打開(kāi)美女類(lèi)內容都會(huì )生成一個(gè)興趣權重,把一段時(shí)間內你所有的美女類(lèi)興趣權重進(jìn)行累加,再用S型函數標準化就能得到一個(gè)0-10區間的興趣值,標簽值數值越高,就代表用戶(hù)對美女就越感興趣程度。

到了這里平臺已可以計算出用戶(hù)對某一類(lèi)視頻的喜愛(ài)程度和厭惡程度,同時(shí)也對視頻做了分類(lèi)處理,可直接根據用戶(hù)的偏好將視頻推薦給用戶(hù)。

平臺除了可以計算出用戶(hù)在內容興趣上面的權重外還可以在消費能力、社交偏好等方向進(jìn)行建模計算,進(jìn)而得出一個(gè)交為完整的用戶(hù)畫(huà)像。

另外通過(guò)行為直接推薦視頻的效果往往不如通過(guò)同類(lèi)視頻推薦,找到和你一樣的人,把他們的瀏覽記錄推薦給你,往往比直接猜你喜歡什么效果更好!

基于相似用戶(hù)協(xié)同推薦(人以群分)

如何找到和你一樣的人

根據以上思路,我們在用戶(hù)的美女喜愛(ài)偏好權重、社交偏好權重、消費能力權重等多個(gè)維度建立模型,計算用戶(hù)的偏好,之后將這些偏好反映的權重值轉化為特征向量!

如,我們把用戶(hù)對美女的喜愛(ài)權重為8,社交偏好權重為5,消費能力權重為2,將向量理解成多維空間上的一個(gè)坐標,通過(guò)把每個(gè)用戶(hù)的向量坐標代入余弦公式和距離公式中,就能計算出和你相似的人,進(jìn)而把用戶(hù)分類(lèi)。

(這里用到的是鄰近技術(shù):利用用戶(hù)的歷史喜好信息計算用戶(hù)之間的距離空間中的點(diǎn)越近越相似。)


這樣廣告主或平臺就可以依據與你相似群體的消費記錄和喜愛(ài)偏好給你推薦商品或視頻,這也恰巧就是你喜歡的類(lèi)型。

需要說(shuō)明的是,微信淘寶們采集的行為數據不僅僅對應你的賬號,更與你的手機唯一識別碼綁定在一起,這意味著(zhù)你就算不注冊不登陸,你的行為數據一樣會(huì )被采集。同時(shí)廣告平臺也可以根據你的手機識別碼在其他APP上為你投放廣告,這樣你在刷抖音的時(shí)候也能看到淘寶的AJ廣告了!

總的來(lái)說(shuō),你的一切上網(wǎng)行為都會(huì )在手機上留下操作的痕跡(基礎信息和行為數據)。平臺采集到這些歷史痕跡進(jìn)行數據清洗——結構化數據——建模分析,計算出你的行為偏好,根據你的偏好或同類(lèi)人的偏好向你推薦商品和內容。

這也就是為什么你剛在微信和朋友討論AJ款式,刷公眾號就刷到了AJ的廣告,淘寶首頁(yè)也驚喜般的出現了AJ推薦;晚上刷抖音總是刷個(gè)不停,感覺(jué)刷到的每一個(gè)視頻都有某個(gè)點(diǎn)能戳中自己;

那么陷入回音室的怪圈又是怎么回事呢?(回音室怪圈:只推薦你有興趣的內容,讓你接觸世界的邊界越來(lái)越窄,沉浸于自己營(yíng)造的狹小的世界)

回音室怪圈的陷阱是我們自己挖的
由個(gè)以上個(gè)性化推薦機制的流程可知,你現在的行為數據將決定你將來(lái)會(huì )接收到什么樣的內容,從這個(gè)角度看個(gè)性化推薦的結果完全取決于你自己本身的傾向。

如果你刷抖音時(shí)能包容那些和你意見(jiàn)不同的人,能耐心看完或評論互動(dòng),那么根據個(gè)性推薦的機制,你的內容信息流中既有自己喜歡的內容也會(huì )有自我認知之外的內容,不用擔心個(gè)性化推薦會(huì )把你留在回音室里面。

相反,如果你只接受那些你認同的意見(jiàn)或人,不能包容異己,將與自己觀(guān)點(diǎn)不對等的內容拉黑處理,長(cháng)此以往你的信息流里就會(huì )只剩下你喜歡的內容,沉浸在自己打造的回音室里。

個(gè)性推薦只是依據你的習慣做出的推薦結果,讓你掉進(jìn)回音室怪圈里的還是你自己。


上一頁(yè):價(jià)格歧視:不“理性”的人與可預測的非理性
下一頁(yè):科技的未來(lái)會(huì )讓人面臨什么?

本文由今科科技用戶(hù)上傳并發(fā)布,今科科技僅提供信息發(fā)布平臺。文章代表作者個(gè)人觀(guān)點(diǎn),不代表今科科技立場(chǎng)。未經(jīng)作者許可,不得轉載,有涉嫌抄襲的內容,請通過(guò) 反饋中心 進(jìn)行舉報。


售前咨詢(xún):0760-2332 0168  
售后客服:400  830  7686



1998~2024,今科26年專(zhuān)注于企業(yè)信息化服務(wù)

立 即 注 冊 / 咨 詢(xún)
上 線(xiàn) 您 的 網(wǎng) 站 !