在推薦搜索系統(tǒng)中,我們常??梢砸姷街嘏拍K,那么你知道重排模塊的作用是什么嗎?在本篇文章里,作者就介紹了重排模塊的作用,以及常見的重排策略,一起來看看吧,或許會對想了解搜索推薦系統(tǒng)的你有所幫助。
(資料圖片僅供參考)
很多人在最開始了解搜索推薦系統(tǒng)時,不明白為什么還需要單獨設(shè)立一個重排模塊,重排模塊和精排模塊能不能進行合并。本篇我們就詳細介紹一下重排模塊的作用以及常見的重排策略。
一、推薦系統(tǒng)常見架構(gòu)
我們先介紹一下目前行業(yè)里先進的推薦系統(tǒng)架構(gòu)是什么樣的,分別介紹各個功能模塊的定位。
上圖是目前工業(yè)界常見的推薦系統(tǒng)架構(gòu),整體系統(tǒng)鏈路上至少分為以下5層:
召回層:從億級別的物料中初篩出用戶感興趣的物料,輸出的物料在萬級別,大幅降低物料量級,減少后續(xù)系統(tǒng)中的性能壓力。一般都是多路召回架構(gòu),接近20路的召回策略。 粗排層:針對召回層返回的物料,預(yù)估召回點擊率再進行排序,篩選出千級別的物料。 過濾層:基于一些硬規(guī)則過濾掉最后不能在前端露出的物料,比如內(nèi)容領(lǐng)域命中了黑詞、電商領(lǐng)域無庫存的商品等。過濾層也可以放在粗排層之前。 精排層:將過濾層返回的所有物料進行CTR預(yù)估,然后按照Pctr進行排序,輸出百級別的物料給到下一層。 重排層:重排層會基于全局最優(yōu)和相關(guān)業(yè)務(wù)規(guī)則等對于精排返回的物料順序進行再次調(diào)整,一般都只是微調(diào)。最終一次請求中返回在百級別以內(nèi)的物料給到前端。每一個模塊都有自己的定位,早期的推薦系統(tǒng)就只有一個最簡單的排序模塊,發(fā)展到現(xiàn)在推薦系統(tǒng)架構(gòu)已經(jīng)非常精細化,不同模塊各司其職。
二、重排模塊的定位
在搜推系統(tǒng)的眾多模塊中,重排模塊主要實現(xiàn)以下三個目標:全局最優(yōu) + 流量調(diào)控 + 用戶體驗。
1. 全局最優(yōu)
精排實現(xiàn)的是單點最優(yōu),但是用戶實際在瀏覽推薦信息流時是連續(xù)瀏覽多個商品。不同商品之間的排列組合將影響用戶整體的點擊率。
就如同人穿搭衣服一樣,精排模塊的視角,是單點為用戶選擇最好看的上衣、褲子和鞋子。
而重排模塊是站在整體視角,為用戶選擇既好看然后風格又匹配的最優(yōu)的上衣、褲子和鞋子的組合,所以重排模塊最終需要在精排的排序基礎(chǔ)上,按照用戶的瀏覽行為為其挑選出最優(yōu)的一組商品或者內(nèi)容組合。
2. 流量調(diào)控
重排模塊是對物料的最后一道排序環(huán)節(jié),很多時候業(yè)務(wù)的特殊流量訴求都是在重排模塊進行干預(yù)。比如電商場景中對于新品的扶持,淘寶當年做直播生態(tài)時對于直播內(nèi)容進行加權(quán)。這些特殊的流量訴求需要干預(yù)整體排序時,最好的實現(xiàn)方式都是在重排模塊進行干預(yù)。
3. 用戶體驗
精排和重排整體的排序邏輯還是基于模型預(yù)估的CTR,但是有時候完全按照CTR大小來進行排序的內(nèi)容會比較極端,比如連續(xù)多坑都是同一種類型的商品或者內(nèi)容,導致用戶審美疲勞,這種就是線上的問題案例,解決這類case都需要在重排模塊做一些頻控策略。
電商推薦里需要針對同三級類目、同品牌、同封面圖的商品進行打散,內(nèi)容推薦場景里需要針對同類型、同封面圖、同作者的內(nèi)容進行打散。打散可以有效防止用戶審美疲勞化,同時有利于探索和捕捉用戶的潛在興趣,對用戶體驗和長期目標都很關(guān)鍵。
三、常見的重排策略
針對上述介紹的三大類目標,我們分別介紹實現(xiàn)三大類目標常用的策略。
1. 全局最優(yōu)-List Wise策略
List Wise本身不是一個具體的算法或者模型,只是一個模型的優(yōu)化目標或者是損失函數(shù)的定義方式,List Wise關(guān)注整個列表中物料之間的順序關(guān)系,需要結(jié)合上下文的信息。List Wise整個策略分為兩個步驟:
1)序列生成
第一步是序列生成。假設(shè)用戶在瀏覽淘寶APP首頁”猜你喜歡“時,平均每次瀏覽4個商品,那么我們設(shè)定每個序列的長度為4。序列生成模型基于精排模型返回的商品數(shù)量進行排列組合。假設(shè)單次請求中精排模型返回12個商品,那么序列生成模型理論上可以生成:
11880種組合,這個數(shù)字過于龐大了。為了減輕系統(tǒng)的計算負擔和考慮到模型的耗時影響,實際工作中我們不可能窮舉所有的序列類型,一般情況下我們還是會從精排模型中排序靠前的候選集中進行挑選,然后再設(shè)置一些策略性的篩選條件去大幅降低序列的候選集。假設(shè)我們就從精排返回排名前6的商品中,進行序列生成:
360組合。我們基于這360種組合再進行效果評估。
2)序列評估
第二步就是對生成的序列候選集進行效果預(yù)估,首先需要構(gòu)建一個序列評估模型,目前序列評估模型中常用的算法是RNN(Recurrent Neural Networks,循環(huán)神經(jīng)網(wǎng)絡(luò))。
RNN模型的一大特點是以序列數(shù)據(jù)為輸入, 通過神經(jīng)網(wǎng)絡(luò)內(nèi)部的結(jié)構(gòu)設(shè)計可以有效捕捉序列之間的關(guān)系特征。所以RNN模型非常適合作為序列評估模型來實現(xiàn)List Wise。
首先序列評估模型的輸入是每一個序列以及精排模型預(yù)估的CTR值,模型融合當前商品上下文,也就是排序列表中其它商品的特征,來從列表整體評估效果。序列評估模型最終是針對單個序列里的每一個商品輸出一個對應(yīng)的預(yù)估CTR,然后將每個序列里各個商品的CTR在一起加權(quán)最終得到一個綜合的CTR分數(shù)進行排序。
如上圖所示,將四個相同長度的不同序列輸入到評估模型中,模型針對序列中的每個商品重新給出新的Pctr,然后將單個序列里的Pctr進行相加得到綜合分數(shù),最終取得分最高的序列返回給到前端,如上圖所示得分最高的為序列3。
需要注意的是序列評估模型仍然是預(yù)估CTR,只是此時的CTR預(yù)估是結(jié)合了上下文信息,而不是像精排模型那樣僅是單點的CTR預(yù)估。不過序列預(yù)估模型也是對精排模型的Pctr進行微調(diào),不會大幅調(diào)整精排模型輸出的Pctr。
2. 流量調(diào)控—動態(tài)調(diào)權(quán)
流量調(diào)控的策略實現(xiàn)方式一般就一種,直接在重排層上針對需要獲得更多曝光的內(nèi)容比如新品、新內(nèi)容等進行相應(yīng)權(quán)重的調(diào)整,原本預(yù)估的CTR再乘以更高的系數(shù)分比如1.2,使其得分更高。加權(quán)可以快速讓某一類型物料得到更多曝光。
有時候也可以在召回模塊進行調(diào)整,比如針對某一類物料單獨設(shè)計一路召回策略,提升召回側(cè)的供給。但是畢竟召回側(cè)離最終展現(xiàn)還需要經(jīng)歷很多個模塊,無法確保最終一定可以展現(xiàn)以及展現(xiàn)量,所以一般都是召回和重排層同時做策略。
但是加權(quán)策略不能一直在整個流量分發(fā)機制中存在,當實現(xiàn)了業(yè)務(wù)目標后,我們需要重新審視線上的各種加權(quán)策略,然后下線一些加權(quán)策略,不然長久會破壞系統(tǒng)整體的生態(tài)。
3. 用戶體驗—滑窗打散策略
用戶體驗里我們主要介紹滑窗打散策略。目前市場上主流的打散策略都是基于硬規(guī)則的打散,也有基于用戶個性化興趣的打散方式,但是還是容易出Bad Case。
下面我們以電商同三級類目商品打散來進行舉例,假設(shè)平臺要求連續(xù)4坑同一三級類目商品最多只能有2個,連續(xù)8坑同一三級類目商品最多只能有4個。針對這類打散我們一般使用滑動窗口法。
如上圖所示,我們構(gòu)建兩個窗口,一個長度為4,一個長度為8,每個圓圈代表一個商品,不同類目的商品用不同顏色來表示。
兩個窗口全部從第一個商品開始往后移動,首先判斷窗口1和窗口2里的商品是否符合規(guī)則要求,如果符合則繼續(xù)滑動窗口,經(jīng)過第一次移動后我們可以看到窗口1里面商品的類目分布已經(jīng)不符合規(guī)則要求,按照順序?qū)⒑竺娣弦蟮纳唐吠耙苿舆M行替換。
按照上述流程一直進行窗口滑動,對位于窗口內(nèi)不符合要求的商品進行順序調(diào)換。
滑動窗口法容易出現(xiàn)末尾扎堆的情況,因為一直在用后續(xù)的物料去滿足前序的規(guī)則,將不滿足規(guī)則的物料進行后移,最終可能會導致末尾物料的順序無法調(diào)整,因為已經(jīng)沒有后續(xù)候補物料可供調(diào)整了。
上述就是對于搜索推薦系統(tǒng)中重排模塊的整體介紹,重排模塊以其獨特的定位為搜索推薦系統(tǒng)的精細化運作發(fā)揮重要作用。
本文由 @King James 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
責任編輯:
標簽:
而重排模塊是站在整體視角,為用戶選擇既好看然后風格又匹配的最優(yōu)的上
日前,由蜀道集團所屬蜀道新制式軌道集團投資、四川路橋路航公司承建的
1、明日方舟劍的意義如下:2、鋒利的刀刃是指出方舟和鷹角的狂熱愛好者
近期京東白條怎么關(guān)閉京東白條怎么關(guān)閉問題在網(wǎng)上得到了很多的關(guān)注,相
湖南日報7月2日訊(全媒體記者李永亮通訊員張燦強)7月1日,新型CR200J
7月3日6時日照市氣象臺發(fā)布大霧黃色預(yù)警信號日照市氣象臺2023年07月03
1、小區(qū)綠化保護是物業(yè)管理的首要任務(wù),包括宣傳、報道等方式提高居民
1、點彩紅細胞計數(shù)是在某些重金屬中毒的情況下。2、使胞漿中殘存的RNA
U19男籃世界杯:中國末節(jié)崩盤遭逆轉(zhuǎn)獲第十仍創(chuàng)十年最佳成績,追分,內(nèi)線,
1、給一句很簡單的職場名言。2、永遠不要因為工作不好而辭職,除非你能
7月2日,第三屆中國—非洲經(jīng)貿(mào)博覽會在湖南長沙落下帷幕。其間,各...
7月2日電,中科江南公布半年度業(yè)績預(yù)告,盈利9200萬元-11000萬元,比上
日是什么意思,是日意思是什么很多人還不知道,現(xiàn)在讓我們一起來看看吧
恒瑞醫(yī)藥7月2日公告,近日,公司子公司天津恒瑞醫(yī)藥有限公司收到國家藥
7月1日,記者發(fā)現(xiàn),北京廣告協(xié)會明星代言規(guī)范委員會,發(fā)表了以《關(guān)于對
眾所周知,每隔幾年安卓的Logo都會迎來升級,比如目前大家熟悉的Androi
內(nèi)娛真的不能沒有甜妹!譚松韻第二、沈月第三,田曦薇第四,第一是她魯
小米11Ultra的手機重量為234g,這樣的機身重量拿在手里可謂是非常的有
2023年暑運1日正式開啟。從7月1日至8月31日,為期62天的時間里,交通運
IT之家7月2日消息,據(jù)紅魔外設(shè)發(fā)布微博,紅魔新款電競平板電腦將內(nèi)置10
今天邊肖為大家?guī)砣瞧炫炇謾C和港版三星note2的最新價格介紹和詳細
1、啟示和啟事的區(qū)別主要有以下三點:表現(xiàn)形態(tài)不同。2、“啟事”是...
1、北方有佳人,絕世而獨立壚邊人似月,皓腕凝霜雪屆笑春桃兮。2、云堆
hello大家好,我是城鄉(xiāng)經(jīng)濟網(wǎng)小晟來為大家解答以上問題,高速路是否免
1、1立方的公式=厚度x寬度x長度1立方米的公式=厚度(多少米)x寬度(
來為大家解答以下的問題,了么騎手兼職好做么,餓了么騎手兼職這個很多
1、《好一朵美麗的茉莉花》電子琴簡譜:《好一朵美麗的茉莉花》早在上
兩面錦旗點贊學府園區(qū)貼心優(yōu)質(zhì)服務(wù)“感謝學府園區(qū)在項目推進過程中...
穆雷攜草地10連勝收獲了2個ATP挑戰(zhàn)者賽的冠軍獎杯。前世界No 1+2屆溫網(wǎng)
民族要復興,鄉(xiāng)村必振興。2018年3月8日,習近平總書記參加十三屆全國人
廣告
X 關(guān)閉
廣告
X 關(guān)閉