日韩综合在线观看网站,亚洲天堂在线观看日本,国产亚洲日韩偷拍

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

揭秘微信「看一看」是如何為你推薦的

在過去的幾年里，質(zhì)量控制作為微信看一看推薦的基石，我們在不斷的迭代升級中積累了一定的技術(shù)和經(jīng)驗。本文主要跟大家分享一下總體框架的設(shè)計思路，以及如何通過平臺通用化來解決組合爆炸的問題。文章為了盡可能的給讀者描述一個完整質(zhì)量控制體系的框架，這里既有技術(shù)上，架構(gòu)上考慮，也會有產(chǎn)品上，業(yè)務(wù)上的考慮。

專注于為中小企業(yè)提供成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計服務(wù),電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業(yè)延慶免費做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都，凝聚了一批互聯(lián)網(wǎng)行業(yè)人才，有力地推動了近1000家企業(yè)的穩(wěn)健成長，幫助中小企業(yè)通過網(wǎng)站建設(shè)實現(xiàn)規(guī)模擴充和轉(zhuǎn)變。

一、看一看介紹

1.1 看一看的場景

微信作為國內(nèi)最大用戶群體的應(yīng)用，在人們的生活，工作，學(xué)習(xí)中提供社交功能的同時，還提供了工具，游戲，購物，支付，內(nèi)容，搜索，小程序等服務(wù)?？匆豢醋鳛槲⑿诺闹匾M成部分，在原有公眾平臺資訊閱讀的基礎(chǔ)上，為用戶提供中心化的內(nèi)容消費平臺，旨在提升內(nèi)容發(fā)現(xiàn)效率，優(yōu)化內(nèi)容質(zhì)量，豐富內(nèi)容種類。

1.2 看一看的質(zhì)量控制

與其他很多資訊產(chǎn)品上線初的野蠻生長不一樣，質(zhì)量控制一開始就作為看一看上線標(biāo)準(zhǔn)被提出并進(jìn)行了大量的投入。質(zhì)量控制的必要性是由于多方面的因素決定的。

(內(nèi)在屬性)一個產(chǎn)品的出身和環(huán)境決定了其的調(diào)性，微信內(nèi)在也決定了看一看的調(diào)性。在這里，調(diào)性這個詞更多的是形容內(nèi)容質(zhì)量可以被用戶接受的底線。用戶對微信的期待也提高了這個底線。
(外部壓力)微信的每一次改動都會受到廣泛的關(guān)注，在功能上線初期面臨著比其他應(yīng)用更大的輿論壓力和監(jiān)管壓力。
(黑產(chǎn)對抗)因為用戶多，流量大，強大的經(jīng)濟效益引來黑產(chǎn)的參與，使得內(nèi)容生產(chǎn)的大環(huán)境很差，低質(zhì)量數(shù)據(jù)充斥各個角落;問題也在不斷地的變化，識別控制難度也在持續(xù)加大。

二、總體框架

既然質(zhì)量控制作為推薦系統(tǒng)必不可少的一部分，那么在推薦系統(tǒng)中處質(zhì)量控制處于什么位置，包含哪些子模塊，又是從哪幾方面方面進(jìn)行控制?

首先，我們先看一下內(nèi)容數(shù)據(jù)在推薦系統(tǒng)的一生。

2.1 數(shù)據(jù)的一生

數(shù)據(jù)從內(nèi)容生產(chǎn)方發(fā)表產(chǎn)生，由平臺收集數(shù)據(jù)。這里生產(chǎn)方來自四面八方，生產(chǎn)的內(nèi)容五花八門，質(zhì)量也是參差不齊。所以，平臺將數(shù)據(jù)接入之后第一件事情就是將這些內(nèi)容進(jìn)行格式化和特征提取，方便后面的流程能通用化地處理這些內(nèi)容數(shù)據(jù)。
內(nèi)容經(jīng)過前面的初步處理后，質(zhì)量控制模塊根據(jù)已有的特征對內(nèi)容進(jìn)行過濾，主要是過濾不符合平臺規(guī)則的低質(zhì)量數(shù)據(jù)和提供后面排序需要考慮的質(zhì)量因子。這里面涉及到過濾效率的問題，一般會分為粗過濾還有細(xì)過濾。排序推薦模塊將根據(jù)內(nèi)容特征還有用戶行為對數(shù)據(jù)進(jìn)行排序。
最后，平臺將內(nèi)容推薦給用戶進(jìn)行消費，消費的過程中會與內(nèi)容產(chǎn)生很多交互行為。這些行為數(shù)據(jù)，可以用于平臺的質(zhì)量控制和推薦排序;也可以反饋給生產(chǎn)者，讓生產(chǎn)者能夠了解到內(nèi)容被消費的情況，生產(chǎn)更多符合用戶需求的內(nèi)容。

2.2 多維度控制

數(shù)據(jù)的一生中，我們可以看到平臺都是通過對發(fā)表內(nèi)容本身進(jìn)行檢測來進(jìn)行質(zhì)量控制，這顯然是不夠的。一個控制框架的有效運行不能僅僅在一個地方進(jìn)行監(jiān)控，需要全面，多維度共同作用。我們可以抽象一下平臺，生產(chǎn)，還有用戶。我們會發(fā)現(xiàn)其實除了對平臺自身檢測能力進(jìn)行提升外，

也可以對生產(chǎn)者和用戶進(jìn)行引導(dǎo)，評估。

根據(jù)生產(chǎn)者生產(chǎn)內(nèi)容的質(zhì)量，還有用戶對內(nèi)容的反饋，平臺可以對生產(chǎn)者進(jìn)行分級分類。對不同等級的生產(chǎn)者，使用不同質(zhì)量控制策略，如，高質(zhì)量的賬號頒發(fā)個免檢標(biāo)簽，在質(zhì)量控制的時候避免誤傷。而對于一些已經(jīng)被檢測到有低質(zhì)量內(nèi)容的賬號進(jìn)行一定時間的封禁，減少相似問題的爆發(fā)，增加長尾問題的召回，提升系統(tǒng)的響應(yīng)速度。不同類目也是同樣的道理，比如高危的內(nèi)容類(社會民生，養(yǎng)生健康，娛樂)需要加強控制。
而對于用戶，我們同樣可以根據(jù)一下用戶的基礎(chǔ)數(shù)據(jù)(地域，年齡，性別)和用戶在微信內(nèi)的一下閱讀信息，對用戶進(jìn)行分類。不同用戶可以使用不同的控制策略。這樣在保證了用戶對體驗有不同要求的前提下，盡可能地保證推薦系統(tǒng)的效率。

2.3 輔助模塊

除了上面說的三個部分之外，還有幾個同樣非常重要的質(zhì)量控制輔助模塊，這些模塊對保證整個質(zhì)量控制的正常運行至關(guān)重要。

監(jiān)控系統(tǒng)：監(jiān)控系統(tǒng)需要對平臺，生產(chǎn)，用戶的各個方面進(jìn)行監(jiān)控，有些數(shù)值監(jiān)控指標(biāo)可以通過機器持續(xù)監(jiān)控，而有些數(shù)據(jù)本身的問題則需要人工的輪詢與審核，還有就是新問題的發(fā)現(xiàn)與歸納匯總。其中最重要的是能夠進(jìn)行全方位覆蓋，不同范圍，不同領(lǐng)域，有時候問題可能隱藏的茫茫大盤數(shù)據(jù)中。
干預(yù)系統(tǒng)：干預(yù)系統(tǒng)是對問題出現(xiàn)后，進(jìn)行快速處理的手段。這樣能夠在模型策略迭代較慢的時候暫時壓制問題，減少影響范圍。干預(yù)系統(tǒng)除了生效快之外，還有一個重要的能力是相似內(nèi)容的查找(去重指紋)，如相似標(biāo)題的封禁和相似圖片的封禁。
標(biāo)注系統(tǒng)：標(biāo)注系統(tǒng)作為一個提升樣本收集效率的平臺，不僅能有效提升標(biāo)注人員的標(biāo)注效率，進(jìn)而有效提升模型的迭代效率;而且標(biāo)注系統(tǒng)方便對問題的收集，總結(jié)，歸納，形成各個領(lǐng)域的知識庫。

三、數(shù)據(jù)與質(zhì)量

前面介紹了質(zhì)量控制的必要性，也介紹了質(zhì)量控制的大體框架。那么到底數(shù)據(jù)是指哪些數(shù)據(jù)?所謂的質(zhì)量又指的是哪些質(zhì)量指標(biāo)?這些數(shù)據(jù)跟這些質(zhì)量指標(biāo)帶給我們什么問題與挑戰(zhàn)呢?

3.1 內(nèi)容數(shù)據(jù)源

看一看的數(shù)據(jù)從來源上分包括公眾平臺，騰訊新聞，騰訊視頻，企鵝號，微視，快手等。從內(nèi)容形式上分有文章，新聞，視頻，圖片等。樣式豐富的數(shù)據(jù)在滿足不同用戶的內(nèi)容需求的同時也加大了監(jiān)管的難度。

3.2 質(zhì)量指標(biāo)

同時，看一看以用戶的體驗為出發(fā)點結(jié)合具體業(yè)務(wù)需要建立了一套質(zhì)量指標(biāo)體系。這里指標(biāo)隨著業(yè)務(wù)的發(fā)展不斷在增加，含義也在不斷的豐富。多維度的指標(biāo)可以為業(yè)務(wù)的質(zhì)量過濾和推薦排序提供更多的個性化的選擇。

3.3 問題與挑戰(zhàn)

那么，我們的問題和挑戰(zhàn)是什么呢?我們先來看一下日常工作中經(jīng)常遇到的一些對話。事情的本質(zhì)往往隱藏在復(fù)雜的表面下。

豐富的數(shù)據(jù)源，多維度的質(zhì)量指標(biāo)，個性化的業(yè)務(wù)場景帶來的其實是組合爆炸問題。如果對每一種組合都單獨處理，不僅導(dǎo)致大量人力的浪費;同時，也無法對速度要求高的質(zhì)量控制問題進(jìn)行快速響應(yīng)。毫無疑問從體系上進(jìn)行通用化，模板化，可復(fù)用，可遷移是我們解決問題的方向。下一節(jié)，我們會從一個普通任務(wù)的迭代周期出發(fā)，分析上面對話對應(yīng)的迭代過程的那一部分，并對相應(yīng)的部分進(jìn)行相應(yīng)的通用化。

四、體系演進(jìn)

4.1 規(guī)則，特征，樣本，模型

下圖展示了一個迭代周期里面幾個關(guān)鍵的過程。

1.規(guī)則制定：規(guī)則制定可以說是質(zhì)量問題解決中最重要的工作，問題分析清楚了，解法也就出來了。這里簡單列幾個小原則，不進(jìn)行展開。

主要組成：需要對問題進(jìn)行全面的分析，包括場景數(shù)據(jù)是什么，問題有多少子類型，問題比例有多大，影響范圍有多廣，業(yè)界是否也有同樣的問題，做法是什么。
基于需求：這個階段更應(yīng)該從需求出發(fā)進(jìn)行問題的分解，盡量減少技術(shù)性的考慮。很多時候人會往往會混淆“需要做”和“怎么做”。因為覺得這個東西難做，或者不能做而將這個東西認(rèn)為不需要做。
基于數(shù)據(jù)：規(guī)則的制訂需要結(jié)合數(shù)據(jù)進(jìn)行討論，不能幾個人憑主觀想法就定下規(guī)則。數(shù)據(jù)往往會提供很多我們意想不到的沖突情況。
衡量標(biāo)準(zhǔn)：規(guī)則必須能在人與人之間傳遞。

2.特征提取：這里涉及如何將業(yè)務(wù)需求轉(zhuǎn)化為技術(shù)需求。根據(jù)問題分析的結(jié)論，對直接特征進(jìn)行提取，如標(biāo)題，正文，封面圖，隱藏內(nèi)容，頁面結(jié)構(gòu)，跳轉(zhuǎn)鏈接，錨文本，賬號，統(tǒng)計特征等。

3.樣本收集：根據(jù)需要從原始數(shù)據(jù)中收集一定量的正負(fù)樣本，這些樣本可以通過相似樣本挖掘，也可以通過人工標(biāo)注。

4. 模型訓(xùn)練：使用模型對提取的特征進(jìn)行組合，并對收集的樣本分布進(jìn)行擬合。

特征組合：模型將問題需要考慮的特征進(jìn)行組合。有些問題只需要考慮標(biāo)題(標(biāo)題黨)，有些問題需要考慮文章標(biāo)題的匹配程度(文不對題)，有些問題需要同時考慮文本與圖片的結(jié)合(低俗色情);有些問題只需要考慮主題詞(廣告)，有些問題需要考慮上下文語境(假新聞)。
數(shù)據(jù)分布：模型會盡可能貼合樣本數(shù)據(jù)的分布，降低 Loss。有些數(shù)據(jù)源問題比例高，有些數(shù)據(jù)源問題比例低。切換數(shù)據(jù)源的時候，如果樣本分布與目標(biāo)數(shù)據(jù)源的分布不一致，效果往往有較大的差異。

4.2 通用化

看完上一小節(jié)的描述，不知道大家有沒有把對話跟迭代周期的過程對應(yīng)起來。接下來嘗試對迭代周期里面的各個部分進(jìn)行通用化，包括細(xì)粒度化，共享特征，樣本增強，模型復(fù)用，模型遷移。

1.細(xì)粒度化：在進(jìn)行規(guī)則制定階段，要避免指定一個很大的質(zhì)量問題進(jìn)行優(yōu)化，盡量把問題定義成“獨立”，“明確”，“與業(yè)務(wù)無關(guān)”的細(xì)粒度問題。這樣可以減少后面因為業(yè)務(wù)變化導(dǎo)致的不確定監(jiān)督問題，提升模型適用性。舉個例子：我們之前有個質(zhì)量問題是黑四類(廣告，活動，通知，招聘)，標(biāo)注的時候沒有區(qū)分，訓(xùn)練的時候也是用一個模型。這樣在有新的業(yè)務(wù)出現(xiàn)的時候突然發(fā)現(xiàn)我們不需要黑四類，而是黑三類。還有其他一些不建議的問題類型："標(biāo)題不規(guī)范"，"正文質(zhì)量差"，"內(nèi)容不優(yōu)質(zhì)"。

2.共享特征：雖然不同數(shù)據(jù)源的樣式不一樣，這樣需要對不同的數(shù)據(jù)源通過頁面解析進(jìn)行特征抽取，統(tǒng)計。但是對于同一個數(shù)據(jù)源，不同的質(zhì)量問題，往往會用到很多相同的特征。一個數(shù)據(jù)源抽取后的結(jié)果可以保存在結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)中方便各個質(zhì)量模型，還有其他的業(yè)務(wù)模型使用。如文本的位置，是否有鏈接，是否隱藏，是否模板內(nèi)容等。

3.樣本增強：通過相似樣本挖掘和人工標(biāo)注容易導(dǎo)致過擬合，標(biāo)注效率低的問題。這里可以結(jié)合數(shù)據(jù)增強提升模型的魯棒性，結(jié)合主動學(xué)習(xí)提升標(biāo)注效率。

4.3 模型復(fù)用

在處理不同的質(zhì)量問題的時候，我們發(fā)現(xiàn)有些問題用到的特征，擬合的方法都是相似的。像越來越多平臺算法庫對基礎(chǔ)模型提供支持一樣，通過從具體問題中抽象問題，構(gòu)建通用模型框架可以有效提高我們的工作效率。而構(gòu)建通用模型框架需要結(jié)合的前面提到的共享特征在設(shè)計之初就其保證通用性，適配性，可擴展性。

4.3.1 通用模型

4.3.2 廣告模型

這里介紹一下廣告識別模型在構(gòu)建過程中，涉及的幾個通用問題模型。廣告模型主要是負(fù)責(zé)識別文章里面的廣告內(nèi)容。從內(nèi)容上，分為文字廣告，圖片廣告，圖文廣告。從位置上分頂部廣告，中間廣告，底部廣告。從篇幅上分主體廣告，插播廣告。那么這里可以抽象成 3 個通用的問題：

1.問題內(nèi)容的定位(插播廣告);2. 多類型特征的融合(圖文廣告);3.文章結(jié)構(gòu)的序列化(頂部，中部，尾部，篇幅)。

問題內(nèi)容的定位：這類問題與圖像中的物體檢測相似，都是需要識別相應(yīng)目標(biāo)及其對應(yīng)的位置。據(jù)此，我們提供一個全新的用于文本問題檢測的框架 TADL。通過滑動窗口的檢測方法將大段文本切分成多個小片段，并對每個小片段進(jìn)行廣告概率打分和反推定位，從而在一個模型框架內(nèi)同時實現(xiàn)了廣告文字的識別和定位，并且只需要文章級別的標(biāo)注就能完成訓(xùn)練。

多類型特征的融合：圖片廣告定義廣泛，廣告的程度需要同時考慮多種類型的特征(文本大小，文本位置，文本語義，圖片場景，圖片內(nèi)容)。相對于端到端的需要大規(guī)模標(biāo)注的深度模型，對問題進(jìn)行分而治之的 wide&deep 模型框架具有更好的解釋性，更高的召回。

文章結(jié)構(gòu)的序列化：一篇文章是否有廣告問題，需要對整篇文章中多模態(tài)廣告的占比，位置進(jìn)行綜合考慮。將不同廣告文章中的文本廣告概率和圖片廣告概率進(jìn)行序列化的可視化展示，發(fā)現(xiàn)通過對有限的序列模式進(jìn)行識別檢測可以用來解決多模態(tài)文章分類問題。模型通過 Multi-CNN 檢測異?！巴黄稹?，通過 BiLSTM 檢測概率變化趨勢。

4.4 模型遷移

數(shù)據(jù)源之間的數(shù)據(jù)分布一定是會存在差異的。模型遷移主要是想要解決數(shù)據(jù)分布不一致的問題。這里我們以色情低俗識別為例子，分“詞向量”和“特征分布”兩個方面來考慮遷移問題。

4.4.1 詞向量統(tǒng)一

詞向量在不同的場景中會表現(xiàn)不一樣的語義，如“下面”在圖文和視頻標(biāo)題里面就有不同的語義。多數(shù)據(jù)源數(shù)據(jù)訓(xùn)練的詞向量因為獲得了更多的信息量要好于多個數(shù)據(jù)源單獨訓(xùn)練的向量。到后來基于更大量訓(xùn)練集的 bert 的出現(xiàn)更是極大的豐富了詞向量的信息量。

4.4.2 特征空間統(tǒng)一

這里面的方法主要有 finetune，多任務(wù)學(xué)習(xí)，還有對抗學(xué)習(xí)。

Finetune 的目的是使用已有模型的特征提取能力，然后目標(biāo)數(shù)據(jù)源進(jìn)行組合調(diào)整達(dá)到較好的效果。這個模型在源領(lǐng)域數(shù)據(jù)標(biāo)注量要比較大，模型框架能夠表示足夠多的共同特征時比較有效，如 bert。

多任務(wù)學(xué)習(xí)通過不同任務(wù)間建立共享層，學(xué)習(xí)不同 domain 之間的共享知識，進(jìn)而實現(xiàn)雙贏。缺點是需要大量的目標(biāo)領(lǐng)域的有標(biāo)數(shù)據(jù)。

對抗學(xué)習(xí)充分利用了大量的無標(biāo)數(shù)據(jù)消除一些鄰域間分布不同的差異。

五、持續(xù)對抗

5.1 動態(tài)數(shù)據(jù)

前面所提到的多樣化的問題，更多的是平臺內(nèi)部因為業(yè)務(wù)需求主動引入更多的數(shù)據(jù)和質(zhì)量指標(biāo)導(dǎo)致。這些問題相對來說是靜態(tài)的。在業(yè)務(wù)上線之前，平臺會進(jìn)行摸底優(yōu)化，不會有太多的意外。

接下來我們討論數(shù)據(jù)動態(tài)變化的問題。在日常的內(nèi)容生產(chǎn)過程中，內(nèi)容生產(chǎn)者根據(jù)平臺的環(huán)境和用戶的反饋不斷修改內(nèi)容的樣式，類目。這些變化會改變數(shù)據(jù)的分布，從而導(dǎo)致平臺對新數(shù)據(jù)出現(xiàn)漏召或者誤判。其中，黑產(chǎn)的持續(xù)不斷的有意對抗最為頻繁，花樣最多，也是我們最為關(guān)注的。這些對抗具有形式類目多，迭代周期多的特征。

形式類目多：問題數(shù)據(jù)類型不斷變化演進(jìn)，從文本，圖片，視頻一直到鏈接。類目上也是在多個高危類目上來回切換，不斷創(chuàng)新。

迭代周期短：某個特殊的色情標(biāo)題黨樣式，在某一時間短獲得不錯的曝光后，黑產(chǎn)立即進(jìn)行了大規(guī)模的投產(chǎn)，而在受到打壓后又迅速的轉(zhuǎn)向其他類型的 case。

5.2 解決體系

由于敵暗我明，完全杜絕幾乎是不可能的。原則上是提高黑產(chǎn)的作弊成本，降低平臺的維護(hù)成本。我們還是從前面提到質(zhì)量控制體系的三部分入手。

平臺：每天都有少量的標(biāo)注人工對線上數(shù)據(jù)進(jìn)行輪詢，對有問題的數(shù)據(jù)進(jìn)行屏蔽收集。

用戶：對大量用戶反饋有問題的數(shù)據(jù)進(jìn)行限制。

生產(chǎn)：

黑名單：對歷史上劣跡斑斑的賬號進(jìn)行封禁，同時，對跟這些賬號關(guān)聯(lián)緊密的賬號進(jìn)行挖掘封禁。
沙盒機制：對新注冊的，發(fā)文較少，未被平臺驗證的賬號，限制其推廣范圍。

樣本擴散，模型迭代：

用戶反饋和平臺監(jiān)控，雖然能發(fā)現(xiàn)新的問題，但是泛化性不夠。
賬號打壓雖然具有泛化性，但是無法將新問題，新賬號發(fā)現(xiàn)。
為了解決原有體系的不足，我們嘗試結(jié)合兩部分，通過人工監(jiān)控跟負(fù)反饋收集樣本進(jìn)行擴散，然后提供給模型進(jìn)行迭代提升召回。最后再從賬號維度進(jìn)行泛化打擊。這里跟前文提到的樣本增強的區(qū)別在于樣本擴散更多的是對新問題樣本的收集。

5.3 擴散迭代

5.3.1 正常流程

那么怎么進(jìn)行樣本擴散，加快模型的迭代周期呢?下面是一個樣本收集周期里面大概需要做些什么事情。

首先根據(jù)發(fā)現(xiàn)的問題數(shù)據(jù)通過相似度計算，我們在源數(shù)據(jù)(source data)找到一批跟問題數(shù)據(jù)(sample data)相似度較高的未標(biāo)注數(shù)據(jù)(unlabeled data)。

賬號：一個賬號的內(nèi)容大部分比較相似，同一個黑產(chǎn)內(nèi)容跟也往往相同。
類目：對問題比較集中的類目進(jìn)行數(shù)據(jù)挖掘。
關(guān)鍵詞：用一些匹配式框定一個范圍。
聚類模型：簡單的計算樣本內(nèi)容的文本相似性。
分類模型：構(gòu)建簡單的分類模型進(jìn)行初篩。

然后對這批未標(biāo)注的數(shù)據(jù)進(jìn)行人工標(biāo)注，這樣可以篩選出一批能有效提升模型對新問題識別效率的標(biāo)注樣本(selected data)。
最后將篩選的樣本跟原有的標(biāo)注數(shù)據(jù)(labeld data)進(jìn)行合并作為訓(xùn)練樣本進(jìn)行模型訓(xùn)練。訓(xùn)練好模型之后在測試數(shù)據(jù)(test data)上面進(jìn)行測試效果。

5.3.2 加速流程

工作周期主要的工作量是在兩個部分，一是相似樣本的挖掘，二是人工標(biāo)注樣本;相似樣本挖掘的精度越高，覆蓋的樣式越全，人工標(biāo)注的樣本量就越少。而這兩方面我們可以使用半監(jiān)督學(xué)習(xí)跟強化學(xué)習(xí)的方法來進(jìn)行優(yōu)化。

5.3.3 自動化流程

更進(jìn)一步我們嘗試使用強化學(xué)習(xí)代替整個問題樣本的挖掘過程，強化學(xué)習(xí)選擇器從源數(shù)據(jù)里面選擇樣本，跟已有標(biāo)注樣本送入判別器訓(xùn)練，然后將判別器在測試數(shù)據(jù)和問題數(shù)據(jù)的表現(xiàn)當(dāng)成 Reward 反饋給強化學(xué)習(xí)選擇器。

六、總結(jié)展望

前面討論了框架內(nèi)部的通用性，那么這個框架整體是否具有通用性，能否在其他平臺適用呢?其實因為各類內(nèi)容平臺在問題類型跟數(shù)據(jù)類型本身就存在大量的共性;所以看一看的控制框架和技術(shù)，在面對如搜一搜，公眾平臺，朋友圈等其他場景時，依然可以提供相應(yīng)的經(jīng)驗和能力。近半年來，搜一搜作為用戶獲取內(nèi)容重要場景，我們在復(fù)用看一看能力的基礎(chǔ)上也構(gòu)建了類似的控制框架。

雖然我們已經(jīng)掌握了各式各樣的能力，能夠解決很多問題，但是相比起知道的知識，我們不了解的內(nèi)容更多，經(jīng)常會出現(xiàn)讓我們意想不到的狀況。質(zhì)量控制，乃至于機器學(xué)習(xí)的主要矛盾在于用有限的知識處理無限的未知。持續(xù)的知識獲取意味著自主學(xué)習(xí)，也意味著持續(xù)的與現(xiàn)實交互。

一個平臺的質(zhì)量控制系統(tǒng)就像是人體的免疫組織，當(dāng)病毒來臨，免疫細(xì)胞產(chǎn)生抗體，消滅病毒。人類在漫長的進(jìn)化過程中，構(gòu)建了復(fù)雜的免疫系統(tǒng)，同時，病毒也在不斷的進(jìn)步。越是復(fù)雜的系統(tǒng)，出現(xiàn)問題的可能性越高，出現(xiàn)問題后解決問題的成本難度也越大。在構(gòu)建強健的內(nèi)部免疫系統(tǒng)的同時，我們同樣需要營造良好的外部環(huán)境，讓更多優(yōu)質(zhì)的內(nèi)容生產(chǎn)者進(jìn)來，才是解決質(zhì)量問題之根本。

分享標(biāo)題：揭秘微信「看一看」是如何為你推薦的
當(dāng)前URL：http://m.5511xx.com/article/codhcgp.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

新聞中心

其他資訊