隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今(jin)日頭條是北(bei)京字節跳動科技有限(xian)公司開發的一款基于(yu)數(shu)據(ju)挖(wa)掘的引擎產品,為用(yong)戶信(xin)息,提(ti)供連接人(ren)與信(xin)息的服務的產品。由張一鳴(ming)于(yu)2012年3月創建(jian),2012年8月發布版本(ben)。
基于個(ge)性化引(yin)擎技(ji)術,根據(ju)每個(ge)用戶的(de)(de)興(xing)趣、位置等(deng)多個(ge)維度進行個(ge)性化,內容不僅包(bao)括狹義(yi)上(shang)的(de)(de)新聞,還包(bao)括音樂(le)、電(dian)影、游戲(xi)、購物等(deng)資訊。
根據其社交行(xing)為、閱讀(du)行(xing)為、地理(li)位置、職(zhi)業、年齡等(deng)挖掘出興趣(qu)。通過(guo)社交行(xing)為分析(xi),5秒鐘計算出用(yong)戶(hu)興趣(qu);通過(guo)用(yong)戶(hu)行(xing)為分析(xi),用(yong)戶(hu)每次動(dong)作后,10秒內更新用(yong)戶(hu)模型。
對每條(tiao)信息提取(qu)幾十個到幾百個高維特征,并進(jin)行降(jiang)維、相似計(ji)算、聚類等計(ji)算去除(chu)重復(fu)信息;對信息進(jin)行機器分類、摘(zhai)要抽取(qu),LDA主題(ti)分析、信息質量識別等處理。
根(gen)據人的(de)特(te)(te)(te)征、環境特(te)(te)(te)征、文章特(te)(te)(te)征三(san)者的(de)匹配程度進(jin)行。0.1秒(miao)內計算結果,3秒(miao)完成文章提(ti)取、挖掘、消重(zhong)、分(fen)(fen)類(lei),5秒(miao)計算出(chu)新用戶興(xing)趣(qu)分(fen)(fen)配,10秒(miao)內更新用戶模(mo)型。