隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日頭條是北京字節跳動科(ke)技有限(xian)公司開發(fa)的一款基于數據挖掘的引擎(qing)產品,為(wei)用(yong)戶信息,提供連接人與信息的服務的產品。由張一鳴于2012年(nian)3月(yue)創建,2012年(nian)8月(yue)發(fa)布版(ban)本。
基于個性化引擎(qing)技術(shu),根據(ju)每個用戶的(de)興(xing)趣、位置等多個維度進行個性化,內容不僅包括狹義上(shang)的(de)新(xin)聞,還包括音(yin)樂、電影、游戲、購物(wu)等資(zi)訊。
根據其社(she)交行(xing)為(wei)、閱讀行(xing)為(wei)、地理位置(zhi)、職業、年齡等挖掘出興趣(qu)。通過(guo)社(she)交行(xing)為(wei)分(fen)析,5秒(miao)鐘計(ji)算出用戶興趣(qu);通過(guo)用戶行(xing)為(wei)分(fen)析,用戶每次動作后,10秒(miao)內更新用戶模(mo)型。
對每條信(xin)息提(ti)取(qu)幾十個到幾百個高維特征,并進行降維、相似計算(suan)、聚類等計算(suan)去除(chu)重復信(xin)息;對信(xin)息進行機器分類、摘要(yao)抽取(qu),LDA主題(ti)分析、信(xin)息質量識別(bie)等處理。
根據人的特(te)(te)征(zheng)(zheng)、環境(jing)特(te)(te)征(zheng)(zheng)、文章特(te)(te)征(zheng)(zheng)三者的匹配(pei)程度進行。0.1秒內計算結果,3秒完成(cheng)文章提(ti)取、挖掘、消重(zhong)、分(fen)類(lei),5秒計算出新用戶興趣分(fen)配(pei),10秒內更新用戶模型。