今日頭條搜索優(yōu)化是今日頭條APP里內(nèi)嵌的搜索引擎,不僅能搜索站內(nèi)自媒體發(fā)布的相關(guān)信息,還能搜到站外信息,用戶可通過(guò)今日頭條上面的搜索框進(jìn)行試用。今日頭條SEO優(yōu)化有三個(gè)維度的變量。
第一個(gè)維度是內(nèi)容
頭條現(xiàn)在已經(jīng)是一個(gè)綜合內(nèi)容平臺(tái),圖文、視頻、UGC小視頻、問(wèn)答、微頭條,每種內(nèi)容有很多自己的特征,需要考慮怎樣提取不同內(nèi)容類型的特征做好推薦。
第二個(gè)維度是環(huán)境特征
這是移動(dòng)互聯(lián)網(wǎng)時(shí)代推薦的特點(diǎn),用戶隨時(shí)隨地移動(dòng),在工作場(chǎng)合、通勤、旅游等不同的場(chǎng)景,信息偏好有所偏移。
第三個(gè)維度是用戶特征
包括各種興趣標(biāo)簽,職業(yè)、年齡、性別等,還有很多模型刻畫(huà)出的隱式用戶興趣等。
結(jié)合三方面的維度,模型會(huì)給出一個(gè)預(yù)估,即推測(cè)推薦內(nèi)容在這一場(chǎng)景下對(duì)這一用戶是否合適。
頭條指數(shù)“根據(jù)今日頭條熱度指數(shù)模型,將用戶的閱讀、分享、評(píng)論等舉動(dòng)的數(shù)量加權(quán)求和得出響應(yīng)的事件、文章或關(guān)鍵詞的熱度值”,考慮了用戶的多種舉動(dòng),它具有輔助創(chuàng)作、輿情分析和精準(zhǔn)營(yíng)銷三個(gè)重要作用,目前的頭條指數(shù)的更新是按照小時(shí)更新的,相對(duì)微信而言更及時(shí),同時(shí)還能夠提供數(shù)據(jù)下載。
除了熱度,頭條指數(shù)還提供用戶畫(huà)像的分析功能。對(duì)相關(guān)關(guān)鍵詞匹配的人群,包括性別、年齡、地域、愛(ài)好都有直觀的呈現(xiàn)。選擇特定的時(shí)間段,還能回溯某段時(shí)間中響應(yīng)的數(shù)據(jù)體現(xiàn)。
內(nèi)容分析包括文本分析,圖片分析和視頻分析。頭條一開(kāi)始主要做資訊,今天我們主要講一下文本分析。文本分析在推薦系統(tǒng)中一個(gè)很重要的作用是用戶興趣建模。沒(méi)有內(nèi)容及文本標(biāo)簽,無(wú)法得到用戶興趣標(biāo)簽。另一方面,文本內(nèi)容的標(biāo)簽可以直接幫助推薦特征。
內(nèi)容分析和用戶標(biāo)簽是推薦系統(tǒng)的兩大基石。內(nèi)容分析涉及到機(jī)器學(xué)習(xí)的內(nèi)容多一些,相比而言,用戶標(biāo)簽工程挑戰(zhàn)更大。
今日頭條常用的用戶標(biāo)簽包括用戶感興趣的類別和主題、關(guān)鍵詞、來(lái)源、基于興趣的用戶聚類以及各種垂直興趣特征(車(chē)型,體育球隊(duì),股票等)。還有性別、年齡、地點(diǎn)等信息。性別信息通過(guò)用戶第三方社交賬號(hào)登錄得到。
還有用戶的年齡信息通常由模型預(yù)測(cè),通過(guò)不同機(jī)型、閱讀的時(shí)間分布等預(yù)估。常駐地點(diǎn)來(lái)自用戶授權(quán)訪問(wèn)位置信息,在位置信息的基礎(chǔ)上通過(guò)傳統(tǒng)聚類的方法拿到常駐點(diǎn)。常駐點(diǎn)結(jié)合其他信息,可以推測(cè)用戶的工作地點(diǎn)、出差地點(diǎn)、旅游地點(diǎn)。這些用戶標(biāo)簽非常有助于推薦。