推薦美圖的 Pinterest 如何靠機器學習吸睛? 2016年09月22日08:57 來源:|
月活躍用戶達1億的Pinterest越來越依賴機器學習,以幫助發現新的互聯網洞見。
世界各地的用戶訪問Pinterest是為了探索、保存和分享照片及文章。幫助用戶找到自己喜歡的內容,用戶自然會被留住:Pinterest上30%的互動和25%的Pinterest內購來自于Pinterest推薦的相關內容。為了推薦合適的內容,Pinterest使用了由數據驅動的頂尖技術,還進行了大量試驗。
那么,Pinterest是如何利用機器學習實現的呢?
Pinterest首席發現科學工程師(leaddiscoveryscienceengineer)MohammadShahangian表示:“我的主要工作是找到解決內容發現問題的方向。我們會對算法做非常小的改變進行試驗,每一次嘗試都有其改進或不好的地方。”
獨家優勢:基于興趣
實際上,這和Pinterset的特點不無關系:它的優勢之一在于,Pinterset是圍繞用戶的興趣而建立的社區,用戶會將自己從互聯網上找到的、文章和圖片按興趣分類。這意味著Pinterest不用像其他社交網站一樣,通過點擊模式或在某個頁面上花費的時間來猜測用戶的興趣,而是可以直接用算法來衡量其數據庫中750億個條目之間的關系,因為這些條目很可能被歸在同一個興趣之下。
MohammadShahangian說道:“許多試圖通過輸入或信號來推導用戶興趣。但在Pinterest,用戶明確地給出了自己對什么感興趣的信號。”
訪問Pinterest的用戶們在不斷為這個由用戶、搜集到的條目以及收藏板所組成的社交圖景添磚加瓦。這些數據又可以讓Pinterest更精確地為用戶主頁消息流、搜索結果以及相關內容推薦提供內容。單純根據用戶關注的內容向用戶推薦并不理想,而推薦相似內容又很容易重復。
在MohammadShahangian看來,“如果你收集了一個廚房水槽的條目,我們應該給你推薦更多水槽呢,還是推薦可以讓你的廚房煥然一新的條目?”
在實踐中不斷測試
為了作出這些決策,Pinterest的工程師們試驗了多種機器學習算法。他們研究了這些算法在相關和不相關條目上的效果,以及它們如何影響真實用戶的活躍度。
MohammadShahangian說道:“我們確實會直接在Pinterest上做試驗,但很多時候我們都會先做很多準備工作再試驗。”
當然,如果不進行實際測試,就根本沒辦法知道某個用戶是否會喜歡新的推薦內容。“我沒法花錢請人告訴我,某個用戶是否會喜歡新的推薦內容,”MohammadShahangian表示。但通過研究算法推薦的內容是否會被真實用戶歸為某個興趣下,這就能得到相對靠譜的答案了。
此前,Pinterest將用戶主頁的消息流從純粹的按時間排列關注用戶的消息,改成了由算法生成的消息流,這一舉措讓用戶的活躍度提高了五分之一到十分之一,后續算法改進還會帶來額外提升。
Shahangian表示:“在整個改進過程中,Pinterest得到了長足發展。個性化極大地提高了用戶活躍度。”
改進圖像搜索功能
Pinterest還一直在改進圖像搜索,以幫助用戶更好地找到相似圖片。Pinterest的工程師們與加州大學伯克利分校視覺與研究中心的研究人員們合作開發了這一技術。現在它已經能通過深度學習算法來自動識別圖片中的物體了。這樣,用戶就可以點擊這些物體來找到Pinterest中的相關條目。
Pinterest視覺搜索工程師DmitryKislyuk說道:“這不是區分貓狗的分類算法。我們是想實時找到圖片間的相似性。”
他表示,這一視覺搜索工具在發現Pinterest中的家庭裝飾品和時尚用品上效果很好。未來Pinterest希望能改進其自動分類功能,以更好地滿足其他搜索需求,比如幫助用戶找到相似的新食譜。
在談到用深度學習來更有效地進行圖片分類時,Pinterest視覺搜索工程師AndrewZhai說道:“我覺得我們的模型會變得更語義化,也會變得更好。”
Pinterest的工程師們在專注于完善物體識別和搜索的同時,還打算開發一款應用,讓手機用戶可以拍攝現實世界的物體,然后獲得Pinterest上的相關條目推薦。
DmitryKislyuk表示道:“現如今的深度學習、計算機視覺領域令人激動人心。世界變化太快,頂尖技術每兩個月就會變一次。”
責任編輯:姚泓澤