這是快手科技 AI 技術(shù)副總裁鄭文在活動(dòng)上的演講主題。從純粹用于制作、快手分享 GIF 圖的短視工具性應(yīng)用,到如今成為日活躍用戶量過(guò)億,自己用戶日均使用時(shí)長(zhǎng)超一小時(shí)的其實(shí)新型短視頻社區(qū),這是家人快手七年走過(guò)的創(chuàng)業(yè)路。
七年,工智快手用戶累計(jì)發(fā)布短視頻超過(guò) 70 億條,快手從搞笑、短視幽默,自己游戲、新疆援交(援交小姐)[微信1662+044-1662][提供外圍女上門(mén)服務(wù)快速安排面到付款不收定金娛樂(lè),到各地風(fēng)土、民情,內(nèi)容各異。對(duì)于快手,不少人認(rèn)為它只是一家短視頻公司,短視頻平臺(tái)跟 AI 技術(shù)的關(guān)系并不大。
面對(duì)每日數(shù)以千萬(wàn)的新增視頻,該如何將其精準(zhǔn)匹配到用戶眼前?快手 CEO 宿華曾形容,這是快手員工需要面對(duì)的前所未有的難題。為此,快手提出了一整套基于 AI 技術(shù)的解決方案,貫穿視頻生產(chǎn)、內(nèi)容理解,用戶理解,系統(tǒng)分發(fā)等使用快手的每個(gè)環(huán)節(jié)。在極客雇主交流會(huì)現(xiàn)場(chǎng),快手科技 AI 技術(shù)副總裁鄭文說(shuō),AI 是快手連接內(nèi)容生產(chǎn)與消費(fèi)兩個(gè)端口的核心能力。
快手上線了一批爆款特效,像是叫做快手時(shí)光機(jī)的「變老」表情,可以在十幾秒鐘中,讓視頻中人物的容顏?zhàn)兂?60 年之后、還有可以實(shí)時(shí)進(jìn)行肢體識(shí)別的舞蹈游戲、AR 換臉等等。這些玩法背后是快手對(duì)前沿 AI 技術(shù)的開(kāi)發(fā),涉及人體姿態(tài)估計(jì)、手勢(shì)識(shí)別、背景分割等多個(gè)技術(shù)模塊。這是在內(nèi)容生產(chǎn)領(lǐng)域,快手努力將記錄形式變得更加有趣的新嘗試。
用戶通過(guò)快手 app 拍攝、上傳了一段短視頻后,后臺(tái)機(jī)器會(huì)提取其內(nèi)含的基本信息,諸如視頻中人臉的性別、表情、顏值等,嘗試?yán)斫庖曨l內(nèi)容。機(jī)器還會(huì)依照?qǐng)鼍白R(shí)別、物體跟蹤、圖像質(zhì)量評(píng)估等維度,對(duì)圖像進(jìn)行分類。語(yǔ)音識(shí)別,也是機(jī)器理解視頻的重要方面。機(jī)器會(huì)把語(yǔ)音轉(zhuǎn)化成文字,通過(guò)文字理解視頻表達(dá)的含義??焓侄嗝襟w內(nèi)容理解(Multi-Media Understanding)部門(mén)利用 AI 技術(shù)通過(guò)感知和推理兩個(gè)階段來(lái)解讀一個(gè)視頻,首先感知獲取視頻的客觀內(nèi)容信息,進(jìn)而推理獲取視頻的高層語(yǔ)義信息。
讓記錄形式更有趣,讓機(jī)器理解視頻內(nèi)容、深度洞悉用戶,這是快手利用 AI 技術(shù)賦能短視頻平臺(tái)的試探。
快手科技 AI 技術(shù)副總裁鄭文說(shuō),作為前沿技術(shù),人工智能在研發(fā)、執(zhí)行過(guò)程中還沒(méi)有一個(gè)非常成行的流程。根據(jù)自身發(fā)展情況,快手以問(wèn)題為導(dǎo)向開(kāi)展 AI 項(xiàng)目,首先明確需求,接著針對(duì)需求進(jìn)行預(yù)研、收集數(shù)據(jù)、訓(xùn)練模型,之后才是相應(yīng)的功能開(kāi)發(fā)與產(chǎn)品化。