智能涌現的浪濤,還在翻涌。以今年5月為節(jié)點,全球科技巨頭在AI領域的成功與部署以更為密集的狀態(tài)呈現。
其中一條步履鮮明的主線,是普遍在追求AI落地。硬件端,蘋果在全球開發(fā)者大會上發(fā)布蘋果智能,宣布將ChatGPT融入Siri,三星宣布GalaxyAI融入手機、平板、穿戴式設備;軟件端,谷歌在Chrome瀏覽器集成Gemini AI助手……
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
一個公認的現況,AI應用即是國內AI產業(yè)當下的弱點環(huán)節(jié),又是國內能夠追趕甚至超越的機會所在。
有趣的是,拋開尚處于初級階段的“百模大戰(zhàn)”,僅從AI應用場景出發(fā),抖音與快手這兩大先天占據優(yōu)勢的短視頻內容平臺,各自大熱的AI應用,又提供了兩種截然不同的落地路徑。
01
豆包,文生圖文基底的AI Agent
AIGC相關的App中,豆包繞不過。據Questmobile數據顯示,截至2024年6月,在國內AIGC App中,豆包、天工、Kimi智能助手、貓箱增長亮眼——其中豆包流量排名第一。
豆包并不嚴格“歸屬”于抖音,更確切來說歸屬于字節(jié)跳動。坊間流傳的消息是,這個名字很接地氣的AI產品,最開始的定位是抖音內的AI工具包,或者是抖音內的所有AI應用都包了,所以叫豆包。
在2023年8月上線以來,豆包本身的產品定位和能力也在不斷迭代,直至跳脫出抖音本身的框架,單獨成為一個App。與ChatGPT和文心一言等ChatBot產品形態(tài)類似但不同的是,盡管交互形態(tài)相似,但豆包的定位更傾向于一個綜合性的AI Agent(AI智能體)平臺。
通用場景下,用戶可以和“豆包”默認智能體聊天對話,也可以尋找其他垂直應用的智能體對話解決垂直場景的問題,其中包含官方與第三方創(chuàng)建的智能體應用。
在不斷迭代之下,其功能也愈發(fā)繁復?,F在的豆包,不僅有App更有PC端,應用內的場景也擴展到了虛擬社交聊天、AI搜索、文檔對話、文生圖、內容創(chuàng)作等多種使用場景。而且AI能力的應用也開始擴展到了字節(jié)旗下的不同產品。
以抖音為例,一邊是抖音應用內上線AI搜索功能,一邊是用戶在和豆包進行吃喝玩樂等特定類目內容交互時,豆包除了生成文字回復,還會推流一個抖音短視頻來填補AI回復的準確性和及時性。
在今年上半年相對熱門的AI應用中,字節(jié)基本都有入局,虛擬社交領域的貓箱,智能臺開發(fā)平臺領域的扣子,為主文生視頻的即夢等等。然而,豆包之于字節(jié)的定位重要性毋庸置疑,先是持續(xù)在增長方面的投入并公布商業(yè)化路徑,后是干脆將原來的大模型名稱從云雀大模型改成豆包大模型等一系列動作,都足夠驗證。
集成、聚合、綜合……豆包代表的產品路徑,依舊保持著“超級App”或者說“超級入口”的思路,在市場相對空白階段階段,先通過應用端占領用戶市場,并且在小步快跑中不斷迭代,最終聚合成一個超級應用,來獲取AI應用時代的優(yōu)先船票。
與此同時,不同場景和不同產品的貫穿,又讓字節(jié)生態(tài)內的用戶數據進一步被累積,成為自身AI能力增長的數據養(yǎng)料。
02
可靈,視頻世界的AI入口
對AI領域有關注的人們,或許還會記得2月Sora推出時引起的震動。這是堪比ChatGPT式的信標。絲滑的文生視頻體驗,代表著人機交互、內容創(chuàng)意之間的某個隔閡被消磨殆盡,轉向通途。
很多人會以為,中國版“Sora”,會誕生在BAT和所謂“大模型五虎”上。作出這種判斷并不令人意外,技術基底延伸產品應用的鏈路總是更短。但出乎意料的是,真正在用戶層引起爆發(fā)式普及的文生視頻產品,卻是快手推出的可靈。
與還處于內測階段的Sora相比,在6月公布的可靈直接對外開放。比較吸引人的點在于,可靈支持生成長達2分鐘的30幀視頻,分辨率最高1080p,并且可以自由定制寬高比。這樣的產出能力,甚至遠超還Sora和其余競品(包括在可靈公布前一個月字節(jié)上線測試的文生視頻應用“即夢”)。
在發(fā)布后不久,其又上線了圖片生成視頻功能。視頻生成的效果,也符合其宣稱的大幅度合理運動、物理世界特性模擬、具備概念組合能力和想象力等優(yōu)勢。這一度成為許多“內容創(chuàng)作者”們吸睛的利器,讓老照片、手繪圖片變成視頻的“獨家秘笈”甚至被許多人做成課程銷售。
快手的AI產品路徑,也值得思考。在可靈之前,快手先后發(fā)布了通用大語言模型“快意”、文生圖大模型產品“可圖”,均未有太大火花,反而是更符合自身內容生態(tài)的可靈迅速火爆。
而在可靈爆火后,在移動端唯一能使用的渠道依舊只有快手創(chuàng)作工具快影 App。但快手專門打造了Web端,并發(fā)布公告稱此前的可圖平臺將在8月關閉,產品功能融入“可靈AI”中。從Web端入口可以看到,快手對可靈的官方定位是新一代AI創(chuàng)意生產力平臺,突破了文生視頻局限,集中在AI內容/創(chuàng)意生成方面,并且還有AI視頻剪輯等功能方面的想象力留白。
這似乎又是一個方向:圍繞自身核心業(yè)務場景,提供AI助力來實現揚長避短。而快手本身的內容生態(tài),AI能力的喂養(yǎng)、AI產品的落地、用戶的反饋,形成了一個完整閉環(huán),用第三方平臺、工具的形式,從創(chuàng)作到體驗到生態(tài)提升了整體主站App的體驗。
03
Agent和工具集,被動與主動
不難發(fā)現,盡管目前交互的形態(tài)還屬于一問一答、一入一出的階段,但豆包和可靈之間的差異,已經有了被動與主動的差別。
豆包嘗試的AI Agent作為通往AGI(通用人工)的必經之路,發(fā)展方向無疑是能夠獨立思考、調用工具去逐步完成給定目標的獨立助手。終極的發(fā)展目標,是用戶只需要給出一個需求,就能根據需求拆解步驟并提供解法。用戶被動享受著AI的主動響應。
可靈AI作為垂類平臺,集成了對應的分類能力。用戶依舊要為進行文字、圖片和素材的輸入,并且進行調試。產品用被動式的交互保持了用戶的部分主動性。
無關優(yōu)劣,這本就是非常有意思的階段性發(fā)展。人機交互關系究竟應該是什么形態(tài),人們需要一個萬能的智能體助手,還是更垂直有效的工具,又是一個事關倫理的新命題。
而可以確認的是,至少在未來的一段時間內,我們不用擔心AI產品的無趣了。