Site logo
港股报价由天汇财经提供

可靈的突圍之路:“無名之輩“到全球視頻生成頭部玩家

时间2026-04-09 09:29:54

快手-W

下载霸财智赢APP,买卖点即市预警,炒家心水交流 >>

全網播放量破億的AI短片《紙手機》背後,是一個關於"敢不敢"的突圍故事。

小男孩想給去世的奶奶燒一部"紙手機"。這個簡單的故事,讓很多人第一次在AI生成內容裏看到了"人世間"。

智通財經APP獲悉,近日,快手(01024)高級副總裁、可靈AI負責人蓋坤接受媒體採訪,講述了產品從"無名之輩"到全球視頻生成賽道頭部玩家的過程。聽他説完,你會發現一個有意思的結論:在大模型時代,"敢不敢"往往比"能不能"更重要。

第一次決策:從"Nobody"到全球首發

2024年初,OpenAI發佈Sora Demo震動行業,但產品遲遲沒有落地。蓋坤做了一個讓團隊"炸鍋"的決定——做全球第一個用户可用的視頻生成模型,而且要超越Sora。

那時可靈在內部幾乎沒有資源優勢,訓練甚至依賴"非主流"算力。但他判斷,OpenAI阻擊完Google後會分心迴歸語言模型,會留出5-6月的窗口期。

"如果不搏這一把,很可能陷入"平庸—無資源—被淘汰"的負循環。"蓋坤説,"我們本來就是Nobody,博輸了還是Nobody,博贏了就徹底改變命運。"

他給內部定了死命令:必須在5月內完成從模型到產品的全線就緒。2024年6月6日,可靈1.0上線,成為全球第一個用户可用的DiT視頻生成模型——而Sora直到當年年底才正式發佈。

第二次決策:放棄"雕花",轉向多模態

第一次成功之後,更難的選擇出現了。

在2.0之後,團隊面臨兩條路:一是繼續提升清晰度和穩定性,沿既有路線"精細打磨";二是轉向多模態,把圖像、視頻甚至動作都變成AI的"語言",重構交互方式。

前者確定性高,後者幾乎沒有先例。

"基座指標要保,但解決新問題才是未來的核心。"蓋坤最終選擇後者。

隨後推出的動作控制功能(Motion Control)驗證了這一方向——用户上傳一段參考視頻,就能讓角色復刻動作。這功能幾乎沒依賴推廣,在海外市場迅速走紅。

蓋坤後來打了一個比方:OpenAI就像一個高冷的女神,做出了驚人的東西大家只遠觀;但可靈作為"鄰居"幹成了,大家才驚醒——原來這事真能落地。

方法論變化:大模型時代,AB測試失效

這些決策背後,是一套正在變化的組織方法論。

過去二十年,互聯網公司的核心能力經歷過兩次演進:從產品與運營驅動,到算法與AB測試驅動。但在大模型時代,這套邏輯開始失效——一次嘗試的成本往往以千萬美元計,創新是在未知空間中尋找路徑。

"拼肌肉拼不過,就要像'法師'一樣,通過判斷力打出局部優勢。"蓋坤説。

在他看來,企業不再依賴大規模試錯,而是依賴少數關鍵決策。從DiT架構,到多模態,再到一體化模型,可靈的幾次關鍵轉向,幾乎都不是"試出來"的,而是靠vision(願景)牽引,在茫茫可能性中下重注賭對方向。

方向確定之後,執行成為關鍵。蓋坤強調"Disagree and Commit"原則:重大決策初期允許充分爭論甚至反對,但一旦目標確定,所有人必須投入120%的執行力。

"很多團隊是口頭同意,但執行變形。我們更看重的是定方向之後的統一行動。"

終局:讓更多人把腦海中的故事拍出來

蓋坤判斷,隨着生成能力和可控性持續提升,AI視頻將從工具走向基礎設施。

"當高質量內容足夠多、足夠豐富,一個新的內容平台就會誕生。"

在他看來,技術的意義不只是提升效率,而是釋放表達能力——讓更多人有機會把腦海中的故事拍出來。

這也是可靈從第一天起就定下的願景:"讓每個人都能成為導演,讓每個人都能拍出自己心中的好故事。"

聽起來很遠。但蓋坤説,考慮到AI正在加速進化,快則一年,慢則三年,這個願景或許就會實現。

一個可見的信號是商業化進展。2025年第四季度,可靈AI營收達3.4億元人民幣;同年12月單月收入已突破2000萬美元,對應年化收入運行率約2.4億美元。

免责声明:本资讯不构成建议或操作邀约,市场有风险,投资需谨慎!