應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

Sora引爆科技圈;融資超10億美金……AI賽道再掀巨浪!

2024-02-21 09:08 視覺物聯(lián)
關(guān)鍵詞:AI

導(dǎo)讀:2024年開春之際,AI圈熱度再次升溫,迎來顛覆性進(jìn)展。

  2022年底,ChatGPT橫空出世,掀起新一輪AI浪潮。

  2023年,AI大模型風(fēng)起云涌,全球范圍內(nèi)各大巨頭在AI領(lǐng)域動作頻頻,各類AI大模型層出不窮。

  2024年開春之際,AI圈熱度再次升溫,迎來顛覆性進(jìn)展。

  2月16日,谷歌宣布推出全新的Gemini1.5 AI模型,這是迄今為止谷歌的最大模型。據(jù)了解,Gemini 1.5建立在谷歌基礎(chǔ)模型開發(fā)和基礎(chǔ)設(shè)施的研究與工程創(chuàng)新的基礎(chǔ)上,包括通過新的專家混合(MoE)架構(gòu)使Gemini 1.5的訓(xùn)練和服務(wù)更加高效,并且可以處理128000個token的標(biāo)準(zhǔn)情境窗口。

  無獨有偶。同一天里,OpenAI擲下一顆“深水炸彈”,毫無預(yù)兆地發(fā)布了文生視頻大模型Sora,并迅速成為了討論的焦點,引起業(yè)內(nèi)廣泛關(guān)注。

  根據(jù)OpenAI官網(wǎng),Sora完美繼承了DALL·E3的畫質(zhì)和遵循指令能力,能夠根據(jù)用戶的一句話直接生成長達(dá)1分鐘的高質(zhì)量視頻,包含了高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及情感豐富的多個角色。OpenAI表示,他們正在教授AI理解和模擬運動中的物理世界,旨在幫助解決現(xiàn)實世界交互問題。

0ef137b2c8771b6950fab09061411d95.png

 一位時髦的女士漫步在充滿霓虹燈光的東京街頭上;圖源:OpenAI官網(wǎng)

  當(dāng)前,OpenAI官網(wǎng)上已經(jīng)更新了48個視頻demo。在這些視頻demo中,Sora不僅能準(zhǔn)確呈現(xiàn)細(xì)節(jié),還能理解物體在物理世界中的存在,并生成具有豐富情感的角色。而且該模型還可以根據(jù)提示、靜止圖像甚至填補現(xiàn)有視頻中的缺失幀來生成視頻。

  不過,OpenAI也承認(rèn),Sora這個模型不是完美的,其仍存在一些局限性,在某些細(xì)節(jié)生成上還存在問題,比如復(fù)雜物理場景中的錯誤物體等。但Sora所展示出的強大的文生視頻能力,已足以讓影視行業(yè)感受到了前所未有的沖擊。

  與此同時,自ChatGPT掀起全球浪潮以來,國內(nèi)AI大模型公司也迎來了迄今獲得的單輪最大金額融資。

  據(jù)悉,AI創(chuàng)業(yè)公司“月之暗面”近期完成了新一輪超10億美元融資,投資方包括阿里巴巴、美團、小紅書和紅杉中國等。本輪融資后,月之暗面估值已達(dá)約25億美金,為國內(nèi)大模型領(lǐng)域的頭部企業(yè)之一。

  公開資料顯示,月之暗面成立于2023年3月,致力于尋求將能源轉(zhuǎn)化為智能的最優(yōu)解,通過產(chǎn)品與用戶共創(chuàng)智能。公司創(chuàng)始團隊核心成員曾參與了Google Gemini、Google Bard、盤古NLP、悟道等多個大模型的研發(fā),多項核心技術(shù)被Google PaLM、Meta LLaMa、Stable Diffusion等主流產(chǎn)品采用。

  2023年10月,月之暗面正式推出了首個支持輸入20萬漢字的智能助手產(chǎn)品“Kimi Chat”,主打無損記憶,在“長文本”領(lǐng)域上實現(xiàn)了突破,而這也是月之暗面做To C超級應(yīng)用的第一次嘗試。

  龍年伊始之際,AI領(lǐng)域利好不斷,AI大模型迎來新進(jìn)展并且正在加速落地。2024年,伴隨著技術(shù)的不斷革新發(fā)展,我們期待AI賽道帶來更多的驚喜,看到更多無限的可能。

  欲了解更多行業(yè)動態(tài)以及行業(yè)最新、最前沿的產(chǎn)品、技術(shù)與解決方案,歡迎掃碼報名4月24-26日IOTE2024國際物聯(lián)網(wǎng)展·上海站。

3a32fdd61aac4ccff18bd95d08ce9f8f.jpg

掃碼報名參會