斯坦福华人女博士创业项目爆火!半年融资万美元

斯坦福华人博士休学搞创业,直接火爆AI圈!

新产品瞄准AI视频生成,刚出道就成行业顶流,引来一众大佬围观评价。

OpenAI大牛Andrej Karpathy转发,并激情附上长文一段:

每个人都能成为多模态梦境的导演,就像《盗梦空间》里的筑梦师一样。

就连Stability AI创始人也来点赞:

这个新产品名为Pika 1.0,背后公司Pika于今年4月成立。

要知道,这一行的产品已有不少,如成立5年的Runway等公司。

从放出的Demo效果来看,Pika 1.0不仅能根据文字图片,流畅地生成一段视频,动静转换就在一瞬间:

而且可编辑性还特别强,指定视频中的任意元素,一句话就能实现快速“换装”:

这样的效果,也使得公司成立仅半年,产品用户已经超过52万人。

更是新斩获5500万美元融资,其中个人投资者不乏各种大牛,如Quara创始人Adam D’Angelo、Perplexity的CEO Aravind Srinivas、GitHub前CEO Nat Friedman等等。

所以,Pika究竟有没有看起来这么好用?我们也立刻上手体验了一番。

AI视频新顶流长啥样?

此次火爆出圈的Pika 1.0,是Pika发布的第一个正式版本产品。

经过四个多月Discord社区的测试,Pika认为是时候推出本次重大升级了。

相比之前Pika还只能用文字或图像生成视频,如今的Pika 1.0,功能要更加丰富——

不仅能根据文字、图片或视频风格生成视频,还能对视频局部进行编辑。

可编辑性有多强?

不仅画面大小任意扩展,从5:2、1:1画布,到9:16以及16:9的超大屏,4种选择无缝转换:

像什么3D、动漫、电影等各式各样的风格滤镜,那就更不用说了。

最重要的是,1.0正式版推出了用户更友好的网页版,不用在discord中一遍遍艾特机器人,就能直接上手玩。

(不过,现在它还需要排队,需要点耐心。)

当然,也可以移步Discord社区先上手体验一番。

尽管它还未随网页版更新到Pika 1.0,但我们也实测了一下文字、图片生成视频的效果,还不错。

加入社区之后,直奔“Creations”,从下面的10个生成区随便选择一个进入即可开耍。

在输入框中输出“/”,选择最简单的“/create”命令:

在此,我们输入“a robot dancing in the rain, sunset, 4k, -gs 8”提示词交给机器人。

大概也就半分钟的时候,视频就出来了,速度相当快:

效果嘛,雨没有表现得很明显,但机器人的肢体动态性真的很强。

我们再来一个稍微长一些的提示词:

a teenager walks through the city streets,takes pictures of places(一个青少年穿过城市的街道,拍摄照片)

仍然超级快,结果就出来了:

Wow,这次真的有很满意,画面符合脑海中的预测,甚至比我们想象得还要好。

除了纯文字,咱还可以上传一张参考图像进行创作,使用“/animate”命令。

当当,一张静态表情包就动起来了:

总的来看,Pika给出的视频时长都是3s(所以使用太长的提示词也没用,后面会直接忽略掉),以及它还不能保证每次结果都很满意,但总体来说多试几次还是有不错的结果出现的。

在自测之外,我们也来看看网友的作品,其中不乏非常惊艳的效果。

比如有人创作的这只小怪兽,憨态可掬,让人忍不住想摸一把:

还有这段两位小女孩的演奏画面,看完我好像真的听到了优美的嗓音从中传出:

最绝的还是这个白鸽围绕短发美女翻飞的场面:

也太有氛围感了吧~

看罢如上效果,我们也来盘盘这家公司究竟是什么来头。

两位斯坦福华人博士创立

Pika的创始人一共有两位,郭文景(Demi Guo)和Chenlin Meng,都是斯坦福博士。

据The Information消息,郭文景于今年四月创立了Pika,随后Chenlin Meng加入成为联创,两人合作开发了这个文本生成视频模型。

从二人学术经历来看,她们分别专注于NLP和计算机视觉两个方向的AI研究,也都有生成式AI的学术经历。

联合创始人兼CEO郭文景,斯坦福大学AI实验室(NLP&图形学方向)博士。

她在美国出生,杭州长大,初中就读的是杭州外国语学校,从小就接触编程,夺得过IOI银牌,从本科开始正式留学,被哈佛大学提前录取。

此次创业,她的领英主页显示休学中(On Leave),应该是打算先忙创业的事情。

在斯坦佛大学读博之前,郭文景在哈佛大学取得了计算机硕士和数学本科学位。

在职期间,她参与了用Transformer分析2.5亿个蛋白质序列的研究,目前这篇论文引用已有1200+,其中就包括后来大火的AlphaFold2:

除此之外,她也先后在Epic Games、谷歌和微软等多家公司实习过。

这次创业,郭文景的导师Christopher D Manning也给予了不少支持。

Christopher D Manning以NLP方向的研究闻名,如今在谷歌学术上的引用量已有23w+,而他也将成为Pika的学术顾问之一。

联合创始人兼CTO Chenlin Meng,同样是斯坦福计算机博士。

在此之前,她于2020年在斯坦福大学获得了数学本科学位。

相比郭文景在NLP领域的研究经验,她在计算机视觉、3D视觉方面的学术经历更加丰富,参与的去噪扩散隐式模型(DDIM)论文,如今单篇引用已有1700+:

当然,随着Pika 1.0爆火,Pika也开启了进一步的招人计划,从技术、产品到运营都有需求:

一个月内5家产品亮相

值得一提的是,不止是正在快速扩张的Pika。

首先就是11月3日,Runway的Gen-2发布里程碑式更新,支持4K超逼真的清晰度作品。

然后时间来到11月16日,Meta发布Emu Video,这个工具在用户评估中号称打败Gen-2、Pika等对手,效果be like:

从Emu开始,大家都好像打起比赛来了,那叫一个争先恐后。

才过两天,11月18日,字节就半路杀出发布PixelDance,作品的动态性可谓史无前者,画面中的元素都动作幅度都相当大,且不变形,让人眼前一亮。

又仅过3天之后,11月21日,AIGC领域的佼佼者Stable AI也终于推出了自家的视频工具:Stable Video Diffusion。

效果嘛,也很能打。

同一天,Gen-2又没闲着,“横插一脚”上线“涂哪动哪”的运动笔刷新功能,直接标志出生成模型可控性上的一个重要里程碑。

最后,就是今天了,11月29日,来自创业公司的Pika直接带着网页版发布正式版1.0,叫板“老大哥”Runway。

在此之外,我们还从未见过哪个阶段有这么多各有特色、来自不同背景的产品争相亮相。

这也让人不得不感叹一句:

AI视频这是来到爆发前夜了?

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

THE END
0.拿AI做副业,零门槛简单操作,小白也能轻松入门!咸鱼ai生成在线接单在过去的23年,这一年称人们之为AIGC的元年,特别是openAI发布了GPT, 随着AI爆火,一时间,各种玩法是层出不穷,早期靠AI做项目的也是赚的盆满钵满。 我不知道小伙伴们发现了没有,现如今AI正在慢慢改变我们的生活, 说个简单的例子,midjourney,这是一个画图的AI, jvzquC41dnuh0lxfp0tfv83;;>21jwvkerf1mjvckrt1:9247?26@
1.国产AI出海跑出黑马MiniMax借海螺AI爆火海外国产AI出海跑出黑马 MiniMax借海螺AI爆火海外,MiniMax,2024年可以说是AI视频合成模型能力爆发的一年。日前,一款名为Hailuo AI的视频生成工具在海外爆火,“丝滑”是使用者对其生成视频jvzquC41tgge0lsmk0tfv8|gd1Tfy|ucrgx0C{ykenk0USGF4285397622920qyon
2.今年“双11”新图景:AI店长上岗下单能“小时达”年轻人“买心情”即时零售爆发 从年初便开始爆火的即时零售,也在这届“双11”成为主战场,线上线下边界彻底打破,“线上下单、小时达”成为消费新常态。 数据显示,截至11月5日,淘宝闪购带来的新用户在“双11”期间的电商订单数已超过1亿。天猫“双11”期间,很多品牌在闪购的成交额强劲增长。华为在淘宝闪购的成交额周环比增长1910%,jvzquC41pg}t0‚hyd0ipo8nmkp|kl}ok1euovnsva798:A<740nuo
3.时代浪潮已经袭来AI人工智能频频爆火ChatGPT改变行业未来可能在ChatGPT爆火之前,我们在提起人工智能AI,我们往往想到的是科幻小说或电影中机器人的形象。 例如:大导演斯皮尔伯格的著名电影《人工智能》里面与人的外表、智慧几乎相同的机器人,这个机器人本身甚至没有意识到自己是机器人,反而以为自己是人类了。电影《终结者》系列中出现的具有机器骨骼、人类血肉的机器人,以及可以jvzquC41dnuh0lxfp0tfv8vsa8858=>;71gsvrhng1jfvjnnu1742<>6968
4.AI泡沫一、产业趋势与资本市场崩溃可以并存2000年的美国互联网,互联此外,亚马逊、微软等一众巨头也斥资上百亿美元,正在世界各地如火如荼地建设数据中心。 据《华尔街日报》报道,预计美国2025年AI数据中心支出规模或达5200亿美元(约合3.7万亿元人民币)。 1993年,美国宣布建设为期十年的信息高速公路计划,计划总支出为4000亿美元,去掉通货膨胀的影响,这笔钱现在的价值在9000亿美元左右。jvzquC41zwkrk~3eqo527>89;;;6:88778935;>Aawmda|twtek>wphdckjvejwf
5.曾鸣书院:看十年,智能商业大爆发文章来源:网页链接文章摘要:1.大2.通用智能的时代也可以说成是机器人的时代,因为AI是大脑,它与各种硬件的结合就是各种机器人,比如自动驾驶的车就是一个机器人。 3.到目前为止AGI只能应用人类现有的知识,并不能创造新知识,但AI for Science将AI用来做科学的发展,它很有可能创造完全不一样的格局,比如它可能会发现新的化学方程式或新的物理定律,jvzquC41zwkrk~3eqo532A9633;4;88636633:=
6.AI赛道开年王炸!震撼级产品Sora爆火,AI板块代币多年来,人工智能经历了多次炒作周期,但即使是怀疑论者,也会认为,OpenAI 的 ChatGPT 的发布似乎标志着一个转折点。 此次AI视频模型 Sora 的炸裂登场,似乎标志着生成式AI的爆发性创新已迎来拐点。AI大模型正以前所未有的速度重塑世界。一个崭新时代正在来临。 jvzquC41yy}/eny0eqs/ew4zyuj039538:990|mvon