可灵AI发布之后无论是国内还是海外都引起很大的关注,尤其在海外引起了很好的反响,包括埃隆·马斯克都参与到了可灵的讨论里面来,除了DeepSeek以外,可灵AI也是在硅谷代表中国影响力最高的一个视觉模型。
我们在这之后也经过了10个月的快速研发,不停地更新我们的模型、产品,经过了二十几次的迭代,现在我们的可灵已经发展成了一个全球化的产品,我们在全球范围之内累计超过2200万的用户,我们的用户使用可灵生成了1.68亿个视频,3.44亿张图片,我们的APP也是在阿根廷、智利等8个国家和地区的iOS应用市场下载排到了第一,在北美市场的图像与设计分类里面的下载也排到了第一。
讲完整个可灵的介绍,我接下来就用一组短片给大家介绍一下可灵有什么样的能力,4月15日,我们发布了可灵2.0,在可灵发布的时候有两个最核心的模型,一个是可图大模型2.0,做的是图像生成的工作,你输入一段文字,我们就可以按照你的文字指令生成一个图片;第二个是可灵视频生成大模型,你输入一段文字或者输入一张图片,我们就可以生成对应的你想要的视频片段。
从指标上来说,我们发布的新版本在全球范围之内,在这个领域仍然是行业领先的,包括我们的可图在评测上超过了我们的竞品,包括大家比较了解的Midjourney,我们可灵大模型在模型的性能上比谷歌Veo2和OpenAI的Sora,包括非常知名的Runway要更好一点,这是一个模型指标的参考。
过去一年视频生成模型在发生什么?
更直观的,我想给大家展示一下过去一年的时间视频生成的能力到底有一个什么样的变化,大家可以看到这是一年之前我们的模型,左侧是一段非常复杂的描述词,它描述的是一个电影场景的人,一个在跑动的场景,一年之前这个画面没法看,基本上是一个动图,这是2024年1月份。2024年6月份我们发布的版本,虽然画面还是非常糟糕的,至少这个人动起来了,有点像一个视频。
2024年12月份已经有一点感觉了,虽然整个画面视频完成质量很低,但有点感觉了,我们发布的2.0很好地生成了左边的完整视频,是跑酷的画面,整个画面的质量,整个镜头的跟随程度,整个美学已经达到了电影的质感,整个技术的发展是非常快的,一年以前整个行业都不敢想象我们是可以用文字生成近似于影视质感的视频,仅一年的时间,就可以发展为输入左边的文字就可以生成右边的视频,接下来用更多的例子给大家做一个展示。
我们怎么用文字生成图片,再用图片生成电影短片的,右边这个例子是超级创作者用图像模型、视频模型的例子,上面用文字生成的图片,下面用这张图片生成的视频,我们的模型可以响应各种各样的风格,故事片、动作片都可以做得很好,上面这些片段其实是一些电影片段的复现,上面所有的画面和视频都是用AI技术生成的,没有进行任何的拍摄和设计。
一些基本功能,文生视频,输入左边的这些词,右边就可以看到片段,左边是我们的老模型,右边是我们的新模型,对于人物的动作、表情都可以展现得非常详细,下面是延迟摄影的示例,这是文生视频。
图生视频,给我一张图片,可以是生成的,也可以是你拍摄的,就可以生成下面的视频,无论对于写实类的还是卡通动画类的都可以做得非常好。
我们也支持多模态编辑,现有的视频我们可以对视频中元素进行增删改,视频中的PS也可以实现了,有一个示例,展现我们怎么对现有视频进行增删改,这是原始的视频,可以替换中视频中的所有元素,让女生妆容变化、人物变化、吃的东西变化,可以看到这个视频让我们感觉现实好像已经不“存在”了,所有的视频也可以进行动态的变化。
我们知道影视制作除了生成图片视频以外,声音也是很重要的,我们的平台可以提供声音、音效生成能力,声音也是AI生成的,这个短片所有的声音都是AI生成的,这是一个卡通短片,他讲述的是老爷爷和老奶奶回忆自己青春时的经历,所有的声音都是根据画面自动生成的,可以看到无论是图像、视频、声音,AI都代表了新质生产力,大幅降低了创作的成本,提高了创作的效率,这是声音部分。
可灵AI带来的新商业机会
AI也可以带来很多有意思的玩法,我们给木兰会的LOGO做了一个视频效果,可以变成非常有意思的动漫特效。
最后我想给大家展示AI做电影、AI做商业化做到什么程度,接下来的短片能够震撼到大家,这个是我们超级创作者给我们做的最新电影短片中的片段,《王国》,所有内容都是AI生成的,网友们说是AI版《权力的游戏》,如果用传统的拍摄技术,拍摄难度、拍摄成本都非常高,我们用AI做这个片子大概是几个人的工作室,做了一周的成本,这是一个短片,真实片子有20分钟的长度,我们在5月份会有一个完整系列的短片,每个片子有20~40分钟,有十部片子在全球发布,包括了各种各样的风格。
整个科技行业发展非常快,AI发展非常快,中国大模型从前几年追赶美国的状态到今天各个领域跟美国的差距在缩小,最重要的还是AI转化为新质生产力,跟各行各业结合在一起。
近年来,随着智能手机的普及和技术进步,手机的安全性问题也逐渐被消费者所关注。尤其是苹果手机,作为全球最受欢迎的手机品牌之一,在中国的用户群体非常庞大。时不时地会有关于苹果手机爆炸的新闻报道,这让不少用...
据悉,Meta正与人工智能初创公司Scale AI就数十亿美元的投资进行谈判,该笔融资的价值可能超过百亿美元。 据媒体8日报道,Meta正在与人工智能初创公司Scale AI就一笔可能超过100亿美元...
引言 外骨骼今年火了。这个似乎只出现在科幻电影或专业病房中的设备,如今火到了普通人身边。 6月,八达岭和居庸关长城景区先后开启外骨骼租赁服务,为游客在攀登时提供助力,可让其轻松登长城,无痛当“好汉”。...
据腾讯音乐娱乐集团(TME.NYSE;01698.HK)所发布公告,其 2024 年年报全面展示了公司在过去一年的运营状况、财务表现、业务布局以及面临的各类风险与机遇。这一年,腾讯音乐在竞争激烈的在线...
本周股指集体调整,沪深两市股票型ETF和跨境型ETF合计净流入约200亿元。 行业主题上看,券商、医疗、军工ETF被资金看好,而信创相关ETF被资金抛售。 约200亿元资金借道ETF进场 本周沪深两市...
如果这个行业能够做强,那中国经济必将更加壮大,也更加安全。 【时不我待的海洋战略】 7月1日,中央财经委员会第六次会议提出推进中国式现代化必须推动海洋经济高质量发展,走出一条具有中国特色的向海图强之路...