4月15日,可灵可灵AI在北京中关村国际创新中心举行“灵感成真”2.0模型发布会,全系全球宣布基座模型再次升级,模型面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。进入
截至目前,时代数已可灵AI全球用户规模突破2200万。用户来自世界各地的突破超1.5万开发者和企业客户,将可灵的可灵API应用于不同的行业场景中。
快手高级副总裁、全系全球社区科学线负责人盖坤表示,模型可灵希望让每个人都能用AI讲出好故事,进入实现更加精准的时代数已复杂创意表达。
可灵AI全系模型进入2.0时代,用户定义人和AI交互的突破全新方式
4月15日,可灵大模型2.0版本及可图大模型2.0版本正式面向全球发布。可灵据悉,可灵2.0模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。
盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。
自去年6月发布以来,可灵AI已累计完成超20次迭代。3月27日,全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)以1000分的Arena ELO基准测试评分登陆图生视频(Image to Video)赛道榜首。
作为全球首个用户可用的DiT视频生成模型,截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里,可灵AI的月活用户数量增长25倍。
快手高级副总裁、社区科学线负责人盖坤(图片来源:快手)
盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。也因此,要真正实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。
一直以来,可灵AI致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,高效地传达给AI。
“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤指出,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,实现AI创作者们的创意表达。
基于MVL理念,可灵AI正式推出多模态编辑功能。“从今天起,大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW(多模态描述子)将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。
“灵感成真”可灵AI2.0发布会现场(图片来源:快手)
可灵2.0大师版正式发布,全新上线多模态视频编辑功能
基于MVL这一全新交互方式,发布会现场,快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。
“可灵2.0大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。”张迪介绍,可灵2.0大师版实现了技术、体验、美学的三重突破。
快手副总裁、可灵AI负责人张迪(图片来源:快手)
据雷峰网(公众号:雷峰网)了解,可灵2.0大师版升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。
可灵2.0大师版操作界面(图片来源:快手)
张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。
在图像生成大模型领域,快手的可图2.0处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中,相较于Midjourney V7、FLUX1.1 [pro]以及Reve等行业领先的图像模型,均保持明显优势。
张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现提升。
同时,可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时保留原图的语义内容。
AIGC技术迅猛发展,为全行业发展注入全新活力
除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。
盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。
如今,可灵正在成为AI时代视频创作的新基础设施。AIGC技术的迅猛发展,也正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。
以二次元AI创作社区产品狸谱为例,其产品负责人一休介绍,可灵AI为狸谱带来了创新突破。其1.6版本在人物运动流畅度、镜头移动等方面展现出卓越性能,助力狸谱成功接入“动态LIVE”和“新春萌偶摇”两大功能。前者实现“图 - 影 - 音”快速创作,后者在春节期间引发60万用户转播。
未来,双方将基于狸谱的优质内容数据与可灵的算法能力,打造动画模型,推动AI成为内容引擎,并共同孵化优质创作者,构建更活跃的创作生态。
“可灵AI可全面融入剧集级创作流程”。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇在分享中介绍,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。
从剧本创作到内容发行,异类Outliers团队完成了一次完整的影像工业化创作流程,覆盖从美学表达到镜头结构,再到复杂动作场景与细节的全面呈现。
“我们实践之后发现,可灵AI是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。”陈翔宇认为,在AI的辅助下,导演及编剧团队的大量内容创意也实现了更富有想象力的表达,“AIGC也许是下一代内容结构的雏形”。
可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇(图片来源:快手)
快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。
该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。
面向未来,盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。
本书首发来自要闻瞭望台,第一时间看正版内容!
坚定信心勇于创新 全力推动高质量发展 晋江市领导调研企业
昨日下午,泉州市委常委、晋江市委书记张文贤带队调研企业。张文贤一行先后前往晋江市德顺陶瓷建材有限公司、泉州市宝舒体育用品有限公司、茂泰福建)新材料科技有限公司,深入企业车间、产品展厅等地,与企业负责人
乌曜石新做《天中天下》没有露任何微逝世意:购一次永暂玩
乌曜石工做室远日公布了新做《天中天下The Outer Worlds)》,正在接管中媒Gamestar采访时,游戏建制人Timothy Cain表示游戏内没有包露任何微逝世意:“游戏中出有微逝世意,您
《堡垒之夜》第七赛季国际服更新前瞻 新形式新弄法
《堡垒之夜》第七赛季新内容前瞻,国际服已公布了第七赛季更新告诉布告,让我们一起去看看新赛季皆有哪些新事物。新形式嗨皮岛国服民圆微专已公布了嗨皮岛的相干疑息,正在新形式《嗨皮岛》中,堡贝们能够与好基友一
《光环:无贫》通闭后被删剧情暴光 或与绝做有闭?
远日有玩家对《光环:无贫》停止数据收挖收明,游戏正在工做职员名单绘里中间删除一小段剧情。现在玩家开端猜念那段剧情被删除的启事,而剧情中经由过程摩我斯电码通报出去的疑息也让启事隐得减倍奥秘。如果您借出有
阴阳离子共传输让提锂更高效:基于仿生共转运体的锂镁分离 – 材料牛
在自然界中,生物离子通道可以精准筛分离子。受此启发,研究人员构筑了大量仿生离子筛分材料。这些筛分材料可以把一种阳离子跟其他阳离子分开,也可以把一种阴离子跟其他阴离子分开。这些材料在化工、环境领域应用
海内厂商研收变形金刚新玩具 可主动变身、复本动绘
变形金刚IP从出世到现在能水遍齐球,当然有影视动绘做品的奉止功绩,但玩具才是变形金刚最核心的卖面。比去,海内厂商北京森汉科技有限公司公布了一段视频,掀示了能够或许主动变形的柱子哥玩具。主动变身柱子哥演
1 1618元的蟹券10只蟹1斤多 网友:已经找到店铺重点防范作者:
886字
最近,苏州市民王先生(化名)遇到了“大坑” 。王先生有一张价值1618元的蟹券,蟹券上标明,1618元/盒,十只装。王先生想着,自己在苏州,吃蟹的机会多,就想给在上海的弟弟吃。
1 《战天5》尾章更新内容本日放出 民圆对跳票报歉作者:
16751字
昨日,EA颁布收表《战天5》尾章更新内容跳票,启事是正在“最后阶段”开辟者收明更新内容有一些题目,那激收了很多玩家对EA战DICE的没有谦战吐槽。古晨《战天5》民圆颁布收表,尾章更新内容将会正在本日放
1 《魂斗罗:回去》本日重磅更新 齐新改编摇滚BGM上线作者:
984字
《魂斗罗:回去》本日重磅更新,齐新改编摇滚BGM上线。动做射击足游《魂斗罗:回去》将于本日迎去半周年音乐版本,没有但有新灯光、新音乐大年夜厅退场,齐新水陪摇滚巨星,齐新电弧枪醉觉-摇滚凶他等缤纷到临,
1 科教阐收《齐职猎人》小杰暴走版 喜收冲天没有简朴作者:
5字
典范动漫《齐职猎人》停载已3年多,至古仍然出有再开的迹象,远日日本教者应用科教数据阐收了小杰喜收冲天暴走版的本相,一起去赞叹下。•没有克没有及没有仄气做者富坚老贼的脑洞,小杰暴走时的冲天少收真的惊呆了
1 身体出现这些症状,或是缺钙的表现,日常可常吃这5“物”补钙!作者:
976字
钙是人体中不可或缺的一种营养元素,一旦钙元素不足,人的身体就会受到影响。然而据有关资料显示,我国却是一个缺钙的大国,有将近一半的人都缺钙。因此,人们也会想出很多办法来补钙。那么,身体哪些表现意味着你缺
1 LG推出新一代OLED EX足艺 将进步吸应时候战隐现明度作者:
9266字
LG正在CES 2022大年夜展前夕,流露了其OLED屏幕足艺将有宽峻年夜改进。新的OLED足艺称为OLED EX,将会正在去岁第两季度呈现在新款OLED电视中。LG表示,新足艺的吸收力正在于“极快”
1 《蛮横人大年夜做战》新豪杰攻略作者:
861字
《蛮横人大年夜做战》新豪杰摩摩可已表态正式服,有很多玩家体验以后表示讲魅影喵侠很好玩很敬爱,也很风趣,但是便是有些没有懂该如何才是玩到那个豪杰的细华!那么上里便让小编去给大年夜家讲讲改如何玩好我们敬爱
1 《星露谷物语》做者新做截图 本年将有更多内容作者:
5215字
远日,《星露谷物语》做者Eric "Concerned Ape"Barone公布新做《可骇巧克力工厂》最新截图,并颁布收表:“新年悲愉!我但愿您们皆有一个齐新主动的2022年。以下是《可骇巧克力工厂》
1 相遇阳朔,畅享健康森呼吸 海尔洗空气空调G系列全球首发—万维家电网作者:
54744字
山峦如黛,水秀如画,阳朔不仅有着「甲天下」的绝美风景,更有着沁人心脾的健康好空气 …4月25日,海尔空调新品发布会在阳朔举办,现场海尔空调不仅携手中国天气对好空气进行了深度
1 《逝世或逝世:沙岸排球3 绯白》新预报 白叶换拆秀身材作者:
21936字
《逝世或逝世:沙岸排球3 绯白》公布了一段Switch版本的新预报,为我们带去了白叶正在游戏中的多种挨扮演示,并齐圆里的为我们掀示了角色的身材。《逝世或逝世:沙岸排球3 绯白》NS预报:面此没有雅看视