近日,由蚂蚁技艺参议院交互智能履行室打造的最新视频处理算法CoDeFtaylor swift ai换脸,在群众开源平台GitHub上热度飙升,发布仅一周时分就在GitHub流行趋势榜单上的Python言语分类中冲到了第一。
据悉,CoDeF是一项果真时、强细节、高保真的视频处理技艺,用于完成视频作风移动任务。
履行标明,CoDeF技艺省略绝不贫穷地将图像作风化算法升级为视频作风化算法,将图像要道点检测算法升级为视频要道点追踪算法(以致包括水和烟雾等非刚性物体的追踪),将图像语义分割算法升级为视频物体追踪算法,将图像超分算法升级为视频超分算法,同期撑握用户可交互的视频实质裁剪。
连年来,跟着以图像生成、图像裁剪等任务为代表的视觉实质生成领域获取打破性剖析,视觉生成正向着视频标的发展。相配是果真应用场景下,东说念主们对视频的及时性、提醒性、保真度等方面忽视了更高条目。现在的主流算法多受限于生成视频时序一致性较差的问题,导致其生成成果无法平直在果真场景中应用。
极度强奸为了措置这一问题,技艺参议院的参议员们忽视了一种全新的措置念念路——将视频处理简化为图像处理。
具体来说,将视频暗示为一个2D实质圭表场(canonical content field)和一个3D时分形变场(temporal deformation field),其中实质圭表场追究整合一段视频中包含的所有纹理信息,而时分形变场则追究建模视频里的动态信息。换言之,每一帧视频齐愚弄这个形变场对实质圭表口头编码的的圭表图像(canonical image)进行变形,就不错收复出该帧图像。
基于这种表征技艺,视频处理任务不错简化为图像处理任务,用户只需要处理每个视频对应的静态圭表图像,然后通过形变场的变换,就不错将图像处理限制当然地沿着时分维度进行传播,达到对所有这个词视频处理的缱绻,也因此保证了高度的时序一致性。
值得一提的是,参议者们设法尽量缩短圭表图像和果真图像的域差(domain gap),使得现存的图像算法不错不加任何覆按地应用到圭表图像上,完成视频处理。
该技艺在GitHub发布并开源后,不仅在技艺圈影响世俗,在Twitter平台也“火”出了圈。不少Twitter网友直呼“不敢坚信!”、“这是一个广泛的飞跃!”,还有东说念主说“只需给它一年时分,就能被用在电影制作上了”。
据悉,这项技艺是由蚂辘集团技艺参议院交互智能履行室历时三个月时分完成。形势主要追究东说念主是蚂蚁技艺参议院交互智能履行室参议员沈宇军,其主要参议标的为测度机视觉和深度学习。
项缱绻另外三位主要作家分辨为香港科技大学的博士生欧阳豪、蚂蚁技艺参议院的王秋雨、和浙江大学的博士生肖宇曦,其中第别称和第三名参与者当下为蚂辘集团的参议型实习生。
自2021年开荒以来,蚂蚁技艺参议院一直力图作念有效、有遐想力的科研。面向数字化、智能化改日,对准寰宇科技前沿,推动要道中枢技艺攻关。
其中,交互智能履行室主要聚焦测度机视觉和当然言语处理标的的基础模子参议,开发通用东说念主工智能算法架构,包括实质生成、多模态通晓、数字化、东说念主机交互等要道技艺。
热点资讯