就在几天前,那个坐拥p图应用 photoshop 的 adobe 公司,更新了一波新品。
还发布了首个基于深度学习的平台——
「Adobe Sensei」
简单来说,这就是 ai,sensei 利用了 adobe 长期积累的大量数据和内容,从图片到影像,能够帮助我们解决很多问题,将重复劳动变得自动化。
这样你就可以在几分钟内调好一个表情
Sensei 可以进行脸部自动编辑
它可以在照片里自动查找到人脸以及人脸的各个部分,包括眉毛、嘴唇和眼睛,并且学习这些部位的位置,来让设计师们调整照片上人的表情,而不会看起来不自然或者怪异。
的确很强大!
不过,这次真正能把我点燃的黑科技,是它——
「Project VOCO」
它的厉害之处是,可以根据一个人说话的录音,合成几乎以假乱真的任意录音。
首先,让 voco ——
学会你的话
你丢一段大概20分钟你的音频让它学。
模仿你说话
比如这句:And ur I kissed my dogs and my wife.
加新词和换位
你在这句中,不管调换词的位置、添加新词,音效完全听不出来有任何差异,几乎接近于完美模仿原发音者。
把 wife 换成 Jordan
把 and my dogs 换成 three times
这简直就是音频编辑领域里的“Photoshop”。
呃,那么这样一来。。。真的就实现了“把话强加到别人身上了”。。。
看来柯南的变声器差不多可以出货了~
音频技术能如此,那么问题就来了——
既然声音能以假乱真,
那么,视频可以无中生有么?
早在半年前,其实就已经实现了。
而且效果达到了可怕的真人秀级别!
可以这么说——
这软件一出,视频即将沦陷。
注意!下面你看到的——
都是假的!
老年痴呆版的川普
表情夸张的普京
猴子般的小布什
这是一项叫「Face2Face」的技术——
能实现实时面部重演(Real-time Facial Reenactment)。
它可以实时捕捉使用者的表情,然后替换已有视频中人物的表情。
把一个人的脸部 RGB 影像,通过算法,进行采集。
然后与另一个人的RGB数值进行比对,测算脸部五官结构。
最后就可以将主角的表情和口型无缝替换。
这样就能让他做从未做过的表情。
而你,只需要一个普通摄像头就能实现...
可怜的川普
甚至——
可以在家帮奥巴马在白宫开个告别演说。
还是那句话——
你的思想有多远,你就可以有多变态!
你们有没有察觉这里面有个特别不对劲的地方。。。如果我们把voco和face2face这两个技术合起来的话。。。
你还是你吗?
呃,呵呵,人类药丸~