他与你共生,学习你,越来越像你,并成为你的助手。这不是美剧《西部世界》里的情节,而是一家个人人工智能初创公司的核心模式
文 | 财新特约记者 李莹莹 张梦圆 陆晨(发自美国旧金山)
“我有一个梦想,就是未来每个人从13岁开始就可以建立自己的AI(Artificial Intelligence,人工智能)。AI和你一起学习并学习你,伴随你一同成长,还可以帮你干活,成为你的助手。任何时间你都可以倒流,回到AI的任何一个时间段,甚至进行互动。这样,你拥有了你独有的AI,就像拥有了时光机。”9月25日,个人人工智能初创公司ObEN的联合创始人郑毅在美国旧金山这样告诉财新记者。
这样梦幻式的描述并不令人不可思议,因为,这是在旧金山举办的TechCrunch Disrupt大会上,到处都漂浮着这样充满生机和梦想的创业者,以及对这些梦想兴致勃勃的观众。
TechCrunch Disrupt实为硅谷流行的创业大赛,起源于2007年的创业展会TechCrunch 20,旨在两天的时间内充分展示20个热门的新创项目。随着TechCrunch 20的红火,TechCrunch放宽入选项目的数量,从20家增加到50家,成为后来的 TechCrunch 50。2010年TechCrunch 50又改名为现在的TechCrunch Disrupt。同时,创业大赛增设了研讨会的环节,希望能够联合专家、领导者、顶尖的企业家与创业者一起谈论未来。于是,Disrupt引入”创业竞技场(Startup Battlefield)”机制。新创企业需要经过几轮竞选之后,才能进入最后一轮,接受公开质询,最终优胜者将获得5万美元奖金。
虽然门票高达2000美元一张,这场创业盛会仍人声鼎沸,台上的分享嘉宾也多为硅谷创新企业的佼佼者,其中有传统IT企业家如英特尔的CEO Brian Krzanich,谷歌机器学习团队创始人John Giannandrea,也有穿着水彩T恤上台、年仅23岁的数字货币以太坊创始人VitalikButerin。
会议间隙,参加分享会的创业者郑毅接受了财新记者的采访,44岁的他硕士毕业于清华大学环境工程系和加州大学伯克利分校金融工程,取得了加州大学戴维斯分校环境工程博士学位。他也是百合网联合创始人、美国光速创投投资合伙人。
目前,他的初创公司ObEN设立在美国洛杉矶。创办时间不足四年,ObEN完成约1400万美元A轮融资,领投是中国社交巨头腾讯,软银旗下下一代媒体创新基金跟投且将首笔人工智能风投给了ObEN,此外还有如山资本、韩国SM娱乐有限公司、清华大学深圳研究院等投资方。ObEN专攻的是个人人工智能(PAI,Personal Artifical Intelligence)。
明星AI来了
ObEN的专利人工智能技术,能够迅速将一个人的平面图像和声音结合起来,创造全息的个人虚拟形象。用户只需上传一张自拍照和一段简短的录音,就能生成和真人相似的3D虚拟形象,建立用户独特的文字转化语音发声引擎(TTS),让这个用户说出各国语言,甚至唱出东北二人转的风格。这种像音结合的技术,目的是将现实中的个人直接复制到增强现实、虚拟现实或者物联网的世界中,让个人虚拟形象可以在大量的数据训练以及不断使用中变得越来越聪明。
郑毅表示,不同于传统的、基于任务的AI公司,ObEN是一家拥有全栈能力的AI创业公司。所谓全栈能力,是指在快速变化的技术形势中能够根据行业的需要,各个方面的人工智能技术在一起进行联合训练和学习,让应用体验更完美。
“ObEN不是专注于单一技术,它在语音合成、图像视觉重建和自然语言处理等细分领域都有很高的科技水平。”他说。
这一技术可以使明星快速地创建、安全地存储和发布自己的人工智能,与粉丝互动,带来个性化又近距离的独特体验。社交媒体公司和娱乐公司同时对ObEN产生了浓厚的兴趣,人工智能融合明星公关进而浸入普通人社交市场的前景广阔。
郑毅认为,在未来人工智能时代来临的时候,从内容层面来讲就会有一些新的内容和新的展现形式,这种新的展现形式不是由人来生产内容,而是由人工智能来生产。明星人工智能的虚拟形象可以协助明星,在明星缺少这方面能力的情况下协助其进行内容的生产,比如语言能力。ObEN目前支持英文和中文,只会说英语的好莱坞明星可以通过人工智能生成相同的嗓音,用中文与粉丝互动甚至未来为电影配音。未来还会开发韩语、日语、西班牙语等语种,进一步使明星品牌产生跨地域的延展性。
基于此,ObEN最初始的合作伙伴就是好莱坞的明星公司以及亚洲明星的经纪公司。今年6月,ObEN宣布与韩国SM娱乐成立合资公司幻星有限公司(AI Stars)。这是世界上第一家用人工智能技术去开发明星自己的人工智能版权的企业。ObEN希望继续把这家公司的经验在美国以及亚洲其他国家进行推广,以在未来打造成为全球最大的人性化人工智能公司。
每个人都可以有PAI?
但郑毅表示,他未来的雄心是让世界上76亿人口每个人都有自己的人工智能,”ObEN的独特创意及战略规划就在于,每个人都可以拥有自己的AI,把真实的人的各个特性复制到数字世界里”。在与真实世界互动的过程中,虚拟形象的相似度还会不断提高,随着数据的积累,虚拟形象会变得越来越像你、趋近于你。
创建于2014年的ObEN,过去几年间投入资源开发三个核心技术,一是通过平面照片色谱算出人脸的骨骼结构,即从一张平面照片就可以还原出人脸的三维骨骼结构;二是声音模拟技术,如ObEN有一段通常是100-400句左右指定的文字,通过朗读这段话后,用户的发声模型就可以通过人工智能制作出来,读得越多,发声模型会与原本的声音越相像;三是三维人脸模型在听到声音后,嘴和面部表情就会产生动作,即一种用声音驱动人脸的表情和嘴型的技术。
这种核心技术不同于传统数据库拼凑应用程序编程接口(API)的做法,ObEN用”全栈式训练”同时重建声音和视觉,将声音驱动人脸表情和嘴型这种匹配的动作放到一起。在整个行业中,这种计算视觉的重建、声音的重建、再到表情的模拟,是分别由不同的公司来做的。ObEN首次将这些集成在一起,这也是其区别于其他公司的地方。
麦肯锡全球研究院上个月发布的研究报告《人工智能,下一个数字前沿》(ArtificialIntelligence,The Next Digital Frontier),对当下全球AI发展进行了全面调查。报告指出:包括百度和谷歌在内的科技巨头在AI上的花费在200亿到 300亿美元之间,其中90%用于研发和部署,10%用于AI收购。机器人和语音识别是两个最受欢迎的投资领域,计算机视觉是获投资最多的子领域。
在B2B的渠道方面,ObEN在和腾讯做一些产业链上的合作,比如微信读书、小微机器人等,人工智能技术可以帮助用户在听微信书的时候有更多声音的选择,此外也有人工智能聊天机器人,机器人可以更加形象化,赋予其明星的形象。郑毅说,ObEN会和战略投资人如社交媒体工具公司Line、互联网资讯移动平台今日头条等陆续有一些合作。
在B2C方面,郑毅说打算自己做。每个人通过手机来建立自己的人工智能虚拟形象,可以立体P图,比如把自己的虚拟形象P得更好看、更有意思、更可爱。再基于AR(增强现实)的功能,用户还可以把自己的虚拟形象放在某个地方,通过自己的虚拟形象去和其他人打交道。通过这种技术,用户就可以将自己的虚拟形象从洛杉矶传送到北京,还可以用自己的虚拟形象去和亲人朋友进行互动。”通过AI技术和AR方法的结合,将会有更多的可能性。”郑毅说。
区块链运用于个人AI
做每个人的人工智能,需要打造以人为核心的社交网络,颠覆传统的平台化的社交网络。
以人为中心,首先意味着人工智能”为我所用”,用户拥有排外的管理使用权,有权授权人工智能,决定把多少隐私对公众开放,需要进行认证做好安全措施。
其次,人工智能能替用户做什么事情,做的这些事情用户有多大的选择权,ObEN希望以”我”为中心来做这件事情。
“每个人都能有同样权利的话,我们就相当于形成了点对点的一种人工智能的网络组织。这个正好是区块链天然的匹配。”郑毅说。
在他看来,区块链是去中心化,以每个个体为核心,同时由于记账薄的这种形式,保证每一个人工智能通过记账薄的方式,真正的主人就是最原始的拥有者,每个人工智能不会被丢失,一定还是这个人拥有的。所以我们决定把我们的个性化技术,通过区块链的基础架构进行发布。”郑毅说。
简而言之,ObEN重点关注每个人个体的人工智能,所以打造的是点对点的人工智能网络,通过区块链的网络协议进行部署,这样能给每个参与者带来自由度,使得每个人都能拥有跟自己绑定的独特的、区块链认证的PAI,而且也会给他们更多的应用。
“人工智能需要大量的数据去训练。作为一个普通的人工智能创业公司,目前面对的最大困境不是算法,而是需要大量的数据来进行AI的机器学习和训练,而大量的数据一般在巨型的平台公司,如百度、谷歌、亚马逊、微软等。作为创业公司往往没有这样的数据,因此创业两三年之后只能把自己卖给大公司,依附于大公司的数据才能继续进步。”郑毅表示,他希望能打破天花板,通过跟区块链技术的结合,更早地激励所有的参与者贡献数据。
本文由用户:麦妖榜 发布,不代表网站的立场,转转请注明出处:http://www.maiyaotop.com/block/pai/21618.html