AI,这个一直热门的话题,被互联网大伽们不断地谈论着。纽约网页设计,纽约网站设计与您一起听听今日头条AI实验证主任马维英博士怎样说。
在今日头条举办的“人工智能与人类文明”论坛上,今日头条人工智能实验室主任、副总裁马维英博士不仅介绍了今日头条在AI领域的几大优势,还详细展示了今日头条实验室的写稿机器人、自动换脸换微笑等“AI黑科技”。
一、从数字化时代走到语义化时代
在过去30年数字化发展中,人类积累了海量的数据,也为了今天的人工智能发展打下了基础。而软件正把一个数字化的世界用计算的方法驱动,用近乎光速的速度来推动人类社会方方面面的进程。
于是今天,再基于大数据、大计算、强算法的积累之上,人类在软件、工程方面又有了一个新的颠覆式的创新——机器学习。
今天,越来越多的软件的本质是非常大、非常深的模型,包括统计模型、符号逻辑模型、知识图谱等等。由于数据量越来越大、计算力越来越强、算法越来越优秀,到最后,这些模型能够自动生成越来越智能软件,而随着软件越来越智能,又反过来推动数据、计算、算法的发展,这里面有着一个正向的循环。
而随着机器学习、人工智能的不断发展,我们也正慢慢从30年的数字化世界走向一个语义表达的世界。
目前各式各样人工智能的算法,都在帮助我们进行这样的一个转换——这样一个非线性的、从一个空间转到另外一个空间的转换。
过去,机器只擅长用计算机的方式加加减减,但是现在,在语义表达的世界里,计算机能够完成很多原来是人的智能才能做的事情,包括识别、检测、分别、推理、决策、分析风险等等。
二、AI驱动的新一代信息与内容平台
目前,今日头条实验室的重点研究方向包括:机器学习、计算机视觉、自然语言、语音、知识挖掘等。此外,由于今日头条的系统非常大,因此他们对于分布式系统、以及将来的数据中心业务都非常看重。
作为“人工智能驱动的新一代信息与内容平台”,今日头条有机会紧密连接到信息创作的源头,在这个源头各式各样的作者,包括机构媒体、自媒体、甚至包括每个人,他们天天都在创造出各式各样的内容。
借着个性化信息流的推荐,今日头条可以将内容分发到所有海量用户,上图就是今日头条的人工智能如何附能这个过程中的每一环节,每一条线都代表了某一个人的个性化信息流。
与此同时,每个环节也需要用人工智能进行过滤,把更高质量的内容筛选出来,帮助今日头条根据用户的画像来分发他所喜欢的内容、更好地交流互动产生信息,把每一位信息的获取者也变成信息的分享者创作者。
三、今日头条实验室的“AI黑科技”
目前,今日头条上的内容已经涵盖了新闻、文章、图片、视频、直播、问答,将来还有AR、VR等多种形态,内容形态的多种多样自然也会对AI应用的多种多样提出了挑战。
1)基于智能算法的内容分发
自公司创立以来,今日头条最为核心的技术就是智能算法——它是一个规模非常大的机器学习矩阵,在特征向量纬度上已经到TB级,用户也是TB级,是TB乘以TB的算法。
此外,今日头条最近也开始涉足更多的最新学术进展——比如用来打造AlphaGo的生成对抗网络、深度强化学习、多模态融合等,希望打造一个全新的方向,用一个将今日头条上的文字、语音、视频、图像融合一起学习。
2)自然语言处理
通过自然语言处理技术,有朝一日人工智能在阅读理解方面几乎能做到与人一样,这是今日头条对内容进行分类、筛选的重要技术之一,也是从数字化时代走到语义化时代的核心技术之一。
3)图像风格转化及生成
除了自然语言之外,图像也是人工智能应用的重头戏。目前今日头条的AI技术可以做到在手机端实时处理图片,比如图像风格转换,在抖音视频和火山视频里,今日头条的AI技术可以做到视频内容实时切割,切割出头发的部分可以染发、切割出背景的部分可以更换背景。
此外,今日头条的AI还可以做到人体动作的实时检测,可以应用在抖音等产品里,做出类似跳舞机的有趣应用。
而最为黑科技的则当属这个“利用生成网络做图像生成”,左边是这张人脸照片的原图,右边是利用生成对抗网络做出的图片,从一个原来没有微笑脸,转换成有微笑的脸,看起来非常的自然。
4)体育视频理解
体育视频理解是今天头条非常看重的领域之一,因为今日头条的平台上有非常多的体育类视频,今日头条希望能通过人工智能,实现对视频的实时理解解说,并为粉丝提供更多个性化的服务——比如提供更多他想看的片段。将来AI+体育有着非常大的机会。
5)写稿机器人
在过去一年里,头条平台上很多体育播报都是由今日头条的写稿机器人——小明——所撰写的。它每天读“很”多内容,综合网上的文字描述理解、图片理解、视频理解,最终能够自动生成一个内容,每天分发给对某一类产品感兴趣的读者。
小明机器人不但是在写体育、财经等领域的报道,在房地产等另外一些垂直类领域的报道上也有不俗表现,用户的反馈很不错,在机器写作、机器创作方面,AI有着非常大的潜力和机会。
四、“非常幸运”的今日头条
马维英认为,人工智能有五个非常重要的核心竞争力:
1、大数据:由于今日头条拥有非常丰富的大量数据,包括文字、图片、视频、直播、问答等等,这些都成为了人工智能的原料。
2、大用户:由于用户非常活跃,产生大量反馈数据,才能让今日头条有机会利用二次数据不断优化改善算法。
3、多应用场景:众多不同的应用场景能够为今日头条提供众多AI落地的实验机会。
4、大计算:随着计算力的不断发展,如今广泛使用的深度神经网络所需要的计算量在以前甚至是不敢想象的。
5、人才:这一点不用多说,人工智能仍是一个快速发展的前沿学科,各大企业都在争夺高端人才。
在整个演讲环节中,马维英经常提到的一个词是“非常幸运”,他说,在今日头条这家公司里面,作为一个AI研究人员,他们拥有迫切所需要的所有资源,并且能够将AI应用在创作、分发、消费、互动等每一个环节,重新定义信息与内容平台。