热点:

    深度学习时代已到来 Facebook是如何使用AI

      [  中关村在线 原创  ]   作者:常京坡

        据国外媒体报道,Facebook的20亿用户中,大多数人都不知道这项服务在多大程度上依靠人工智能来运作。

        Facebook的产品,如新闻推送、搜索和广告使用机器学习,在幕后,它提供诸如面部识别和标签、语言翻译、语音识别、内容理解和异常检测等服务,以发现虚假账户和令人反感的内容。

        数字是惊人的。总而言之,Facebook的机器学习系统每天处理200多亿次预测和5亿次翻译。Facebook的算法每天自动删除数百万个假账户。

        在今年的国际计算机架构研讨会(ISCA)的一次主题演讲中,Facebook AI基础设施集团的负责人金哈泽尔伍德博士解释了该服务是如何设计硬件和软件来处理这种规模的机器学习的。她还敦促硬件和软件架构师超越炒作,开发机器学习的“全栈解决方案”。哈兹伍德说:“重要的是,我们要解决正确的问题,而不仅仅是做别人正在做的事情。”

        Facebook的人工智能基础设施需要处理各种各样的工作负载。有些模型可能需要几分钟的时间来训练,而另一些则需要几天甚至几周的时间。例如,新闻提要和广告使用的计算资源比其他算法多100倍。因此,只要有可能,Facebook就会使用“传统的老式机器学习”,而且只需要深入学习——多层感知机(MLP)、卷积神经网络(CNN)和反复出现的神经网络(rnn/lstm)——在绝对必要的时候。

        该公司的人工智能生态系统包括三个主要组成部分:基础设施、运行在上面的工作流管理软件,以及像PyTorch这样的核心机器学习框架。

        自2010年以来,Facebook一直在设计自己的数据中心和服务器。今天,它运营着13个大型数据中心——10个在美国,3个在海外。并不是所有的这些都是相同的,因为它们是随着时间的推移而构建的,并且它们不提供相同的数据,因为“你能做的最糟糕的事情就是在每个数据中心复制所有的数据。”尽管如此,哈兹伍德说,每个季度公司都“拔掉了整个Facebook数据中心”,以确保连续性。数据中心的设计是为了处理高峰负荷,这使得大约一半的舰队在一天的时间里处于空闲状态,这是可以用来进行机器学习的“自由计算”。

        Facebook没有使用单一服务器,而是在生产中花费了数百个工作负载,将它们放入桶中,并为每种类型设计了定制服务器。这些数据存储在布莱斯峡谷和Lightning存储服务器中,培训在大型盆地服务器上进行,这些服务器都是Nvidia Tesla gpu,这些模型都是在双湖单插座和Tioga通过双插槽Xeon服务器上运行的。Facebook继续对谷歌的TPU和微软的BrainWave fpga等专业硬件进行评估,但哈泽尔伍德表示,太多的投资都集中在计算上,而在存储方面,尤其是网络上的投入不足,这与Amdahl的法律相一致,可能会成为许多工作负载的瓶颈。她补充说,人工智能芯片创业公司没有把足够的精力放在软件堆栈上,这给机器学习工具和编译器留下了很大的机会。

        深度学习时代已到来 Facebook是如何使用AI
    Facebook深度学习流程(图片来自ZDNet

        Facebook自己的软件堆栈包括fb学习者,这是一套三种管理和部署工具,专注于机器学习管道的不同部分。fb学习者存储是用于数据操作和特征提取的,fb学习者流用于管理培训中涉及的步骤,而fb学习者的预测是在生产中部署模型。我们的目标是让Facebook的工程师们变得更有效率,专注于算法设计。

        Facebook在历史上曾使用过两种机器学习框架:用于研究的PyTorch和用于生产的咖啡因。

        基于python的PyTorch更容易使用,但咖啡因可以带来更好的性能。问题是,将模型从PyTorch转移到咖啡因的生产过程是一个耗时且有缺陷的过程。上个月,在F8开发者大会上,Facebook宣布,它已经“将其内部合并,这样你就能获得PyTorch和PyTorch 1.0的外观和感觉”,哈兹伍德说。

        这是ONNX(开放神经网络交换)的逻辑第一步,这是Facebook、Amazon和Microsoft的一项努力,目的是创建一种开放格式,以优化在不同框架中构建的深度学习模型,以便在各种硬件上运行。我们面临的挑战是有很多框架——Google TensorFlow、微软的认知工具包和Apache MXNet(亚马逊支持)——这些模型需要运行在各种不同的平台上,比如苹果ML、Nvidia、英特尔/神经紧张和高通的Snapdragon神经引擎。

        在edge设备上运行模型有很多很好的理由,但手机尤其具有挑战性。世界上许多地方仍然很少或根本没有连接,世界上超过一半的人使用的是2012年或更早的手机,他们使用各种各样的硬件和软件。哈兹伍德说,今天的旗舰手机和中值手机之间的性能差距大约是10倍。她说:“你不能想当然地认为,你在设计移动神经网络的每个人都在使用iPhone X。”“我们在美国是非常反常的。”Facebook的Caffe2 Go框架旨在压缩模型来解决其中的一些问题。

        深度学习时代已经到来,哈兹伍德说,有很多硬件和软件问题需要解决。行业花费大量的时间和金钱建设更快的硅,但她说,我们需要平等的投资在软件引用Proebsting定律,编译器的进步只计算性能每18年翻一番,“请记住我们不结束与另一个安腾情况,“Hazelwood开玩笑说,他指的是英特尔的non-defunct ia - 64体系结构。哈兹伍德说,真正的机会在于解决问题,没有人致力于用平衡的硬件和更好的软件、工具和编译器来构建端到端的解决方案。

    本文属于原创文章,如若转载,请注明来源:深度学习时代已到来 Facebook是如何使用AIhttp://net.zol.com.cn/690/6908340.html

    net.zol.com.cn true http://net.zol.com.cn/690/6908340.html report 4061 据国外媒体报道,Facebook的20亿用户中,大多数人都不知道这项服务在多大程度上依靠人工智能来运作。Facebook的产品,如新闻推送、搜索和广告使用机器学习,在幕后,它提供诸如面部识别和标签、语言翻译、语音识别、内容理解和异常检测等服务,以发现虚假账户和令人反感...
    • 猜你喜欢
    • 最新
    • 相关
    推荐经销商
    投诉欺诈商家: 400-688-1999
    • 北京
    • 上海
    周关注排行榜
    • 路由器
    • 交换机
    • 无线路由
    • 无线AP
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品