关于我们


关于我们

Gmail靠TensorFlow快速开发ML模型,每天多删除1亿则垃圾邮件

日期:2019-05-16 16:27浏览次数:

Google近日公开Gmail通过自主机器学习框架TensorFlow,提升垃圾邮件侦测能力,每天多删除了1亿则垃圾邮件的成果,尽管Google现有的机器学习模型,加上其他保护服务,能够阻挡Gmail收件箱中99.9%以上的垃圾邮件、钓鱼邮件,或是恶意软件,Google还在持续改善机器学习模型,提升安全防护,因此,Gmail最近借由ML框架TensorFlow,集成现有的机器学习模型和rules-based的保护机制,成功地找出少于0.1%的遗漏垃圾邮件。

Gmail靠TensorFlow快速开发ML模型,每天多删除1亿则垃圾邮件

Google表示,Gmail每个月有15亿名用户使用,其中有500万人是G Suite的企业用户,不管是对消费者或是企业来说,Gmail很大的卖点即是内置的安全保护机制,好的安全管理意味着持续领先于威胁,而Google是从哪边发现这些额外的1亿则垃圾邮件? Google指出,过去一些难以侦测的垃圾邮件种类,现在通过TensorFlow的协助,能够找出这些隐藏垃圾消息的邮件,像是以图像为主的邮件、隐藏嵌入内容的邮件,或是来自创业公司建domain的邮件等。

Google指出,机器学习技术可以从大量的垃圾邮件数据中,抓出人类无法发现的特征,也能够快速地应对不断推陈出新的垃圾邮件,通过机器学习,能够使Google根据多种不同因素,做出更细化的决策,每封邮件都含有上千个潜在的信号,只出现一些特征符合常见的垃圾邮件特征,并不代表该邮件就是垃圾邮件,而机器学习则是让Google能够综合评估每一个特征,再做出决定,最后,机器学习方法还能帮助Google打造个性化的垃圾邮件保护,每个人对邮件的看法不同,有些信件会被认为是垃圾邮件,也可能被认定为重要邮件,像是新闻电子报订阅邮件,或是应用程序的邮件通知。

借由机器学习框架TensorFlow,Google可以不断ML优化模型,并且可以花更少心力于ML框架,聚焦在侦测垃圾邮件的工作上, 由于大规模布署机器学习模型是一项复杂且耗时的工作,TensorFlow框架提供多种工具,让机器学习执行的过程更加简单且有效率,举例来说,TensorBoard能够让开发者全面地监督模型训练流程,以及快速评估新模型的性能,也因为通过TensorFlow框架,Google能够一次训练和测试多个不同的ML模型,使开发最佳模型的工作变得更加有效率。