添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

驱动 AI 产业「第二增长曲线」,清华系 RealAI 发布首个企业级隐私保护机器学习平台与升级版 AI 模型杀毒软件

摘要

RealAI 的目标就是补全 AI 原生基础设施体系,提供服务于不同行业的业务产品和解决方案,使得所有场景不论大小、不论价值高低,都能够从 AI 赋能中受益,让 AI 更高质量的服务于人类社会。

12 月 9 日,由清华大学人工智能研究院、北京智源人工智能研究院、北京瑞莱智慧科技有限公司联合主办的「2020 第三代人工智能产业论坛暨瑞莱智慧 RealAI 战略发布会」在北京召开。清华大学人工智能研究院院长、中科院院士张钹,清华大学教授、中科院院士王小云,清华大学教授、安全人工智能创新中心主任朱军、北京智源人工智能研究院院长黄铁军,清华大学技术转移研究院院长王燕、瑞莱智慧 RealAI CEO 田天等出席大会。

本次会议上,瑞莱智慧 RealAI 旗下两款第三代 AI 新品——隐私保护机器学习平台 RealSecure 和人工智能安全平台 RealSafe2.0 版本正式发布。此次新品发布,标志着 RealAI 首次正式展示其基于「第三代人工智能技术」手段所描画的 AI 原生基础设施蓝图,RealAI 将不断深耕人工智能基础设施建设,发展 AI 产业「第二增长曲线」,致力人工智能成为新时代动力基础。

突破三大「关卡」打造 AI 原生基础设施

人工智能想要成为新时代的「水和电」,成为驱动各行业升级的底层通用能力,依赖于完备的 AI 基础设施。瑞莱智慧 RealAI CEO 田天表示,继承自互联网时代的经验,当前 AI 基础设施建设的重心集中在数据中心、算力平台上,主要解决 AI「温饱」问题,为 AI 提供基础运算环境。但随着数据积累受场景限制、现有算力逼近极限,由大数据、大算力等外部驱动力带来的 AI 产业「第一增长曲线」开始放缓。

由内打破才是增长。伴随智能化的脚步迈入产业纵深,AI 基础设施建设亟需从自身底层能力增强出发,发展出数据和算力维度外的全新能力,以「内生驱动力」打造 AI 原生基础设施,保证相同的数据、算力条件下,更好的支撑 AI 赋能行业的深度应用,打开 AI 产业化全新市场空间,驱动产业第二增长曲线。

想要加强 AI 内生驱动力需突破三大「关卡」。第一关是算法关,保证算法决策的可靠与安全。田天解释,智能化时代下,AI 的决策逻辑和链路天然存在大量不确定性,缺乏可解释性,难以被应用于高价值决策场景。另外,算法普遍存在的「对抗样本」特征导致 AI 系统存在被恶意攻击的风险。

第二关是数据关,保障数据隐私和安全。在训练 AI 模型时,数据的简单明文传输和利用容易导致隐私泄露。与此同时,为 AI 应用打破数据孤岛的过程中,数据用途和用量难以保障,可能被滥用和复制,同时难以界定收益,确保所有者的权益。

最后是应用关,即 AI 应用场景的管控。比如信贷模型中「幸存者偏差」、人脸识别的种族歧视等一系列算法公平性问题的出现,以及技术滥用引发金融欺诈,甚至是政治宣传引导舆论等等。

要突破「三大关卡」,AI 原生基础设施需要实现三大块能力,分别是算法可靠、数据安全和应用可控,以实现对现有 AI 平台升级赋能,拓展 AI 在各类场景上的可用性。田天认为,这是现阶段人工智能产业需求,也是产业目标。从能力实现来看,这三项能力是完全区别于数据、算力所带来的能力提升,将原本二维的能力增长拓展到全新空间,打开全新维度的能力增长。

始于底层技术栈勾画 AI 基础设施建设蓝图

打造 AI 原生基础设施是一个「高目标」,第三代人工智能技术框架则为其提供了实现可能性。作为孵化自清华人工智能研究院、以技术为本的企业,RealAI 深耕安全、可靠、可信和可扩展的第三代人工智能,依托贝叶斯深度学习、可解释机器学习、AI 安全对抗攻防、新一代知识图谱、隐私保护机器学习等底层技术栈,围绕算法可靠、数据安全和应用可控三方面勾画出 AI 基础设施建设蓝图,其中包括可解释机器学习建模平台 RealBox、人工智能安全平台 RealSafe 以及深度伪造检测工具 DeepReal 等一系列平台产品。  本次战略发布会上,RealAI 重点发布了两款产品:隐私保护机器学习平台 RealSecure 和人工智能安全平台 RealSafe2.0 版本。

为解决 AI 应用过程中的数据孤岛难题,隐私保护机器学习被学术界与产业界公认为是一条可行之路。但由于隐私保护机器学习与传统机器学习并非同属一个技术生态,企业想要搭建隐私保护生态面临着性能差、易用性差、黑盒协议等诸多难题。

RealAI 通过融合密码学、分布式等多个技术体系推出了 RealSecure 隐私保护机器学习平台(RSC),这是业内首款隐私保护 AI 编译器,首创以底层数据流图的视角揭示机器学习算法与对应分布式隐私保护算法的联系,同时将隐私保护算法公式表达向更细颗粒度解构至「算子」级别,通过算子组合将机器学习生态与隐私保护机器学习生态一脉打通,实现两大生态的一体化。

与传统处理方式相比,RSC 更多是扮演「编译器」的功能,将机器学习算法一键编译成隐私保护机器学习算法。得益于底层编译级的能力,RSC 具备三大性能优势:

• 一是训练速度实现 30 倍以上提升。这源于两点,在加密算法方面,革命性应用全同态技术,打破半同态技术功能与性能上的桎梏,性能提升 2-3 个数量级;在 AI 算法优化方面,收敛速度更快,迭代次数少。

• 二是白盒可验证的安全性。RealSecure 以首创数据流图形式将所有中间计算过程安全透明的展现给用户,内部算子执行完全公开,实现安全透明的隐私保护通讯协议。

• 三是易用性,无需繁琐改写,处理方式由「雕版印刷」转变为「活字印刷」。

性能的提升让 RealSecure 成为最可商用的企业级隐私保护机器学习平台。当传统方法还只在通过堆人力来打通不同的数据源,RealSecure 已经实现了「高速公路」级别的节点链接,支付、消费、税务、交通、司法、运营商等大数据能够更快更安全的互联互通,反欺诈、小微普惠、AI 医疗等智慧决策真正得以落地。

RealSafe 则是为解决人工智能安全隐患而生,它是世界首款商业化 AI 安全平台、业内首个针对人工智能模型的杀毒软件。针对「对抗样本」「后门植入」等攻击方式,RealSafe 一方面能够对模型的安全性进行全面检测,且整个检测过程全界面化操作,用户无需具备专业的模型安全算法知识和编程开发经验;另一方面提供多种增强安全性的方案,并且可以自动化评估每种方案针对被测模型的安全性提升效果。

RealSafe2.0 版本在前一版本基础上,安全检测能力进行了全面升级:首先是可评测的应用场景全面拓宽,从应用最广泛的人脸识别模型拓展到了目标检测、图像分类模型;同时,在检测抗对抗样本攻击的安全性基础上,新增针对图像分类模型的后门自动化检测。除此之外,RealSafe2.0 版本也提供了安全性提升方案,包括对抗样本去噪方法、对抗样本检测方法、对抗训练方法。

目前,RealSafe 已在工信部重大建设项目以及某电网公司落地应用,未来将集成更多安全风险的检测能力,在此基础上,瑞莱智慧 RealAI 致力于打造第三方人工智能安全检测平台,探索无须人工干预地、自动化地训练出具有高安全性模型的技术方案。

打开人工智能产业 第二增长曲线

田天介绍道,「这一系列 AI 原生基础设施可以打开 AI 能力的全新维度,激发 AI 的第二增长曲线,为 AI 赋能各行各业带来全新市场机会。比如:让金融场景在合规、隐私保护的前提下,显著提高智能风控、反欺诈、精准营销等应用的效果;使智慧理财产品风险可控,提高资产配置和利用效率;提供更加安全、受保护的刷脸支付系统;帮助公共安全部门提高对各个渠道虚假内容的管控能力,防范相应传播风险等。」

发布会最后,田天表示,不同于碰到应用中的难题时,见一个解决一个,修修补补,RealAI 一直坚持推动底层技术变革,发现一个问题就看到一类问题,并通过底层框架、平台和方法论的突破,助力产业的整体升级。据他介绍,本次新发布的两款产品就是这一理念的典型代表,无论是产品定位,还是功能价值都是 RealAI 首创。

田天表示,RealAI 的目标就是补全 AI 原生基础设施体系,提供服务于不同行业的业务产品和解决方案,使得所有场景不论大小、不论价值高低,都能够从 AI 赋能中受益,让 AI 更高质量的服务于人类社会。