阿里云安全研究成果入选人工智能顶级会议 IJCAI 2019, 业界首次用AI解决又一难题!
8月10日至8月16日,国际人工智能组织联合会议IJCAI 2019(International Joint Conference on Artificial Intelligence 2019)在中国澳门召开。阿里云4篇AI研究论文在诸多论文中脱颖而出,其中一篇被主论坛收录,三篇被AIBS Workshop 收录。论文深入解析了AI技术在网络安全、数据安全和内容安全领域研究成果和场景化应用,展示了阿里云安全在智能安全领域的领导性。
自1969年首次在华盛顿特区举办以来,IJCAI已成为人工智能领域最重要的顶级学术会议之一。每年被IJCAI成功收录的论文均是AI领域最前沿的研究成果。今年IJCAI主论坛的论文收录率仅为17.9%,比去年收录率更低。阿里云被主论坛收录的论文《Locate Then Detect:Web Attack Detection via Attention-based Deep Neural Networks》,首次解决了深度学习在Web攻击检测领域的结果可解释性问题,具有前所未有的创新意义,证明阿里云在安全AI技术的学术研究和应用方面业界领先。
《Locate Then Detect:Web Attack Detection via Attention-based Deep Neural Networks》(Tianlong Liu, Yu Qi, Liang Shi, Jianan Yan),即基于注意力机制的深度神经网络在Web攻击检测中的应用。

该论文提出了一种全新的两段式Web攻击检测框架,称之为Locate-Then-Detect(LTD)。LTD模型结合了Object Detection和注意力机制的思想,创造性的提出了PLN(Payload Locating Network 攻击载荷靶向定位网络)与PCN(Payload Classification Network 攻击载荷分类网络),通过两个深度神经网络的结合,可以准确的定位恶意攻击所在的位置,并对其类型进行精准识别。PLN用来定位攻击向量的可疑位置,PCN再对识别出的可疑向量进行分类,通过靶位识别网络的提取能力,能够使得检测系统更加关注真正有害的攻击,从而规避掉整个请求内容中正常部分对模型预测结果的影响。
LTD首次解决了深度学习在Web攻击检测领域的结果可解释性问题(通过Payload的靶向定位实现),同时在与其他传统方式的对比中,LTD也表现出超过了基于规则、符号特征和传统机器学习方法的效果。目前,LTD检测框架已通过AI内核的形式实际应用阿里云Web应用防火墙产品当中,通过AI内核的加持,为云上客户提供实时的智能防护,保障云上用户安全。
被AIBS Workshop Paper(Artificial Intelligence for Business Security)收录另外三篇论文主题均聚焦在AI技术在云安全的最新研究成果和应用,分别为《Multi-strategy Integration Architecture for Pornographic Web Site Detection》、《Insider Threat-Data Exfiltration Detection using Node2Vec in Instant Message》、《Webshell Detection with Attention-Based Opcode Sequence Classification》。
《Multi-strategy Integration Architecture for Pornographic Web Site Detection》(Yu Pang),即基于多策略融合的色情风险检测模型。
随着互联网的不断发展,违禁风险内容也不断增加,如暴力、色情、种族歧视等,因此,必须建立一个功能强大的能够识别和屏蔽该类风险的检测模型。该论文针对该问题提出了一个基于多策略融合的色情网站风险检测模型。与其他商业化场景中主要使用的基于网站内容的检测模型(如关键字检测或黑名单检机制等)不同,该方法融合文本特征、结构内容特征和语义特征构造检测模型。实验结果表明,该模型在精度和F1评分上都优于其他风险检测模型。
《Insider Threat-Data Exfiltration Detection using Node2Vec in Instant Message》(Xiaoyu Tang, Jie Chen),即内部威胁检测:基于Node2Vec的数据泄漏检测模型。
数据是很多公司的核心资产,包括但不限于公司的未来规划、交易数据、员工个人信息数据、客户数据等等,内部员工导致数据泄漏是代价最高而且最难以检测的,一方面内部员工本身可能拥有公司的多种权限,能够接触到大量的敏感数据;另一方面由于公司内部,和外部客户的数据交流经常会使用即时通讯工具进行,即时通讯工具可能被一些员工用来做敏感数据备份或者是数据外移的工具。因此,在即时通讯工具层面做数据安全防护是有意义且必要的。传统上在即时通讯工具上进行用户行为异常检测是使用一些统计规则,以及统计数据,这种方式由于需要更多人为经验去进行特征抽取,召回率和准确率都不高。经过分析和调研,本文发现可疑用户在即时通讯工具中传输文件会产生和正常用户不同的文件网络结构,据此,我们提出利用Node2Vec检测异常的文件传输结构的方法,能够完成自动化的进行特征抽取,并且在准确和召回上都有比较好的表现效果。
《Webshell Detection with Attention-Based Opcode Sequence Classification》(Wei He, Yue Xu, Liang Shi),即基于注意力机制Opcode序列的Webshell检测。
近年来,越来越多的Web应用程序迁移到云平台上,它们可能包含严重的Webshell或者由于存在漏洞而被植入了Webshell。但是针对Webshell的检测存在一些挑战,因为Webshell通常在恶意和正常文件之间没有明确的界限。例如,WordPress中的上传插件和管理员维护页面的功能与恶意Webshell非常相似,另一方面,许多Webshell为了绕过各种检测手段模拟成正常脚本的形态。因此,一个可靠的检测器应该以低误报率区分Webshell和普通Web脚本。本文提出了一种基于操作码序列检测的方法,我们建立了一个序列分类模型来预测恶意Webshell的概率。此方法不处理PHP脚本的模糊部分,而是处理执行时的实际机器代码。利用具有注意机制的BiLSTM来学习和识别操作码序列。通过超过30,000个样本的评估,实验结果表明我们的方法达到了F1=98.78%和AUC=99.97%,超过了其他检测模型。由于具有良好的准确性和多功能性,我们的方法可以用作常见的Webshell检测中,而不仅仅是PHP Webshell。
阿里云目前服务中国40%的网站,为上百万客户提供基础安全防御。每天由阿里云成功抵御的大流量DDoS攻击占全国的一半以上。丰富的实践经验为阿里云的学术研究提供了有利条件,最前沿的研究成果反哺产品及攻防实践,为客户提供更加智能的安全产品和服务,以保障千万企业云上安全。
本文作者:云安全专家
本文为云栖社区原创内容,未经允许不得转载。
阿里云安全研究成果入选人工智能顶级会议 IJCAI 2019, 业界首次用AI解决又一难题!的更多相关文章
- 人工智能顶级会议最佳论文里的“DaDianNao”是什么鬼?
最近对人工智能领域的 AI 加速芯片感兴趣,在翻阅 Google 的第一代 TPU 论文时,在相关工作中看到了 DaDianNao,PuDianNao,ShiDianNao.看的我一脸懵逼,这是什么? ...
- 网易云安全两篇论文入选计算机视觉顶级会议ICCV
本文由 网易云发布. 10月22日至29日,全球计算机视觉顶尖专家们共聚威尼斯,参加ICCV2017国际计算机视觉大会,就领域内最新成果展开集中研讨,大会论文集也代表了计算机视觉领域最新的发展方向和 ...
- 华为云的研究成果又双叒叕被MICCAI收录了!
摘要:2020年国际医学图像计算和计算机辅助干预会议(MICCAI 2020),论文接收结果已经公布:华为云医疗AI团队和华中科技大学合作的2篇研究成果入选. 语义/实例分割问题是近年来医学图像计算领 ...
- 【云安全与同态加密_调研分析(4)】云计算安全领域主要研究成果——By Me
下表列举了在云安全问题研究表现突出的ICT公司和研究机构以及其在云计算安全方面主要研究成果: ◆ICT公司和研究机构(云计算安全领域主要研究成果)◆ ◆机构名称◆ ◆机构类别◆ ◆主要研究成果◆ ◆备 ...
- 在计算机视觉与人工智能领域,顶级会议比SCI更重要(内容转)
很多领域,SCI是王道,尤其在中国,在教师科研职称评审和学生毕业条件中都对SCI极为重视,而会议则充当了补充者的身份.但是在计算机领域,尤其是人工智能与机器学习领域里,往往研究者们更加青睐于会议 我无 ...
- 计算机顶级会议Rankings && 英文投稿的一点经验
英文投稿的一点经验[转载] From: http://chl033.woku.com/article/2893317.html 1. 首先一定要注意杂志的发表范围, 超出范围的千万别投,要不就是浪费时 ...
- zz姚班天才少年鬲融凭非凸优化研究成果获得斯隆研究奖
姚班天才少年鬲融凭非凸优化研究成果获得斯隆研究奖 近日,美国艾尔弗·斯隆基金会(The Alfred P. Sloan Foundation)公布了2019年斯隆研究奖(Sloan Research ...
- 阿里BCG重磅报告《人工智能,未来致胜之道》
阿里BCG重磅报告<人工智能,未来致胜之道> 阿里云研究中心.波士顿咨询公司以及Alibaba Innovation Ventures合作共同推出的<人工智能:未来制胜之道>这 ...
- AI顶级会议以及期刊
AI顶级会议以及期刊 Upcoming Top Conferences NIPS 2009 UAI 2009 ICML 2009 COLT 2009 AISTATS 2009 CVPR 2009 IC ...
随机推荐
- 阿里云图数据库GraphDB上线,助力图数据处理
GraphDB简介 GraphDB图数据库适用于存储,管理,查询复杂并且高度连接的数据,图库的结构特别适合发现大数据集下数据之间的共性和特性,特别善于释放蕴含在数据关系之间的巨大价值.GraphDB引 ...
- hibernate_01_SSH环境搭建
1.maven工程pom.xml文件 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="h ...
- (转)JS的splice()方法在for循环中的使用问题
在写JS代码时,我们常常使用 splice 函数来删除数组中的元素,因为 splice 函数会直接对数组进行修改,从而不需再自己写一个算法来移动数组中的其他元素填补到被删除的位置.splice 功能十 ...
- 基础数据类型补充 set集合 深浅拷贝
一.基础数据类型补充 1. "拼接字符串".join(可迭代对象) 可迭代对象为列表时,输出列表元素与拼接字符串的拼接 li = ['张三', '李四', '王五', '赵四'] ...
- iis网站域名绑定
这里解释两种绑定 一.全局ip未分配 二.绑定指定域名 1.添加主机名 注释:没有绑定主机名的进站默认就会被访问.绑定主机名的进站访问特定主机名的网站.
- Hive学习笔记简版
一.概述 1. Hive是Apache提供的基于Hadoop的数据仓库管理工具2. Hive提供了类SQL语言来操作Hadoop,底层会将SQL转化为MapReduce来执行,所以效率会比较低3. H ...
- 一个简单的基于Tornado二手房信息统计项目的开发实现
Purpose 最近因为要买房子,扫过了各种信息,貌似lianjia上的数据还是靠点谱的(最起码房源图片没有太大的出入),心血来潮想着做几个图表来显示下房屋的数据信息,顺便练练手. 需求分析 1从li ...
- scull 中的设备注册
在内部, scull 使用一个 struct scull_dev 类型的结构表示每个设备. 这个结构定义为: struct scull_dev { struct scull_qset *data; ...
- 洛谷P2325 [SCOI2005]王室联邦
P2325 [SCOI2005]王室联邦 题目描述 "余"人国的国王想重新编制他的国家.他想把他的国家划分成若干个省,每个省都由他们王室联邦的一个成员来管理. 他的国家有n个城市, ...
- 简单搭建 @vue-cli3.0 及常用sass使用
1,在安装了Node.js后使用其中自带的包管理工具npm.或者使用淘宝镜像cnpm(这里不做说明) 1-1,下载vue3.0脚手架(如果之前装vue-cli3x之前的版本,先卸载 npm unins ...