Kaggle "Microsoft Malware Classification Challenge"——就是沙箱恶意文件识别，有 Opcode n-gram特征 ASM文件图像纹理特征还有基于图聚类方法

使用图聚类方法:Malware Classification using Graph Clustering 见 https://github.com/rahulp0491/Malware-Classifier 代码参考:https://github.com/bindog/ToyMalwareClassification,https://github.com/xiaozhouwang/kaggle_Microsoft_Malware #微软恶意代码分类比赛说明和数据下载 https://www.…

Kaggle ： Display Advertising Challenge( ctr 预估 )

原文:http://blog.csdn.net/hero_fantao/article/details/42747281 Display Advertising Challenge ---------2015/1/12 一:背景 CriteoLabs 2014年7月份在kaggle上发起了一次关于展示广告点击率的预估比赛.CriteoLabs是第三方展示广告的佼佼者,所以这次比赛吸引了很多团队来参赛和体验数据. 二:评估指标比赛采用的评价指标是LoglLoss: 至于离线评估为何更倾向采用lo…

cdmc2016数据挖掘竞赛题目Android Malware Classification

http://www.csmining.org/cdmc2016/ Data Mining Tasks Description Task 1: 2016 e-News categorisation For this year, the dataset is sourced from 6 online news media: The New Zealand Herald (www.nzherald.co.nz), Reuters(www.reuters.com), The Times (www.t…

转载一份kaggle的特征工程：经纬度、特征构造、转化率

转载:https://www.toutiao.com/i6642477603657613831/ 1 如果训练/测试都来自同一时间线,那么就可以非常巧妙地使用特性.虽然这只是一个kaggle的案例,但可以利用这个优势.例如:在出租车出行持续时间挑战赛中,从训练数据中随机抽取测试数据.在这种情况下,可以使用不同类别变量的平均目标变量作为特征(特征转化率).在这种情况下, Beluga 实际上使用了不同工作日的平均目标变量.然后,将相同的平均值映射为一个变量,并将其映射到测试数据中. 2 loglo…

准确率99%！基于深度学习的二进制恶意样本检测——瀚思APT 沙箱恶意文件检测使用的是CNN，LSTM TODO

所以我们的流程如图所示.将正负样本按 1:1 的比例转换为图像.将 ImageNet 中训练好的图像分类模型作为迁移学习的输入.在 GPU 集群中进行训练.我们同时训练了标准模型和压缩模型,对应不同的客户需求(有无 GPU 环境). 流程中比较核心的算法其实在文件到图像的转换.因为常规的网络一般能输入的尺寸也就是 300 x 300 上下,也就是 9K 左右的规模.而病毒样本的大小平均接近 1M,是远远大于这个尺寸.图像领域的常规转换方法就是缩放,或者用 pyramid pooling.这两者我…

Pftriage：分析和追踪恶意文件，识别特征

项目地址 PFTriage:https://github.com/idiom/pftriage 参考 Pftriage:如何在恶意软件传播过程中对恶意文件进行分析 https://www.freebuf.com/sectool/196074.html…

未能写入输出文件“c:\Windows\Microsoft.NET\Framework\v4.0.30319\Temporary ASP.NET Files\web\4b49f661\23a749fc\App_Web_default.aspx.cdcab7d2.zii776dc.dll”--“拒绝访问。 ” 解决方法:

解决方法: 找到C:\Windows\Temp 目录,在其属性->安全->编辑->添加 IIS_IUSERS用户赋予"完全控制"权限 ...注意:这可能不是最佳方案,如果有其他方法或赋予IIS_IUSERS用户 "完全控制"权限,会有其他什么隐患呢?请大家指出一下..…

中文版 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 摘要最先进的目标检测网络依靠区域提出算法来假设目标的位置.SPPnet[1]和Fast R-CNN[2]等研究已经减少了这些检测网络的运行时间,使得区域提出计算成为一个瓶颈.在这项工作中,我们引入了一个区域提出网络(RPN),该网络与检测网络共享全图像的卷积特征,从而使近乎零成本的区域提出成为可能.RPN是一个全卷积网络,可以同时在每个位…

论文翻译：2018_Source localization using deep neural networks in a shallow water environment

论文地址:https://asa.scitation.org/doi/abs/10.1121/1.5036725 深度神经网络在浅水环境中的源定位摘要: 深度神经网络(DNNs)在表征复杂的非线性关系方面具有优势.本文将DNNs应用于浅水环境下的源定位.提出了两种方法,通过不同的神经网络结构来估计宽带源的范围和深度.第一阶段采用经典的两阶段方案,特征提取和DNN分析是两个独立的步骤;与模态信号空间相关联的特征向量被提取为输入特征.然后,利用时滞神经网络对长期特征表示进行建模,构建回归模型;第二…

转载：LBP的初步理解

转自http://blog.csdn.net/ty101/article/details/8905394 本文的PDF版本,以及涉及到的所有文献和代码可以到下列地址下载: 1.PDF版本以及文献:http://download.csdn.net/detail/ty101/5349816 2.原作者的MATLAB代码:http://download.csdn.net/detail/ty101/5349894 LBP一种用来描述图像纹理特征的算子,该算子由芬兰奥卢大学的T.Ojala等人在1996年…

A simple test

博士生课程报告视觉信息检索技术博士生:施智平指导老师:史忠植研究员中国科学院计算技术研究所 2005年1月目录第1章基于内容的多媒体检索技术综述 3 第2章图像特征的提取与表达 9 2.1 颜色特征的提取 9 2.2 纹理特征的提取 12 2.3 形状特征的提取 15 2.4 图像的空间关系特征 19 2.5 多维图像特征的索引 20 第3章相似度量方法…

FFmpeg任意文件读取漏洞分析

这次的漏洞实际上与之前曝出的一个 CVE 非常之类似,可以说是旧瓶装新酒,老树开新花. 之前漏洞的一篇分析文章: SSRF 和本地文件泄露(CVE-2016-1897/8)http://static.hx99.net/static/drops/papers-15598.html 这个漏洞实际上也是利用了ffmpeg在处理 HLS 播放列表文件的过程中,由于支持非常多的协议,如http.file.concat等等,导致可以构造恶意的url造成 SSRF 攻击和本地文件泄露.下面这幅图介绍了整个的攻…

NLP+VS=>Image Caption︱自动生成图像标题技术论文+相关项目

读聪明人的笔记,是不是也能变聪明呢? Image Caption是一个融合计算机视觉.自然语言处理和机器学习的综合问题,它类似于翻译一副图片为一段描述文字. Image Caption问题可以定义为二元组(I,S)的形式, 其中I表示图,S为目标单词序列,其中S={S1,S2,-},其中St为来自于数据集提取的单词.训练的目标是使最大似然p(S|I)取得最大值,即使生成的语句和目标语句更加匹配,也可以表达为用尽可能准确的用语句去描述图像. Image Caption主要研究分为以下几个方向: 1…

A brief introduction to weakly supervised learning（简要介绍弱监督学习）

by 南大周志华摘要监督学习技术通过学习大量训练数据来构建预测模型,其中每个训练样本都有其对应的真值输出.尽管现有的技术已经取得了巨大的成功,但值得注意的是,由于数据标注过程的高成本,很多任务很难获得如全部真值标签这样的强监督信息.因此,能够使用弱监督的机器学习技术是可取的.本文综述了弱监督学习的一些研究进展,主要关注三种弱监督类型:不完全监督,即只有一部分样本有标签:不确切监督,即训练样本只有粗粒度的标签:以及不准确监督,即给定的标签不一定总是真值. 关键词:机器学习,弱监督学习,监督学习…

Asp.Net Core 2.0 项目实战（8）Core下缓存操作、序列化操作、JSON操作等Helper集合类

本文目录 1. 前沿 2.CacheHelper基于Microsoft.Extensions.Caching.Memory封装 3.XmlHelper快速操作xml文档 4.SerializationHelper文件序列化操作 5.JsonHelper基于Newtonsoft.Json封装 6.ByteConvertHelper byte转换操作类 7. 总结 1. 前沿 Net Core2.0以前缓存操作.XML操作文档.处理JSON.序列化等都整理过相关帮助类,方便项目全局开发调用,但这…

net core体系-web应用程序-4asp.net core2.0 项目实战（1）-10项目各种全局帮助类

本文目录 1. 前沿2.CacheHelper基于Microsoft.Extensions.Caching.Memory封装3.XmlHelper快速操作xml文档4.SerializationHelper文件序列化操作5.JsonHelper基于Newtonsoft.Json封装6.ByteConvertHelper byte转换操作类7. 总结 1. 前沿 Net Core2.0以前缓存操作.XML操作文档.处理JSON.序列化等都整理过相关帮助类,方便项目全局开发调用,但这些Helpe…

Spark MLlib 机器学习

本章导读机器学习(machine learning, ML)是一门涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多领域的交叉学科.ML专注于研究计算机模拟或实现人类的学习行为,以获取新知识.新技能,并重组已学习的知识结构使之不断改善自身. MLlib是Spark提供的可扩展的机器学习库.MLlib已经集成了大量机器学习的算法,由于MLlib涉及的算法众多,笔者只对部分算法进行了分析,其余算法只是简单列出公式,读者如果想要对公式进行推理,需要自己寻找有关概率论.数理统计.数理分析等方面的专…

net core体系-web应用程序-4asp.net core2.0 项目实战（1）-9项目各种全局帮助类

本文目录 1. 前沿2.CacheHelper基于Microsoft.Extensions.Caching.Memory封装3.XmlHelper快速操作xml文档4.SerializationHelper文件序列化操作5.JsonHelper基于Newtonsoft.Json封装6.ByteConvertHelper byte转换操作类7. 总结 1. 前沿 Net Core2.0以前缓存操作.XML操作文档.处理JSON.序列化等都整理过相关帮助类,方便项目全局开发调用,但这些Helpe…

AI时代的OCR识别技术浅析

人工智能这个词可谓是耳熟能详,近几年人工智能热潮再次席卷而来,引起轰动的要数google的AlphaGo,相继打败了围棋界的韩国选手李世石以及世界冠军柯洁,见证了人工智能发展的里程碑式的变革,人工智能再度引起了众人的关注. (此图来自网页http://mini.eastday.com/mobile/171107214414785.html里面,如有侵权,请联系小编及时清除) 人工智能当然不止会下棋这么简单,其实在20年前,智能家居的开发就有不少团队在进行,只是切入点不对,所以一直没有什么起色,现…

一目了然卷积神经网络 - An Intuitive Explanation of Convolutional Neural Networks

An Intuitive Explanation of Convolutional Neural Networks 原文地址:https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/comment-page-4/?unapproved=31867&moderation-hash=1ac28e426bc9919dc1a295563f9c60ae#comment-31867 一.什么是卷积神经网络.为什么卷积神经网络很重要? 卷…

【计算机视觉】纹理特征之LBP局部二值化模式

转自http://blog.csdn.NET/ty101/article/details/8905394 本文的PDF版本,以及涉及到的所有文献和代码可以到下列地址下载: 1.PDF版本以及文献:http://download.csdn.net/detail/ty101/5349816 2.原作者的MATLAB代码:http://download.csdn.net/detail/ty101/5349894 LBP一种用来描述图像纹理特征的算子,该算子由芬兰奥卢大学的T.Ojala等人在1996年…

Image Processing and Analysis_8_Edge Detection：Edge and line oriented contour detection State of the art ——2011

此主要讨论图像处理与分析.虽然计算机视觉部分的有些内容比如特征提取等也可以归结到图像分析中来,但鉴于它们与计算机视觉的紧密联系,以及它们的出处,没有把它们纳入到图像处理与分析中来.同样,这里面也有一些也可以划归到计算机视觉中去.这都不重要,只要知道有这么个方法,能为自己所用,或者从中得到灵感,这就够了. 8. Edge Detection 边缘检测也是图像处理中的一个基本任务.传统的边缘检测方法有基于梯度算子,尤其是 Sobel 算子,以及经典的 Canny 边缘检测.到现在,Cann…

Airbnb新用户的民宿预定结果预测

1. 背景关于这个数据集,在这个挑战中,您将获得一个用户列表以及他们的人口统计数据.web会话记录和一些汇总统计信息.您被要求预测新用户的第一个预订目的地将是哪个国家.这个数据集中的所有用户都来自美国. 目的地国家有12种可能的结果:"US"."FR"."CA"."GB"."ES"."IT"."PT"."NL"."DE".&q…

【GNN】图神经网络小结

图神经网络小结图神经网络小结图神经网络分类 GCN: 由谱方法到空域方法 GCN概述 GCN的输出机制 GCN的不同方法基于谱方法的GCN 初始切比雪夫K阶截断: ChebNet 一阶ChebNet 自适应图卷积网络AGCN 谱方法小结基于空域方法GCN 基于递归的空间GCN(Recurrent-based Spatial GCNs) 图神经网络GNN(特指早期的一种结构) 门控图神经网络(GGNN) 随机稳态嵌入SSE 基于合成的空间GCN(Composition Based Spa…

2020国防科大综述：3D点云深度学习—综述（点云形状识别部分）

目录摘要 1.引言: 2.背景 2.1 数据集 2.2评价指标 3.3D形状分类 3.1基于多视图的方法 3.2基于体素的方法 3.3基于点的方法 3.3.1 点对多层感知机方法 3.3.2基于卷积的方法 3.3.2.1 3D连续卷积网络 3.3.2.2 3D离散卷积网络 3.3.3基于图的方法 3.3.3.1 空间域中的基于图的方法 3.3.3.2 谱域中的基于图的方法 3.3.4基于层级数据结构的方法 3.3.5其他方法 3.4总结 3D点云深度学习:综述(点云形状识别部分) Deep L…

文本图Tranformer在文本分类中的应用

原创作者 | 苏菲论文来源: https://aclanthology.org/2020.emnlp-main.668/ 论文题目: Text Graph Transformer for Document Classification (文本图Tranformer在文本分类中的应用) 论文作者: Haopeng Zhang Jiawei Zhang 01 引言文本分类是自然语言处理中的基本任务之一,而图神经网络(GNN)技术可以描述词语.文本以及语料库,最近研究者将GNN应用到抓取语料库中单…

恶意代码检测工具 -- Mathematics Malware Detected Tools

Mathematics Malware Detected Tools 重要:由于缺少测试数据,部分结论可能不正确.更多更准确的结论,还需要进行大量实验. 概述 mmdt(Mathematics Malware Detected Tools)是一款基于数学方法的最简单的类"机器学习"工具.该工具通过数学方法对目标对象进行处理,生成相应的标准"指纹",通过对指纹的处理,实现"机器学习"中的"分类"."聚类"方法…

GitHub:Awesome-Hacking(黑客技能列表-恶意代码)

0 初衷 GitHub这一份黑客技能列表很不错,包含了多个方向的安全.但目前我关注只有逆向工程与恶意代码,所以其他的被暂时略过. 虽然很感谢作者的辛勤付出,但并不打算复制粘贴全套转载.逐条整理是为了从大量资源里梳理出自己觉得实用性很高的东西. <Awesome-Hacking> https://github.com/Hack-with-Github/Awesome-Hacking Awesome Hacking系列-恶意代码分析恶意软件分析:包括恶意软件收集.开源威胁情报.检测.沙箱等 ht…

机器学习&恶意代码检测简介

Malware detection 目录可执行文件简介检测方法概述资源及参考文献可执行文件简介 ELF(Executable Linkable Format) linux下的可执行文件格式,按照ELF格式编写的文件包括:.so..a等 PE(Portable Executable) windows下的可执行文件格式,按照PE格式编写的文件包括: .dll..lib..exe等参考文献[3]中对ELF的各个字段作了详细介绍 Linux和Windows可执行文件分类: ELF文件类型说明…

Otto Product Classification Winner's Interview: 2nd place, Alexander Guschin ¯\_(ツ)_/¯

Otto Product Classification Winner's Interview: 2nd place, Alexander Guschin ¯\_(ツ)_/¯ The Otto Group Product Classification Challenge made Kaggle history as our most popular competition ever. Alexander Guschin finished in 2nd place ahead of 3,845 ot…

【Kaggle "Microsoft Malware Classification Challenge"——就是沙箱恶意文件识别，有 Opcode n-gram特征 ASM文件图像纹理特征 还有基于图聚类方法】的更多相关文章

【Kaggle "Microsoft Malware Classification Challenge"——就是沙箱恶意文件识别，有 Opcode n-gram特征 ASM文件图像纹理特征还有基于图聚类方法】的更多相关文章