使用图聚类方法:Malware Classification using Graph Clustering 见 https://github.com/rahulp0491/Malware-Classifier 代码参考:https://github.com/bindog/ToyMalwareClassification,https://github.com/xiaozhouwang/kaggle_Microsoft_Malware #微软恶意代码分类 比赛说明和数据下载 https://www.…
原文:http://blog.csdn.net/hero_fantao/article/details/42747281 Display Advertising Challenge ---------2015/1/12 一:背景 CriteoLabs 2014年7月份在kaggle上发起了一次关于展示广告点击率的预估比赛.CriteoLabs是第三方展示广告的佼佼者,所以这次比赛吸引了很多团队来参赛和体验数据. 二:评估指标 比赛采用的评价指标是LoglLoss: 至于离线评估为何更倾向采用lo…
http://www.csmining.org/cdmc2016/ Data Mining Tasks Description Task 1: 2016 e-News categorisation For this year, the dataset is sourced from 6 online news media: The New Zealand Herald (www.nzherald.co.nz), Reuters(www.reuters.com), The Times (www.t…
转载:https://www.toutiao.com/i6642477603657613831/ 1 如果训练/测试都来自同一时间线,那么就可以非常巧妙地使用特性.虽然这只是一个kaggle的案例,但可以利用这个优势.例如:在出租车出行持续时间挑战赛中,从训练数据中随机抽取测试数据.在这种情况下,可以使用不同类别变量的平均目标变量作为特征(特征转化率).在这种情况下, Beluga 实际上使用了不同工作日的平均目标变量.然后,将相同的平均值映射为一个变量,并将其映射到测试数据中. 2 loglo…
所以我们的流程如图所示.将正负样本按 1:1 的比例转换为图像.将 ImageNet 中训练好的图像分类模型作为迁移学习的输入.在 GPU 集群中进行训练.我们同时训练了标准模型和压缩模型,对应不同的客户需求(有无 GPU 环境). 流程中比较核心的算法其实在文件到图像的转换.因为常规的网络一般能输入的尺寸也就是 300 x 300 上下,也就是 9K 左右的规模.而病毒样本的大小平均接近 1M,是远远大于这个尺寸.图像领域的常规转换方法就是缩放,或者用 pyramid pooling.这两者我…
项目地址 PFTriage:https://github.com/idiom/pftriage 参考 Pftriage:如何在恶意软件传播过程中对恶意文件进行分析 https://www.freebuf.com/sectool/196074.html…
解决方法: 找到C:\Windows\Temp 目录,在其属性->安全->编辑->添加 IIS_IUSERS用户 赋予"完全控制"权限 ...注意:这可能不是最佳方案,如果有其他方法 或 赋予IIS_IUSERS用户 "完全控制"权限,会有其他什么隐患呢?请大家指出一下..…
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 摘要 最先进的目标检测网络依靠区域提出算法来假设目标的位置.SPPnet[1]和Fast R-CNN[2]等研究已经减少了这些检测网络的运行时间,使得区域提出计算成为一个瓶颈.在这项工作中,我们引入了一个区域提出网络(RPN),该网络与检测网络共享全图像的卷积特征,从而使近乎零成本的区域提出成为可能.RPN是一个全卷积网络,可以同时在每个位…
论文地址:https://asa.scitation.org/doi/abs/10.1121/1.5036725 深度神经网络在浅水环境中的源定位 摘要: 深度神经网络(DNNs)在表征复杂的非线性关系方面具有优势.本文将DNNs应用于浅水环境下的源定位.提出了两种方法,通过不同的神经网络结构来估计宽带源的范围和深度.第一阶段采用经典的两阶段方案,特征提取和DNN分析是两个独立的步骤;与模态信号空间相关联的特征向量被提取为输入特征.然后,利用时滞神经网络对长期特征表示进行建模,构建回归模型;第二…
转自http://blog.csdn.net/ty101/article/details/8905394 本文的PDF版本,以及涉及到的所有文献和代码可以到下列地址下载: 1.PDF版本以及文献:http://download.csdn.net/detail/ty101/5349816 2.原作者的MATLAB代码:http://download.csdn.net/detail/ty101/5349894 LBP一种用来描述图像纹理特征的算子,该算子由芬兰奥卢大学的T.Ojala等人在1996年…
    博士生课程报告       视觉信息检索技术                 博 士 生:施 智 平 指导老师:史忠植 研究员       中国科学院计算技术研究所   2005年1月   目 录 第1章 基于内容的多媒体检索技术综述    3 第2章 图像特征的提取与表达    9 2.1 颜色特征的提取    9 2.2 纹理特征的提取    12 2.3 形状特征的提取    15 2.4 图像的空间关系特征    19 2.5 多维图像特征的索引    20 第3章 相似度量方法…
这次的漏洞实际上与之前曝出的一个 CVE 非常之类似,可以说是旧瓶装新酒,老树开新花. 之前漏洞的一篇分析文章: SSRF 和本地文件泄露(CVE-2016-1897/8)http://static.hx99.net/static/drops/papers-15598.html 这个漏洞实际上也是利用了ffmpeg在处理 HLS 播放列表文件的过程中,由于支持非常多的协议,如http.file.concat等等,导致可以构造恶意的url造成 SSRF 攻击和本地文件泄露.下面这幅图介绍了整个的攻…
读聪明人的笔记,是不是也能变聪明呢? Image Caption是一个融合计算机视觉.自然语言处理和机器学习的综合问题,它类似于翻译一副图片为一段描述文字. Image Caption问题可以定义为二元组(I,S)的形式, 其中I表示图,S为目标单词序列,其中S={S1,S2,-},其中St为来自于数据集提取的单词.训练的目标是使最大似然p(S|I)取得最大值,即使生成的语句和目标语句更加匹配,也可以表达为用尽可能准确的用语句去描述图像. Image Caption主要研究分为以下几个方向: 1…
by 南大周志华 摘要 监督学习技术通过学习大量训练数据来构建预测模型,其中每个训练样本都有其对应的真值输出.尽管现有的技术已经取得了巨大的成功,但值得注意的是,由于数据标注过程的高成本,很多任务很难获得如全部真值标签这样的强监督信息.因此,能够使用弱监督的机器学习技术是可取的.本文综述了弱监督学习的一些研究进展,主要关注三种弱监督类型:不完全监督,即只有一部分样本有标签:不确切监督,即训练样本只有粗粒度的标签:以及不准确监督,即给定的标签不一定总是真值. 关键词:机器学习,弱监督学习,监督学习…
本文目录 1.  前沿 2.CacheHelper基于Microsoft.Extensions.Caching.Memory封装 3.XmlHelper快速操作xml文档 4.SerializationHelper文件序列化操作 5.JsonHelper基于Newtonsoft.Json封装 6.ByteConvertHelper byte转换操作类 7. 总结 1.  前沿 Net Core2.0以前缓存操作.XML操作文档.处理JSON.序列化等都整理过相关帮助类,方便项目全局开发调用,但这…
本文目录 1.  前沿2.CacheHelper基于Microsoft.Extensions.Caching.Memory封装3.XmlHelper快速操作xml文档4.SerializationHelper文件序列化操作5.JsonHelper基于Newtonsoft.Json封装6.ByteConvertHelper byte转换操作类7. 总结 1.  前沿 Net Core2.0以前缓存操作.XML操作文档.处理JSON.序列化等都整理过相关帮助类,方便项目全局开发调用,但这些Helpe…
本章导读 机器学习(machine learning, ML)是一门涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多领域的交叉学科.ML专注于研究计算机模拟或实现人类的学习行为,以获取新知识.新技能,并重组已学习的知识结构使之不断改善自身. MLlib是Spark提供的可扩展的机器学习库.MLlib已经集成了大量机器学习的算法,由于MLlib涉及的算法众多,笔者只对部分算法进行了分析,其余算法只是简单列出公式,读者如果想要对公式进行推理,需要自己寻找有关概率论.数理统计.数理分析等方面的专…
本文目录 1.  前沿2.CacheHelper基于Microsoft.Extensions.Caching.Memory封装3.XmlHelper快速操作xml文档4.SerializationHelper文件序列化操作5.JsonHelper基于Newtonsoft.Json封装6.ByteConvertHelper byte转换操作类7. 总结 1.  前沿 Net Core2.0以前缓存操作.XML操作文档.处理JSON.序列化等都整理过相关帮助类,方便项目全局开发调用,但这些Helpe…
人工智能这个词可谓是耳熟能详,近几年人工智能热潮再次席卷而来,引起轰动的要数google的AlphaGo,相继打败了围棋界的韩国选手李世石以及世界冠军柯洁,见证了人工智能发展的里程碑式的变革,人工智能再度引起了众人的关注. (此图来自网页http://mini.eastday.com/mobile/171107214414785.html里面,如有侵权,请联系小编及时清除) 人工智能当然不止会下棋这么简单,其实在20年前,智能家居的开发就有不少团队在进行,只是切入点不对,所以一直没有什么起色,现…
An Intuitive Explanation of Convolutional Neural Networks 原文地址:https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/comment-page-4/?unapproved=31867&moderation-hash=1ac28e426bc9919dc1a295563f9c60ae#comment-31867 一.什么是卷积神经网络.为什么卷积神经网络很重要? 卷…
转自http://blog.csdn.NET/ty101/article/details/8905394 本文的PDF版本,以及涉及到的所有文献和代码可以到下列地址下载: 1.PDF版本以及文献:http://download.csdn.net/detail/ty101/5349816 2.原作者的MATLAB代码:http://download.csdn.net/detail/ty101/5349894 LBP一种用来描述图像纹理特征的算子,该算子由芬兰奥卢大学的T.Ojala等人在1996年…
此主要讨论图像处理与分析.虽然计算机视觉部分的有些内容比如特 征提取等也可以归结到图像分析中来,但鉴于它们与计算机视觉的紧密联系,以 及它们的出处,没有把它们纳入到图像处理与分析中来.同样,这里面也有一些 也可以划归到计算机视觉中去.这都不重要,只要知道有这么个方法,能为自己 所用,或者从中得到灵感,这就够了. 8. Edge Detection 边缘检测也是图像处理中的一个基本任务.传统的边缘检测方法有基于梯度 算子,尤其是 Sobel 算子,以及经典的 Canny 边缘检测.到现在,Cann…
1. 背景 关于这个数据集,在这个挑战中,您将获得一个用户列表以及他们的人口统计数据.web会话记录和一些汇总统计信息.您被要求预测新用户的第一个预订目的地将是哪个国家.这个数据集中的所有用户都来自美国. 目的地国家有12种可能的结果:"US"."FR"."CA"."GB"."ES"."IT"."PT"."NL"."DE".&q…
图神经网络小结 图神经网络小结 图神经网络分类 GCN: 由谱方法到空域方法 GCN概述 GCN的输出机制 GCN的不同方法 基于谱方法的GCN 初始 切比雪夫K阶截断: ChebNet 一阶ChebNet 自适应图卷积网络AGCN 谱方法小结 基于空域方法GCN 基于递归的空间GCN(Recurrent-based Spatial GCNs) 图神经网络GNN(特指早期的一种结构) 门控图神经网络(GGNN) 随机稳态嵌入SSE 基于合成的空间GCN(Composition Based Spa…
目录 摘要 1.引言: 2.背景 2.1 数据集 2.2评价指标 3.3D形状分类 3.1基于多视图的方法 3.2基于体素的方法 3.3基于点的方法 3.3.1 点对多层感知机方法 3.3.2基于卷积的方法 3.3.2.1 3D连续卷积网络 3.3.2.2 3D离散卷积网络 3.3.3基于图的方法 3.3.3.1 空间域中的基于图的方法 3.3.3.2 谱域中的基于图的方法 3.3.4基于层级数据结构的方法 3.3.5其他方法 3.4总结 3D点云深度学习:综述(点云形状识别部分) Deep L…
原创作者 | 苏菲 论文来源: https://aclanthology.org/2020.emnlp-main.668/ 论文题目: Text Graph Transformer for Document Classification (文本图Tranformer在文本分类中的应用) 论文作者: Haopeng Zhang Jiawei Zhang 01 引言 文本分类是自然语言处理中的基本任务之一,而图神经网络(GNN)技术可以描述词语.文本以及语料库,最近研究者将GNN应用到抓取语料库中单…
Mathematics Malware Detected Tools 重要:由于缺少测试数据,部分结论可能不正确.更多更准确的结论,还需要进行大量实验. 概述 mmdt(Mathematics Malware Detected Tools)是一款基于数学方法的最简单的类"机器学习"工具.该工具通过数学方法对目标对象进行处理,生成相应的标准"指纹",通过对指纹的处理,实现"机器学习"中的"分类"."聚类"方法…
0 初衷 GitHub这一份黑客技能列表很不错,包含了多个方向的安全.但目前我关注只有逆向工程与恶意代码,所以其他的被暂时略过. 虽然很感谢作者的辛勤付出,但并不打算复制粘贴全套转载.逐条整理是为了从大量资源里梳理出自己觉得实用性很高的东西. <Awesome-Hacking> https://github.com/Hack-with-Github/Awesome-Hacking Awesome Hacking系列-恶意代码分析 恶意软件分析:包括恶意软件收集.开源威胁情报.检测.沙箱等 ht…
Malware detection 目录 可执行文件简介 检测方法概述 资源及参考文献 可执行文件简介 ELF(Executable Linkable Format) linux下的可执行文件格式,按照ELF格式编写的文件包括:.so..a等 PE(Portable Executable) windows下的可执行文件格式,按照PE格式编写的文件包括: .dll..lib..exe等 参考文献[3]中对ELF的各个字段作了详细介绍 Linux和Windows可执行文件分类: ELF文件类型 说明…
Otto Product Classification Winner's Interview: 2nd place, Alexander Guschin ¯\_(ツ)_/¯ The Otto Group Product Classification Challenge made Kaggle history as our most popular competition ever. Alexander Guschin finished in 2nd place ahead of 3,845 ot…