Appscanner实验还原code3

# Author: Baozi

#-*- codeing:utf-8 -*-

import _pickle as pickle

from sklearn import ensemble

import random

from sklearn.metrics import accuracy_score, f1_score, precision_score, recall_score, classification_report, \

    confusion_matrix

import numpy as np

##########

##########

# TRAINING_PICKLE = 'motog-old-65-withnoise-statistical.p'      # 1a

TRAINING_PICKLE = 'trunc-dataset1a-noisefree-statistical.p'  # 1a

# TESTING_PICKLE  = 'motog-new-65-withnoise-statistical.p'      # 2

TESTING_PICKLE = 'trunc-dataset2-noisefree-statistical.p'  #

print('Loading pickles...')

trainingflowlist = pickle.load(open(TRAINING_PICKLE, 'rb'), encoding='iso-8859-1')

testingflowlist = pickle.load(open(TESTING_PICKLE, 'rb'), encoding='iso-8859-1')

print('Done...')

print('')

print('Training with ' + TRAINING_PICKLE + ': ' + str(len(trainingflowlist)))

print('Testing with ' + TESTING_PICKLE + ': ' + str(len(testingflowlist)))

print('')

for THR in range(10):

    p = []

    r = []

    f = []

    a = []

    c = []

    for i in range(5):

        print(i)

        ########## PREPARE STUFF

        trainingexamples = []

        classifier = ensemble.RandomForestClassifier()

        classifier2 = ensemble.RandomForestClassifier()

        ########## GET FLOWS

        for package, time, flow in trainingflowlist:

            trainingexamples.append((flow, package))

        # print('')

        ########## SHUFFLE DATA to ensure classes are "evenly" distributed

        random.shuffle(trainingexamples)

        ########## TRAINING PART 1

        X1_train = []

        y1_train = []

        #####################################################

        for flow, package in trainingexamples[:int(float(len(trainingexamples)) / 2)]:

            X1_train.append(flow)

            y1_train.append(package)

        # print('Fitting classifier...')

        classifier.fit(X1_train, y1_train)

        # print('Classifier fitted!')

        # print(''

        ########## TRAINING PART 2 (REINFORCEMENT)

        X2_train = []

        y2_train = []

        tmpx_train = []

        tmpy_train = []

        count = 0

        count1 = 0

        count2 = 0

        ###############################################

        for flow, package in trainingexamples[int(float(len(trainingexamples)) / 2):]:

            # flow = np.array(flow).reshape(1,-1)

            # tmp.append(flow)

            tmpx_train.append(flow)

            tmpy_train.append(package)

        predictions = classifier.predict(tmpx_train)

        #print(type(predictions))#<class 'numpy.ndarray'>

        #print(predictions[0])#com.myfitnesspal.android-auto.csv

        for flow, package in trainingexamples[int(float(len(trainingexamples)) / 2):]:

            X2_train.append(flow)

            prediction = predictions[count]

            if (prediction == package):

                y2_train.append(package)

                count1 += 1

            else:

                y2_train.append('ambiguous')

                count2 += 1

            count += 1

    print("Step Finished!!!!!!!!!!!")

    # print(count1)

    # print(count2)

    # print('Fitting 2nd classifier...')

    classifier2.fit(X2_train, y2_train)

    # print('2nd classifier fitted!'

    # print(''

    ########## TESTING

    threshold = float(THR) / 10

    X_test = []

    y_test = []

    tmpx_test = []

    tmpy_test = []

    count  = 0

    totalflows = 0

    consideredflows = 0

    for package, time, flow in testingflowlist:

        tmpx_test.append(flow)

        tmpy_test.append(package)

    predictionss = classifier2.predict(tmpx_test)#此时的分类器可以预测带有ambiguous标签的样本

    prediction_proba = classifier2.predict_proba(tmpx_test)#此时的分类器可以预测带有ambiguous标签的样本

    #print(type(prediction_proba))#<class 'numpy.ndarray'>

    print(prediction_proba[0])

    for package, time, flow in testingflowlist:

        prediction = predictionss[count]

        if (prediction != 'ambiguous'):

            prediction_probability = max(prediction_proba[0])

            totalflows += 1

            if (prediction_probability >= threshold):

                consideredflows += 1

            X_test.append(flow)

            y_test.append(package)

        count += 1

    y_pred = classifier2.predict(X_test)

    p.append(precision_score(y_test, y_pred, average="macro") * 100)

    r.append(recall_score(y_test, y_pred, average="macro") * 100)

    f.append(f1_score(y_test, y_pred, average="macro") * 100)

    a.append(accuracy_score(y_test, y_pred) * 100)

    c.append(float(consideredflows) * 100 / totalflows)

print('Threshold: ' + str(threshold))

print(np.mean(p))

print(np.mean(r))

print(np.mean(f))

print(np.mean(a))

print(np.mean(c))

print('')

Appscanner实验还原code3的更多相关文章

Appscanner实验还原code2
import _pickle as pickle from sklearn import svm, ensemble import random from sklearn.metrics import ...
Appscanner实验还原code1
import _pickle as pickle from sklearn import svm, ensemble import random from sklearn.metrics import ...
11.2.0.4rac service_name参数修改
环境介绍 )客户环境11. 两节点 rac,集群重启后,集群资源一切正常,应用cs架构,连接数据库报错,提示连接对象不存在 )分析报错原因,连接数据库方式:ip:Port/service_name方式 ...
RAC环境修改参数生效测试
本篇文档--目的:实验测试在RAC环境下,修改数据库参数与单实例相比,需要注意的地方 --举例说明,在实际生产环境下,以下参数很可能会需要修改 --在安装数据库完成后,很可能没有标准化,初始化文档,没 ...
vsftp -samba-autofs
摘要: 1.FTP文件传输协议,PAM可插拔认证模块,TFTP简单文件传输协议. 注意:iptables防火墙管理工具默认禁止了FTP传输协议的端口号 2.vsftpd服务程序三种认证模式?三种认证模 ...
【故障处理】ORA-12162 错误的处理
[故障处理]ORA-12162: TNS:net service name is incorrectly specified 一.1 场景今天拿到一个新的环境,可是执行sqlplus / as s ...
SDUT OJ 数据结构实验之二叉树四：（先序中序）还原二叉树
数据结构实验之二叉树四:(先序中序)还原二叉树 Time Limit: 1000 ms Memory Limit: 65536 KiB Submit Statistic Discuss Problem ...
SDUT 3343 数据结构实验之二叉树四：还原二叉树
数据结构实验之二叉树四:还原二叉树 Time Limit: 1000MS Memory Limit: 65536KB Submit Statistic Problem Description 给定一棵 ...
SDUT-3343_数据结构实验之二叉树四：（先序中序）还原二叉树
数据结构实验之二叉树四:(先序中序)还原二叉树 Time Limit: 1000 ms Memory Limit: 65536 KiB Problem Description 给定一棵二叉树的先序遍历 ...

随机推荐

Tesseract-OCR识别
参考 https://studygolang.com/topics/4527/comment/13217 安装版Windows下链接: https://digi.bib.uni-mannheim.de ...
UVA11694-Gokigen Naname（DFS进阶）
Problem UVA11694-Gokigen Naname Accept: 76 Submit: 586Time Limit: 10000 mSec Problem Description I ...
[tool] AI视频翻译解决英文视频字幕问题(类似youtube自动生成字幕)
1.网易见外是网易人工智能事业部旗下的AI视频翻译产品. 字幕支持手工编辑和下载不过网易见外只支持WEB在线操作并且只支持单个上传操作目前没有客户端 2.人人译视界 (IOS 安卓 PC客户端 ...
tensorflow中的Supervisor
tf.train.Supervisor()可以帮我们简化一些事情,可以保存模型参数和Summary,它有以下的作用: 1)自动去checkpoint加载数据或初始化数据 ,因此我们就不需要手动初始化或 ...
icon图标库记录
每天学习一点点编程PDF电子书.视频教程免费下载:http://www.shitanlife.com/code 阿里巴巴: http://iconfont.cn/ 可以下载图标 github : x ...
wxWidgets 在 Windows 下开发环境配置
本文基于 CodeBlocks (16.01) 和 wxWidgets (3.0.2) 搭建 Windows 环境下 GUI 开发环境. 1. CodeBlocks 官网,下载最新版安装包 code ...
autoware
在 Autoware目录下执行 git checkout 将版本切换到1.10.0 因为最新版驱动有问题然后执行 sudo apt-get update sudo apt-get install -y ...
object detection[faster rcnn]
这部分,写一写faster rcnn 0. faster rcnn 经过了rcnn,spp,fast rcnn,又到了faster rcnn,作者在对前面的模型回顾中发现,fast rcnn提出的ro ...
Python学到什么程度才可以去找工作？掌握这4点足够了！
大家在学习Python的时候,有人会问"Python要学到什么程度才能出去找工作",对于在Python培训机构学习Python的同学来说这都不是问题,因为按照Python课程大纲来 ...
Apache Commons Codec的Base64加解密库
下载地址:http://commons.apache.org/proper/commons-codec/download_codec.cgi import org.apache.commons.cod ...

Appscanner实验还原code3

Appscanner实验还原code3的更多相关文章

随机推荐

热门专题