DeepseekScanner deepseek+python实现代码审计实战

一、功能概述

DeepseekScanner实现了扫描源代码项目中的所有代码文件发送给deepseek进行安全审计的功能。具体细节包括扫描所有子目录中的代码文件，然后依次将代码文件切片发送到deepseek api进行智能代码审计。审计结果包含存在安全问题的代码文件、代码位置行数、安全漏洞问题名称、存在安全漏洞的代码块。最后将审计结果保存到文件中方便查阅。

二、具体功能介绍

扫描指定的代码项目目录

//支持只扫描指定的文件后缀比如.php 只扫描.php文件 也可以扫描全部的文件类型

def scan_directory(directory, file_types=None, scan_all=False):

    try:

        if scan_all:

            files_to_scan = [os.path.join(root, file) for root, _, files in os.walk(directory) for file in files]

        else:

            files_to_scan = [os.path.join(root, file) for root, _, files in os.walk(directory) for file in files if

                             any(file.endswith(ft) for ft in file_types)]

        # Saving results to file

        scan_results = []

        filename = f"scan_results.txt"

        directory = "./"

        filepath = os.path.join(directory, filename)

        for file_path in tqdm(files_to_scan, desc="Scanning files"):

            file_scan_results = scan_file(file_path, scan_results, directory)

            if file_scan_results is not None and len(file_scan_results) > 0:

                save_results_to_file(filepath, file_scan_results)

    except Exception as e:

        print(e)

2.代码文件切片发送给deepseek做安全审计

//从项目中的各个目录提取代码文件后，开始对代码进行切片发送给deepseek做安全审计

def scan_file(file_path, scan_results, directory):

    try:

        with open(file_path, 'r') as file:

            content = file.readlines()

        total_chunks = (len(content) - 1) // 100 + 100

        file_scan_results = []

        for chunk_start in range(0, len(content), 100):

            chunk_end = min(chunk_start + 100, len(content))

            code_chunk = ''.join(content[chunk_start:chunk_end])

            response = analyze_security(code_chunk)

            if hasattr(response, 'content'):

                results = response.content

            elif isinstance(response, dict) and 'content' in response:

                results = response['content']

            else:

                results = response

            if results:

                # Split the result into individual issues using "@@@@", it can be unreliable depending on the output of the model

                individual_results = results.split('@@@@')

                for result in individual_results:

                    if "存在风险" in result:

                        try:

                            _, line_numbers, issue_description, code_snippet = result.split(' | ', 3)

                            adjusted_line_numbers = line_numbers.strip()

                            issue_description = issue_description.strip()

                            code_snippet = code_snippet.strip()

                            file_scan_results.append(

                                (file_path, adjusted_line_numbers, issue_description, code_snippet))

                        except ValueError:

                            continue

        # Append this file's results to the main scan_results

        # scan_results.extend(file_scan_results)

        return file_scan_results

    except Exception as e:

        print(e)

    return None

3.deepseek代码审计功能

//严格定义prompt为资深安全专家实现代码安全审计

def analyze_security(content):

    try:

        completion = client.chat.completions.create(

            model="deepseek-chat",  # field is not currently used in LM studio

            messages=[

                {"role": "system", "content": '''你是一个安全专家严格分析以下代码片段，检查其中是否存在安全漏洞，请详细分析'''},

                {"role": "user", "content": content}

            ],

            temperature=0.7,

        )

        return completion.choices[0].message

    except Exception as e:

        print(e)

    return None

三、测试结果

1.命令执行

//对项目中的所有代码进行安全审计

python scanner.py E:\work\sqli-secound-order --all

2.结果展示

四、总结

DeepseekScanner通过python+deepseek实现了python、php、java等语言项目代码审计，测试效果对于常见的安全问题甄别效果还是可以的，但可能也存在误报、错报等问题，需要再逐一帧对，不断完善。感兴趣的朋友可以在公众号回复"deepseekscanner"下载完整项目进行测试，包含代码项目和提供测试的漏洞代码项目。

DeepseekScanner deepseek+python实现代码审计实战的更多相关文章

关于Python网络爬虫实战笔记③
Python网络爬虫实战笔记③如何下载韩寒博客文章 Python网络爬虫实战笔记③如何下载韩寒博客文章 target:下载全部的文章 1. 博客列表页面规则也就是, http://blog.sina ...
《Python高效开发实战》实战演练——内置Web服务器4
<Python高效开发实战>实战演练——开发Django站点1 <Python高效开发实战>实战演练——建立应用2 <Python高效开发实战>实战演练——基本视图 ...
python聚类算法实战详细笔记 (python3.6+(win10、Linux))
python聚类算法实战详细笔记 (python3.6+(win10.Linux)) 一.基本概念: 1.计算TF-DIF TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库 ...
《Python高效开发实战》实战演练——基本视图3
在完成Django项目和应用的建立后,即可以开始编写网站应用代码,这里通过为注册页面显示一个欢迎标题,来演示Django的路由映射功能. 1)首先在djangosite/app/views.py中建立 ...
《Python高效开发实战》实战演练——建立应用2
为了在项目中开发符合MVC架构的实际应用程序,需要在项目中建立Django应用.每个Django项目可以包含多个Django应用.建立应用的语法为: #python manage.pystartapp ...
Python接口测试框架实战与自动化进阶☝☝☝
Python接口测试框架实战与自动化进阶☝☝☝ 一.fiddler在工作中的运用 1.如何抓接口抓紧手机端接口 ①.在电脑终端输入:ipconfig ,找到电脑ip ②.打开手机,连接WiFi, ...
Python 小案例实战 —— 简易银行存取款查询系统
Python 小案例实战 -- 简易银行存取款查询系统涉及知识点包的调用字典.列表的混合运用列表元素索引.追加基本的循环与分支结构源码 import sys import time ban ...
python异常值检验实战2_医美手术价格
python信用评分卡建模(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_ca ...
Python接口测试框架实战与自动化进阶✍✍✍
Python接口测试框架实战与自动化进阶整个课程都看完了,这个课程的分享可以往下看,下面有链接,之前做java开发也做了一些年头,也分享下自己看这个视频的感受,单论单个知识点课程本身没问题,大家看 ...
日志服务Python消费组实战（二）：实时分发数据
场景目标使用日志服务的Web-tracking.logtail(文件极简).syslog等收集上来的日志经常存在各种各样的格式,我们需要针对特定的日志(例如topic)进行一定的分发到特定的logs ...

随机推荐

第五章 ReentrantLock源码解析
最常用的方式: int a = 12; //注意:通常情况下,这个会设置成一个类变量,比如说Segement中的段锁与copyOnWriteArrayList中的全局锁 final Reentrant ...
Java并发容器详解，及使用场景
并发容器的由来在Java并发编程中,经常听到Java集合类,同步容器.并发容器,那么他们有哪些具体分类,以及各自之间的区别和优劣呢? 只有把这些梳理清楚了,你才能真正掌握在高并发的环境下,正确使用好 ...
linux：MariaDB安装
介绍链接安装查看系统中是否已安装 rpm -qa | grep -i mariadb 返回结果类似如下内容,则表示已有 MariaDB 的包为避免安装版本不同造成冲突,请执行以下命令移除已安装 ...
dart变量声明和变量类型
ps==>所有的代码必须放在main方法中 main方法有两种写法 1==> main() { print("你好,dart我们相遇了"); } 2==> voi ...
flutter3-dymall仿抖音直播商城|Flutter3.27短视频+直播+聊天App实例
自研flutter3.27+dart3.6+getx实战抖音短视频+聊天+直播电商带货app商城应用. flutter_dymall一款基于最新版Flutter3.27+Dart3.x+Getx+me ...
取消浏览器中记住密码自动填充时弹出Windows安全中心的验证
1.问题描述我们在使用谷歌浏览器的过程中,经常会将一些账号和密码记住在浏览器中,方便下次通过浏览器自动填充. 此方式虽然方便,但是有时候会遇到一种情况,那就是每次在浏览器中使用自动填充的时候,需会弹 ...
用python做时间序列预测四：*稳/非*稳时间序列
上篇文章简单提到了应该用*稳时间序列做预测,本文将介绍具体概念和原因. Stationary Series *稳序列 *稳序列有三个基本标准: 1.序列的均值(mean)不应该是时间的函数(意思是不应 ...
c# 删除文件夹最快的函数方法无视占用直接删除
原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/17270147.html 代码如下,直接通过cmd调用dos命令进行删除 public stat ...
Android应用禁止屏幕休眠的3种方法
做android应用开发时,有时需要在应用前台运行时,禁止休眠,以下几种方法供参考. 方法一:持有wakelock 添加休眠锁,休眠锁必须成对出现. private wakelock mwakeloc ...
JavaGUI - [03] LayoutManager布局管理器
Component中有一个方法setBounds()可以设置当前容器的位置和大小,但如果我们手动为组件设置位置和大小的话,就会造成程序的不通用性.LayoutManager布局管理器可以根据运行平 ...

DeepseekScanner deepseek+python实现代码审计实战

DeepseekScanner deepseek+python实现代码审计实战的更多相关文章

随机推荐

热门专题