项目概述

Local Deep Research (LDR) 是一个AI研究助手,专注于执行深度、迭代的研究任务。核心功能包括:

  • 复杂问题分解:将复杂查询拆分为聚焦的子查询
  • 多源并行搜索:同时搜索网络、学术论文和本地文档
  • 信息验证:跨来源验证信息准确性
  • 综合报告生成:创建带有规范引用的全面报告

核心特性

智能搜索策略

  • 15+种搜索策略(包括并行搜索、自适应分解、约束引导等)
  • 支持BrowseComp优化模式
  • 动态约束满足跟踪

高级分析能力

  • 双置信度评估(正/负证据分析)
  • 多阶段候选发现
  • 智能约束放松机制

知识管理

  • 持久化研究成果存储
  • 知识图谱构建
  • 渐进式知识压缩

开发者友好

  • 模块化架构设计
  • 完整类型提示
  • 可扩展的插件系统

安装指南

基础安装

git clone https://github.com/LearningCircuit/local-deep-research.git
cd local-deep-research
pdm install

依赖项

  • Python 3.10+
  • PDM 2.0+
  • Ollama (可选,用于本地模型运行)

Docker部署

docker-compose -f docker-compose.ldr.yml up -d

使用示例

基础研究任务

from local_deep_research import get_advanced_search_system

search_system = get_advanced_search_system(strategy_name="iterdrag")
results = search_system.analyze_topic("量子计算在密码学中的应用现状")

基准测试

from local_deep_research.web.benchmark import run_benchmark

benchmark_results = run_benchmark(
model="gpt-4.1-mini",
strategy="focused-iteration",
questions=50
)

核心代码解析

自适应搜索策略

class AdaptiveDecompositionStrategy(BaseSearchStrategy):
"""
自适应分解策略,根据中间发现动态调整搜索方法 关键特性:
1. 动态步骤选择(约束提取→初始搜索→验证→优化)
2. 基于置信度的早期终止
3. 智能查询重构
""" def __init__(self, model, search, max_steps=15):
self.model = model
self.search = search
self.max_steps = max_steps
self.current_step = 0 def execute_step(self, step_type, context):
"""执行单个自适应步骤"""
if step_type == StepType.CONSTRAINT_EXTRACTION:
return self._extract_constraints(context)
elif step_type == StepType.INITIAL_SEARCH:
return self._initial_search(context)
# ...其他步骤处理

双置信度检查器

class DualConfidenceChecker(BaseConstraintChecker):
"""
使用正/负/不确定三分数评估约束满足情况 评估逻辑:
- 正置信度 > 40% → 接受
- 负置信度 > 25% → 拒绝
- 不确定度 > 60% → 需要重新评估
""" def check_candidate(self, candidate, constraints):
results = []
for constraint in constraints:
evidence = self._gather_evidence(candidate, constraint)
analysis = self._analyze_evidence(evidence) score = (analysis.positive -
analysis.negative * self.negative_weight -
analysis.uncertainty * self.uncertainty_penalty) results.append(ConstraintCheckResult(
constraint=constraint,
score=score,
evidence=evidence
))
return results

贡献指南

我们欢迎各种形式的贡献!请参阅贡献指南了解:

  • 开发环境设置
  • 代码风格要求
  • PR提交流程
  • 安全准则

许可证

本项目采用 Apache License 2.0 开源协议。

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

公众号二维码

Local Deep Research - AI驱动的深度研究助手的更多相关文章

  1. AI面试必备/深度学习100问1-50题答案解析

    AI面试必备/深度学习100问1-50题答案解析 2018年09月04日 15:42:07 刀客123 阅读数 2020更多 分类专栏: 机器学习   转载:https://blog.csdn.net ...

  2. 微软发布云端基因服务:推动AI驱动的精准医疗

    微软发布云端基因服务:推动AI驱动的精准医疗 2018年03月07日 00:00:00 微软研究院AI头条 阅读数:117    版权声明:本文为博主原创文章,未经博主允许不得转载. https:// ...

  3. AI驱动的超分辨技术落地实践

    近年来,随着深度学习技术的快速发展,基于AI的超分辨技术在图像恢复和图像增强领域呈现出广阔的应用前景,受到了学术界和工业界的关注和重视.但是,在RTC视频领域中,很多AI算法并不能满足实际场景下的应用 ...

  4. [AI开发]将深度学习技术应用到实际项目

    本文介绍如何将基于深度学习的目标检测算法应用到具体的项目开发中,体现深度学习技术在实际生产中的价值,算是AI算法的一个落地实现.本文算法部分可以参见前面几篇博客: [AI开发]Python+Tenso ...

  5. 认识:人工智能AI 机器学习 ML 深度学习DL

    人工智能 人工智能(Artificial Intelligence),英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学. 人工智能是对人的意识. ...

  6. 迈入 8K 时代,AI 驱动超高清 “视” 界到来

    2021 年,超高清迈入 "8K" 时代.超高清视频将带来全新视听体验,但超高清生产在内容生产层面也面临着超高清存量少.生产设备更新换代慢.制作周期成倍增加的困境.在 7 月 10 ...

  7. NPC AI驱动最基本过程

    NPC AI驱动最基本过程 NPCmgr中比较重要的是加载NPC和一个NPCAI的一个指针 他利用map那个线程的定时到底做了啥呢 void NPCmgr::npcAITimer() { time_t ...

  8. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1

    3.Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1 http://blog.csdn.net/sunbow0 ...

  9. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.2

    3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.2 http://blog.csdn.net/sunbow0 ...

  10. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.3

    3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.3 http://blog.csdn.net/sunbow0 ...

随机推荐

  1. Oracle - ORA-19809: 超出了恢复文件数的限制

    场景重现 使用rman执行以下命令进行数据库备份的时候出现异常: RMAN> backup database; 出现如下错误: # 主要异常信息如下: # ... RMAN-00571: === ...

  2. datasnap的Restful的接口方法

    //Restful接口测试 //GET function Test(Value: string): string; //POST function updateTest(Value: string; ...

  3. .NET周刊【3月第3期 2025-03-16】

    国内文章 在 VisualStudio 一键 F5 启动调试 Roslyn 分析器项目 https://www.cnblogs.com/lindexi/p/18730521 本文将告诉大家如何在 Vi ...

  4. C 图上的遍历算法

    图上的遍历算法 广度优先搜索 BFS 概念 广度优先搜索(Breadth-First Search)是一种图遍历算法,用于在图或树中按层次逐层访问节点.它从源节点(起始节点)开始,首先访问源节点的所有 ...

  5. 延迟补偿在C/S架构游戏协议设计和优化中的应用

    延迟补偿在C/S架构游戏协议设计和优化中的应用 1 分钟读完 1.综述Permalink 第一人称角色网络游戏的设计是一项很有挑战性的工作.网络环境下的健壮性,是动作游戏能否成功的一个重要因素.另外, ...

  6. Window7搭建Kafka环境总结

    1.安装zooeleeper 下载链接:http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.14/ 安装步骤如下: 1)解压zookeepe ...

  7. 基于CNN(卷积神经网络)的车牌号识别【结尾附完整项目下载地址】

    基于卷积神经网络(CNN)的车牌识别技术是一种深度学习方法,用于自动检测并识别车辆的车牌号码.以下是经过优化后的处理步骤: 图像预处理:首先对获取的车牌图像进行处理,包括将其转换为灰度图.二值化处理以 ...

  8. Apache Flink(CVE-2020-17519)路径遍历漏洞复现_附POC和批量检测脚本

    声明 本文仅用于技术交流,请勿用于非法用途 由于传播.利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,文章作者不为此承担任何责任. 文章作者拥有对此文章的修改和解释权.如 ...

  9. Sentinel——服务降级

    目录 简介 Sentinel方法级降级 Sentinel类级降级 OpenFeign类级降级 简介 服务降级是一种增强用户体验的方式.当用户的请求由于各种原因被拒后,系统返回-一个事先设定好的.用户可 ...

  10. 『Plotly实战指南』--在金融数据可视化中的应用(下)

    在金融市场的复杂博弈中,可视化技术如同精密的导航仪. 传统静态图表正在被交互式可视化取代--据Gartner研究,采用动态可视化的投资机构决策效率提升达47%. 本文的目标是探讨如何利用 Plotly ...