GitHub敏感信息扫描工具

目录

功能设计

技术实现

程序使用

文件配置

下载地址


功能设计

GitPrey是根据企业关键词进行项目检索以及相应敏感文件和敏感文件内容扫描的工具,其设计思路如下:

  • 根据关键词在GitHub中进行全局代码内容和路径的搜索(in:file,path),将项目结果做项目信息去重整理得到所有关键词相关的项目,即疑似项目结果;
  • 基于PATTERN_DB中的敏感文件名或敏感代码对所有疑似项目做文件名搜索(filename:)和代码搜索(in:file);
  • 将匹配搜索到的结果按照项目整理输出; 由于无法做到精确匹配和精确识别,因此扫描结果或存在一定的漏报(比如项目中未出现关键词路径或内容)或误报(比如第三方项目引用关键词内容)情况,其中漏报的原因还包括GitHub的搜索限制:
  • 默认只搜索主分支代码,多数情况下是master分支;
  • GitHub最大只允许搜索1000条代码项,即100页代码;
  • 代码搜索仅搜索不大于384Kb的文件;

此外,不同关键词搜索的疑似项目数量不同,少则数个,多则数十个甚至数百个,并会对搜索和扫描时间造成直接影响(另一影响因素是匹配的文件名关键词数量和内容关键词数量),项目和关键词越多,扫描时间越长。因此可以根据需要进行扫描深度的选择,这一维度由GitHub最近索引(Recently Indexed)排序的代码页决定,深度越深,检索的项目数量越多,反之

相关推荐

  1. GitHub敏感信息扫描工具

    2024-07-19 03:48:02       25 阅读
  2. GSIL:GitHub敏感信息泄露监控工具使用

    2024-07-19 03:48:02       62 阅读
  3. Jenkins 敏感信息实战指南

    2024-07-19 03:48:02       52 阅读
  4. Linux病毒扫描工具

    2024-07-19 03:48:02       43 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-19 03:48:02       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-19 03:48:02       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-19 03:48:02       58 阅读
  4. Python语言-面向对象

    2024-07-19 03:48:02       69 阅读

热门阅读

  1. 7大并发容器种类原理解析与应用

    2024-07-19 03:48:02       21 阅读
  2. mstar 开发环境搭建

    2024-07-19 03:48:02       23 阅读
  3. Jupyter Notebook: 是一个强大的交互式计算

    2024-07-19 03:48:02       26 阅读
  4. String、StringBuilder 和 StringBuffer 有什么区别?

    2024-07-19 03:48:02       25 阅读
  5. Windows图形界面(GUI)-DLG-C/C++ - 树形视图(TreeView)

    2024-07-19 03:48:02       25 阅读
  6. 正则表达式

    2024-07-19 03:48:02       23 阅读
  7. 网络同步学习(状态同步,帧同步)

    2024-07-19 03:48:02       24 阅读
  8. RNN模型

    2024-07-19 03:48:02       22 阅读
  9. 如何解决 CentOS 7 官方 yum 仓库无法使用

    2024-07-19 03:48:02       25 阅读