3天技术培训课程 – 4:
2018-10-01 18:10:26
Introduction


网络安全之应用数据科学和机器学习

CHARLES-AND-AUSTIN.png


网络安全之应用数据科学和机器学习




训讲师

Mr. Charles Givre 最近加入了 Deutsche 银行,担任担任首席信息安全办公室的首席数据科学家. 在加入 Deutsche 银行之前, Mr. Givre 一直担任博思艾伦咨询公司的首席高级数据科学家,从事网络安全和数据科学工作。 在博思艾伦咨询公司, Mr. Givre 参与了博思艾伦最大的分析项目之一,在该项目中,他领导了数据科学工作,并致力于扩展数据科学在该计划中的作用。


Austin Taylor (www.austintaylor.io) 具有广泛的进攻和防御网络操作背景,并且为一些世界顶级的财富公司做过安全响应,他的专长包括渗透测试,数据科学,威胁搜寻以及用户和实体行为分析(UEBA). 他教授数据科学课程已经有三年了,并且还是《How to Build a World Class Monitoring System for Home, Small Office, or Enterprise Networks》一书的作者. 在他的闲暇时间, 他教授编程并在会议上进行培训。目前担任美国空军的网络战操作员,IronNet网络安全的首席安全研究工程师.拥有多项行业认证,包括CISSP,GMON,GCCC,GXPN,GCIA,GCIH,GCPM,GSEC,GPEN,CEH,VCP, CCNA:Security


概况
该交互式课程将教授安全专业人员如何使用数据科学技术快速操作,分析网络和安全数据,并最终从这些数据中发现有价值的东西。 该课程将涵盖整个数据科学过程,包括数据准备,特征工程和选择、探索性数据分析,数据可视化,机器学习,模型评估和优化,最终大规模实施——都将关注安全相关的问题。

参与者将学习如何以各种常见格式读取数据,然后编写脚本来分析并可视化数据。


训对象

希望在工作中运用自动化数据分析、机器学习和数据科学的任何学员。


键学习目标

  • 编写脚本以高效读取和操作 CSVXML JSON 文件;

  • 快速有效地解析可执行文件、日志文件、pcap 文件并从中提取* 伪像 (artifact); 

  • 调用 API 以合并数据集;

  • 使用 Pandas 库快速操作表格数据;

  • 使用 Python 有效实现数据可视化;

  • 预处理原始数据,以用于机器学习和特征工程;

  • 建立、应用和评估机器学习算法,以识别潜在威胁;

  • 动调整和优化机器学习模型;

  • 查找不规则的威胁指标并降低误报;

  • 使用随机森林算法、朴素贝叶斯算法、K 邻(K-NN)算法和支持向量机(SVM)算法等监督学习算法对恶意 URL 进行分类并发现 SQL 注入;

  • 应用K-Means 聚类算法等无监督学习算法检测异常行为。


预备知识

学生需了解 Python 编程语言。


硬件/软件要求

  • 员需自带笔记本电脑:

    • o 电脑上安装了 Virtualbox(或 VMWare),内存 6GB,磁盘存储空间 10GB

    • o 安装 Anaconda 工具和 Ipython 系统

    • 强烈建议使用我们提供的虚拟机,因为该虚拟机可以提供最佳学习体验。


将会向学员提供什么?

预先配置好的、含有授课所需全部软件的虚拟机(VM)。VM 中包含:

    • 课程的所有课件、笔记、参考资料、讲义和文档;

    • 用于课堂练习的框架代码实例。

员还可以在我们的网站上做其他练习题。