精品项目

使用生成式人工智能和 Amazon SageMaker Canvas,加速安全问题的分析,无需编码的

加速分析安全发现:利用无代码数据准备与生成式AI和Amazon SageMaker Canvas

作者 Sudeesh Sasidharan与John Klacynski日期 2024年2月1日来源 Amazon SageMaker

重点内容

数据是充分利用AI技术的基础,能快速解决业务问题。使用 Amazon SageMaker Canvas 可以高效、无代码地准备数据,为安全分析提供支持。生成式AI通过提供自然语言的交互,提升了风险识别和处理能力,推动商业生产力。SageMaker Canvas结合 Amazon SageMaker Data Wrangler、Amazon Security Lake 和 Amazon S3数据存储,形成完善的数据准备工作流程。

数据是提取AI技术最大价值的基础,能够快速解决商业问题。为了释放 生成式AI 的潜力,关键在于适当的准备数据。本文将介绍如何使用生成式AI更新和扩展数据管道,利用 Amazon SageMaker Canvas 进行数据准备。

通常,数据管道的工作需要专业技能来准备和组织数据,以便安全分析师提取价值,这个过程可能耗时、带来风险并延长价值实现的时间。而使用SageMaker Canvas,分析师可以轻松安全地访问领先的基础模型,更快地准备数据并缓解网络安全风险。

数据准备涉及仔细的格式化和周到的上下文设置,需从客户问题反推。现在,借助于SageMaker Canvas的聊天数据准备功能,具有领域知识的分析师能够通过基于聊天的体验快速准备、组织并从数据中提取价值。

解决方案概述

生成式AI正通过提供个性化和自然语言体验,改变安全领域,增强风险识别与修复能力,同时推动商业效率。在这个应用案例中,我们使用SageMaker Canvas、Amazon SageMaker Data Wrangler、Amazon Security Lake和Amazon S3。Amazon Security Lake使得您能够聚合和规范安全数据进行分析,更好地理解组织中的安全状态。Amazon S3 让您能在任何时间和地点存储和检索任意数量的数据,并提供业内领先的可扩展性、数据可用性、安全性及性能。

SageMaker Canvas现在支持全面的数据准备功能,由SageMaker Data Wrangler提供支持。通过这一集成,SageMaker Canvas提供了一个端到端无代码的工作空间,可以准备数据、构建和使用机器学习 (ML) 以及 Amazon Bedrock 基础模型,加速从数据到业务洞察的时间。您现在可以从超过50个数据源中发现和聚合数据,并使用SageMaker Canvas可视化界面中的300多种内置分析和转换探索和准备数据。您会看到更快的转换和分析性能,并利用自然语言界面进行数据的探索与转换。

在本文中,我们演示了三种关键转换:数据过滤、列重命名和从列中提取文本。我们还展示了如何利用SageMaker Canvas的数据准备聊天功能分析数据并可视化结果。

前提条件

在开始之前,您需要一个AWS账户,并设置一个 Amazon SageMaker Studio 域。如需设置SageMaker Canvas的说明,请参考 无代码生成机器学习预测。

访问SageMaker Canvas聊天界面

按照以下步骤开始使用SageMaker Canvas聊天功能:

在SageMaker Canvas控制台上,选择 Data Wrangler。在 Datasets 下,选择Amazon S3作为源,指定来自Amazon Security Lake的 安全发现数据集。选择数据流,然后选择 Chat for data prep,将显示具有引导提示的聊天界面体验。

过滤数据

在这篇文章中,我们首先要过滤出关键和高严重警告,因此我们在聊天框中输入指令 删除不是关键或高严重性的发现。Canvas会删除这些行,显示转化数据的预览,并提供代码的选项。我们可以将其添加到 Steps 面板中的步骤列表中。

鲸鱼加速器 安卓蓝鲸

列重命名

接下来,我们想要重命名两列,因此在聊天框中输入以下提示,将 desc 和 title 列重命名为 Finding 和 Remediation。SageMaker Canvas创建了一个预览,如果您对结果满意,可以将转化数据添加到数据流步骤中。

提取文本

要确定发现的源区域,您可以在聊天中输入指令 从UID列中提取区域文本,基于模式 arnawssecuritysecurityhubregion 创建一个名为 Region 的新列。SageMaker Canvas随后生成代码以创建一个新的区域列。数据预览显示发现来源于一个区域:uswest2。您可以将此转换添加到数据流进行后续分析。

数据分析

最后,我们想要分析数据,以确定一天中的时间与关键发现数量之间的关联。您可以在聊天中请求针对一天中的时间总结关键发现,SageMaker Canvas将返回有助于您调查和分析的洞察。

可视化发现

接下来,我们通过时间和严重性可视化发现,以便包含在领导报告中。您可以要求SageMaker Canvas生成一张按时间和严重性分组的条形图。SageMaker Canvas在几秒钟内创建了该图表。您可以将此可视化添加到数据流分析中并下载用于报告。这些数据显示发现来自一个区域并且发生在特定时间。这让我们对重点关注我们的安全发现调查以确定根本原因和纠正措施充满信心。

清理工作

为了避免不必要的收费,请按照以下步骤清理资源:

清空您作为源使用的S3桶。注销SageMaker Canvas。

结论

在本文中,我们展示了如何利用SageMaker Canvas作为一个端到端的无代码工作区进行数据准备,从而构建和使用Amazon Bedrock基础模型,加快从数据提取商业洞察的进程。

请注意,这种方法并不仅限于安全发现;您可以将其应用于任何以数据准备为核心的生成式AI用例。

未来属于那些能够有效利用生成式AI和大语言模型的企业。但要做到这一点,我们必须首先制定一个坚实的数据战略,并理解数据准备的艺术。通过利用生成式AI智能构建数据并从客户的角度向后工作,我们能够更快地解决商业问题。使用SageMaker Canvas的数据准备聊天功能,分析师可以轻松入门,并从AI中捕获即时价值。

关于作者

Sudeesh Sasidharan是AWS能源团队的高级解决方案架构师。他热衷于实验新技术并开发创新解决方案以应对复杂的业务挑战。当他不在设计解决方案或玩弄最新技术时,您可以在网球场上看到他忙于练习反手。

John Klacynski是AWS独立软件供应商ISV团队的首席客户解决方案经理。在这个职位上,他通过程序化方式帮助ISV客户更快地采用AWS技术和服务,以实现他们的业务目标。在加入AWS之前,John曾领导大型消费品公司的数据产品团队,帮助他们利用数据洞察提升运营和决策。

使用生成式人工智能和 Amazon SageMaker Canvas,加速安全问题的分析,无需编码的