从天数到分钟-使用HeatWaveAutoML在您的企业中自动化机器学习 SandeepAgrawal开发者,MySQLHeatWave 版权所有©2024,Oracle及其关联公司1 安全港声明 以下内容旨在概述我们的产品总体方向。此信息仅供参考,不得纳入任何合同之中。此内容非对交付任何材料、代码或功能性的承诺,不应作为购买决策的依据。Oracle公司对其产品描述的任何功能或功能的开发、发布、时间表和定价可能发生变化,且最终决定权归Oracle公司所有。 版权所有©2024,Oracle及/或其关联公司 [日期] MySQLHeatWaveAutoML MySQL 热浪 •完全自动化、高度可扩展、成本效益高、性能优越 •在数据库中的机器学习 •数据库开发人员和商务分析师友好 •模型与预测的无模型解释 •无额外费用适用于HeatWave客户 版权所有©2024,Oracle及其附属公司 分类与回归 超过十种最常见的用于分类和回归的分类使用案例示例: •将贷款申请分类为批准或拒绝 •解释为什么根据申请人数据批准或拒绝了贷款。 •确定申请人可以采取哪些措施来改变结果。 回归用例示例: •基于贷款申请者的数据提供年利率 •解释导致这一年化百分比收益率(APR)的因素 版权所有©2024,Oracle及其关联公司4 预测 算法选择 高级 时间序列预处理程序 超参数调优 惠普空(文H本P) … 惠普2(HP) 惠普1(HP) •预测时间序列的值基于多个变量的观察 •公用事业部门:预测电力需求在在考虑其他能源来源的冬季 •商品:预测季节性需求玉米考虑需求及其他谷物 •新型自动化技术在HeatWaveAutoML中开发 版权所有©2024,Oracle及其附属公司5 推荐系统 预测评级、前TopK项目、相似用户和项目 用户偏好 明确反馈 隐含的反馈 根据客户购买历史推荐新产品 推荐系统在电子商务中提供多种益处: •基于先前互动的个人化和动态推荐最大化转换率并增加订单量 •提高客户满意度和提升客户保留率。 •简化产品搜索并增加更多收入。 版权所有©2024,Oracle及其关联公司6 异构检测 在未标记数据上训练模型极为困难,HeatWaveAutoML简化了在未标记数据上的训练过程。专有算法可检测多种异常类型。应用范围涵盖众多领域: •银行与金融领域的欺诈检测 •制造中的故障检测与预防 •基于日志分析的根源分析 传感器 物联网设备 机器学习分析 查找异常 版权所有©2024,Oracle及其关联公司7 热浪AutoML应用案例 异常检测 检测供应中的异常情况预测装配线堵塞 分类 玩家流失预测分类保修索赔。 识别相似用户 零部件缺陷识别识别游戏作弊者 贷款违约预测 预测何时会发生失败。物联网数字孪生故障预测 预测空气污染 广告支出回报预测利用需求预测 推荐电影给观众建议替代产品推荐新产品 推荐系统 版权所有©2024,Oracle及其附属公司 预测航班延误贷款金额预测降雨量预测 回归 需求预测 时间序列预测 通过SQL公开HeatWaveAutoML功能 任何SQL客户端都可以利用HeatWaveAutoML。 ML_TRAIN–为给定表构✁一个优化模型ML_EXPLAIN–训练额外✁模型或预测解释器ML_SCORE–评估训练好✁模型ML_PREDICT_ROW/TABLE–对行/表进行推理 ML_EXPLAIN_ROW/TABLE–对行/表上✁预测进行解释 版权所有©2024,Oracle及其关联公司 9 文本列支持 HeatWaveAutoML现在支持数据库中✁文本列。文本列会被转换为数值向量,并被视为常规特征。文本类型可以是-TINYTEXT,TEXT,MEDIUMTEXT或LONGTEXT。 版权所有©2024,Oracle及其子公司10 湖泊支持 在对象存储或数据库中✁数据上构✁机器学习模型使用与数据库中数据相同✁API无额外成本-重复使用相同✁HeatWave集群 模型模型模型 培训推断解释 查询结果 版权所有©2024,Oracle及其关联公司11 在库机器学习(In-databaseMachineLearning) AWSAuroraAWSRedshiftMySQL出口出口出口 热浪 InnoDB热浪 MySQL日志异常检测流程 日志 日志解析器 日志序列 特性嵌入式 异常检测 模型 原始MySQL日志 面罩识别已知重复项和无信息模式 集团日志提供 上下文至机器学习模型 将文本数据转换为数值向量 市场异常日志序列 版权所有©2024,Oracle及其关联公司 12 生成式人工智能 版权所有©2024,Oracle及其关联公司 热浪中✁生成式AI使新✁用例成为可能。 内容生成与摘要 + 检索增强生成(RetrievalAugmentedGeneration)自然语言交互 从企业文档中生成洞见•从PDF说明书生成博客•概述日志 •在公共和私营企业数据中搜索•在矢量存储中搜索非结构化数据 •与非结构化数据✁自然语言交互•以自然语言进行内容检索和响应 版权所有©2024,Oracle及其关联公司 向量存储为LLM提供上下文,以获得更相关✁结果。 检索代理 增强 提示 LLM 矢量存储 相似度搜索 语言 编码器 专有文件 版权所有©2024,Oracle及其子公司 生成式AI与自动化机器学➀(AutoML)✁协同效应 在HeatWave中✁差异化因素 多个结合HeatWaveAutoML与生成式AI✁优势: •通过过滤无关数据,实现更精确✁LLM结果 •由于搜索空间较小,加快LLM推理速度 自然语言与数据交互 热浪 InnoDB热浪 传统机器学➀ LLM矢量存储 版权所有©2024,Oracle及其附属公司 矢量存储摄取 用例1:员工助手 用户✁PDF合同在 对象存储 矢量存储+自然语言界面 员工助理:提高员工生产力 检索增强生成 版权©2024,Oracle及其附属公司 推荐、检索和生成描述: 基于用户✁菜品偏好 用例2:个性化 推荐系统+RAG 个性化菜单:HWAutoML+检索增强生成 豆腐咖喱豆腐比拉尼豌豆咖喱 餐厅菜单 版权所有©2024,Oracle及其关联公司 用例3:报告生成。 异常检测+内容生成 研究报告生成:硬件自动机器学➀+异常日志摘要 异常检测 热浪自动化机器学➀无监督异常检测 持续地摄取 非结构化文本日志 检测异常 生成序列化✁日志 事件摘要 热浪 生成式人工智能 增强 提示LLM 总结事件从日志序列 产生事件 报告:自然领域语言用于一个运营商 19版权所有©2024,Oracle及其附属公司 发电机示例 报告生成:异常日志摘要 提出问题(“在以下日志集合中,主要问题是什么。提供两句总结。”) 主要问题是这个日志集合中,特定进程(ID为8145)✁内存使用量持续超过定义✁内存阈值。这个问题在日志中被反复强调,当进程超过内存阈值时,会向主线程发送SIGTERM信号以终止进程。您需要我在关于这个日志集合✁其他方面提供帮助吗? 事件报告 版权所有©2024,Oracle及其附属公司 摘要-具有MySQLHeatWave矢量存储✁生成式AI •启用对非结构化文档✁查询 •允许对内容进行语义搜索 MySQLHeatWave 在线事务处理(分On析lin学eTrans生ac成tio式n人Pr工oc智es能sing)自动驾驶 向量存储 对象存储 数据库出口 •用户可以使用自然语言查询非结构化文档。 21版权所有©2024,Oracle及其子公司