检查表20 24 实践中的生成AI:探索用例以利用企业数据 FernHalper博士 实践中的生成AI:探索用例以利用企业数据 FernHalper博士 t是人工智能的一个激动人心的时刻。生成式AI-人工 生成AI的五个注意事项: 1了解何时生成AI是正确的选择 2首先考虑内容创建用例 3评估聊天机器人 4使用生成式AI获取见解 5不要忘记后端部署问题 I智能的一个子集,涉及旨在生成的系统 输出,如图像,音乐,文本,或基于其训练数据的其他形式的 媒体-是许多组织的首要考虑。生成式AI有望通过在内容创建 ,产品开发和运营流程中实现前所未有的创造力,效率和个性化水平来彻底改变业务。2023年11月,OpeAI宣布其生成AI系统ChatGPT每周有1亿活跃用户。1因此,这并不令人惊讶在TDWI调查中,大多数受访者表示他们正在试验或探索生成AI。 tps://www.reuters.com/technology/openai-6/ 1“OpenAI在寻求扩展其ChatGPT消费者业务的过程中推出了个性化的AI应用程序,”htenables-customized-gpt-bots-offers-便宜-more-powerful-models-2023-11-0 在TDWI,我们看到组织探索生成AI,以使用大型语言模型(LLM)以及相关工具来解锁新的生产力水平。例如,在最近的TDWI调查中,生成AI的主要用例包括创建用于客户支持的聊天机器人(39%),生成营销内容(29%),新员工入职(26%),以及作为分析公司数据的前端(22%)。2所有这些用例都可能涉及使用公司数据,包括结构化和非结构化数据。 例如,内容创建或聊天机器人可以利用非结构化的文本重资产,诸如公司产品信息、故障排除手册、网站内容和保存有价值的公司信息的其他文档;分析助理可以使用通常存储在数据仓库 、湖泊和其他分析平台中的结构化和其他种类的表格数据。对于组织来说,考虑针对各种数据的用例非常重要,因为所有企业都可以访问相同的模型,公司数据是提供竞争优势的因素。 当然,生成式AI不一定是所有AI用例的最佳选择。在这个不断发展的环境中,重要的是要有明确的业务目标,然后评估将帮助组织成功实现这些目标的技术。作为实施的一部分,这很重要 为了有一条清晰的生产道路,一个人专注于维护数据安全性和较低的运营基础设施负担。 这份TDWI清单报告探讨了几个流行的生成AI用例,以及如何开始使用生成AI并将其与公司数据一起投入生产。 1 了解何时生成AI是正确的选择 AI、机器学习和生成AI等术语经常会出现混淆。 该术语描述了计算机科学的广泛领域,专注于创建能够执行通常需要人类智能的任务的系统。它由许多技术组成,包括机器学习 ,深度学习,自然语言处理和生成AI。例如,机器学习方法起源于该领域 在1990年代的计算科学中。在机器学习中,系统从数据中学习,以最少的人为干预来识别模式,即计算机从示例中学习 。 因为AI技术在实践中已经使用了几十年,所以有广泛的用例可以部署,而不必使用生成式AI。尽管生成式AI是一项令人兴奋的技术,但它可能不是每个用例的最佳AI技术。在生成AI和其他类型的AI(例如预测性AI)之间进行选择应该由项目的特定需求或需要做出的决策来驱动。 例如,预测分析技术通常用于保留分析,交叉销售,预测和欺诈检测。预测分析也已成功用于预测维护。预测分析使用统计信息 和机器学习技术,使用历史数据确定未来结果的概率, 2未发布的2024TDWI数据和分析调查 通常有已知的结果。例如,在保留分析的情况下,公司可以使用机器学习来使用流失或未流失的客户的历史数据集来训练模型,并用它来预测未来客户的行为。要构建这样的模型,必须以模型可以理解的特定格式来处理结构化和非结构化数据,这一过程需要数据科学家通常拥有的专业知识。 另一方面,生成式AI可用于创建模仿给定数据集分布的新内容或数据。生成式AI的基础模型,如LLM,在许多情况下是在互联网上训练的语料库上。生成式AI对需要生成新思想、设计 、 或基于学习的数据模式的信息。这可能包括内容创建(文本、图像、视频、音乐)、数据增强(为训练模型生成合成数据)或创建逼真的模拟。用例包括生成营销电子邮件或计算机代码。在文本的情况下,它是有用的 仅用于生成但也分析文本以捕获情感,总结内容,甚至翻译它 。 确定使用哪种技术以及何时使用它是很重要的。如果你的公司有关于客户保留的历史数据,并希望将客户分类为某些类别 ,它可以使用预测模型而不是生成AI。如果它试图理解事件发生的原因, 它可能会使用因果AI的新兴技术。如果它希望创建新内容 ,它可能会使用生成AI。 当然,不同类型的AI并不是相互排斥的,某些用例可能需要多种模型。例如,如果公司希望向不同的客户细分生成个性化电子邮件,则可以使用机器学习或聚类算法来生成细分,然后使用生成AI模型来创建营销内容。 所有这些也都以您的组织拥有支持这些用例的数据基础为前提 。 2 首先考虑内容创建用例 内容创建用例通常是轻松获胜并在生成AI旅程中前进的好方法。组织可能会开始使用流行的具有提示界面的生成AI系统来帮助创建 电子邮件或关于某个主题的文章。他们可能会使用生成系统为演示文稿创建插图。但是,很快他们可能会想要转移到使用自己的公司数据(通常是公司文档)的用例。 我们在TDWI上看到了许多内容创建用例,这些用例利用了公司 文档形式的内容数据。这些包括: •文档汇总是生成式AI的一个不断增长的用例,尽管它最初看起来更像是内容减少或简化任务。在这种情况下,生成式AI正在以摘要的形式创建新内容,该摘要将更长的文档中的信息提取到 简洁的形式。这涉及理解内容,提取关键点,然后生成准确反映的摘要 原文的重要观点。这个过程利用了生成AI在自然语言理解和生成方面的能力,使其成为一个内容用例。例如,它可以用来总结呼叫中心的注释。一些LLM甚至可以提供情绪分析(请参阅第4号),以便用户在报告问题或提供评论时了解客户情绪。这可以进一步帮助公司。 通过翻译、总结和捕获呼叫中心笔记、故障单或产品评论的情绪等操作,增强客户的语音分析。 •文件标准化意味着使用AI在大型文档语料库中提取同一组字段,以便企业可以跨文档运行分析或比较。一个 很好的例子是简历处理。系统经过训练,可以理解多种可能的格式,然后以用户选择的标准格式重新创建所有简历。 •文档生成器创建其他类型的文档。例如,一些文档 发电机使用公司材料和系统代码来构建技术文档。公司还利用以前对特定客户的分析来生成产品推销或营销内容 。 为了使这些用例有效,企业必须有一个数据基础,可以存储文档以及有关原始内容和生成内容的元数据。它还需要私有LLM。由于大部分信息是保密的,因此需要管理LLM。尽管组织可以从使用预培训开始, 现成的LLM,随着时间的推移,可能需要对LLM进行微调或定制,以产生特定格式的输出。 3 评估聊天机器人 生成AI的一些非常受欢迎的用例涉及聊天机器人和助手,它们位于 公司文件和其他大量文本 Wii和内部常见问题解答等数据。聊天机器人是软件应用程序,旨在模拟与人类用户的对话,通常通过文本或语音界面。它们可以部署在网站、消息平台、移动应用程序上,也可以通过虚拟助手提供客户支持、收集信息或促进交易。聊天机器人可以改变让用户手动搜索信息的模式,让他们只与数据交谈。 聊天机器人的两个流行示例包括客户支持聊天机器人和员工入职聊天机器人。要创建客户支持聊天机器人, 企业将使用来自产品文档、用户指南和常见问题解答的信息来微调预先培训的LLM,以便它可以回答问题并引用相关文档 。客户用自然语言提出问题,聊天机器人返回答案。更复杂的聊天机器人可能会使用客户交易历史(表格中的数据结构)来提供更个性化的内容。例如,如果现有客户正在向聊天机器人询问问题,则系统还可以提取客户数据以了解该客户是否是忠诚客户或者已经拥有该产品一定量的时间,并且使用该信息来提供个性化体验。 员工入职是充当助手的聊天机器人的另一个流行用例。在这里 ,一家公司利用生成AI回答有关其产品和服务的问题,以帮助新员工。例如,一家金融服务公司可能会构建一个聊天机器人,对其整个投资组合的信息进行培训。新员工可以使用此系统提出问题并获得答复,以帮助他们更快地加快速度。 创建聊天机器人需要一种方法来管理文档,将它们作为文本加载到系统中,并向LLM提供信息。根据聊天机器人的不同,可能需要将提示和数据转换为向量嵌入(数字 数据表示)使用嵌入模型,以及一种利用LLM的向量并将结果传递给聊天机器人的方法,以便它具有相关和上下文信息。这可能需要诸如检索增强生成(RAG)之类的技术来检索关于客户的数据。一些供应商提供了用于构建聊天机器人的工具包和模板,可以帮助组织入门。有些甚至提供了一些工具,这些工具提供了一种无需集成,基础架构管理或数据移动即可提供RAG的方法。 4 使用生成式AI获取见解 有趣的是,正在考虑用于生成AI的顶级用例是分析公司数据的前端。关键目标是通过使数据库中的结构化数据可用于任何人的问题,而无需编写任何代码或使用过滤器或排序,从而使对见解的访问民主化。 组织正在考虑将生成AI作为结构化和非结构化数据分析的前端。以下是两个示例: 分析对话跨网站、社交媒体渠道和应用程序可以为组织提供深入了解其客户互动和需求的信息。此功能允许企业以自然语言与其文本数据进行交互。一个简单的例子是从数据中得出情绪 。LLM可以在具有相关情绪的客户陈述的几个示例(当在提示中提供示例时称为少量提示)上进行训练。 TheLLMcanthenusethiscontexttoprovidethesituationofotherphrases/statements.Ifthisweretobedoneonacontinualbasis,thesame 聊天机器人的要求将适用于管理非结构化数据和构建生产就绪应用程序。 分析传统公司数据使用支持生成AI的工具作为传统BI工具的配套(或替代)正在增加。许多BI供应商正在为其平台提供自然语言接口,因此用户不一定需要知道SQL来查询数据 库。这个想法是让用户以自然的方式提出问题并从BI系统获得响应。 在尝试使用生成AI(而不是BI工具)来分析数据之前,组织应该询问其BI供应商是否正在将自然语言接口纳入其产品 。使用AI进行此类分析需要生成AI工具充当语义层并生成SQL以检索数据,对数据进行矢量化以查找具有相似质量的数据,并在报告,仪表板,图形和图表中可视化这些数据。现在这些能力。 被合并到数据平台中,生成AI前端可以为用户生成SQL。用户可以与系统交互以调整查询并确保他们对结果满意。 这是BI的未来吗?还有待观察。这前提是您的组织中的数据处于要分析的形式,具有良好的质量,以及BI和分析工作所需的所有其他要求。生成性AI还不是这里的银弹。 5 不要忘记后端部署问题 无论您的公司如何使用AI技术,将模型投入生产都会带来组织需要解决的问题,尤其是在处理私人公司数据和新模型类型时。 •模型治理。与传统AI模型一样,需要对生成AI模型和应用程序进行管理,以确保投入生产的模型受到信任并保持其完整性。这可能包括将操作(Ops)人员安排到位 ,以确保模型的版本化和文档化。Ops团队还可以跟踪模型,并在模型漂移或过时时采取纠正措施。在 在生成AI的情况下,团队还应确保模型不会开始产生无效的输出(称为幻觉),并且将高质量的数据提供给模型。 重要的是要有一种方法来根据新法规可能出现的风险和其他参数对AI系统和应用程序进行分类。一些组织已经开始开发和倡导AI模型卡。正如美国政府要求在包装商品上贴上营养事实标签一样S.为了促进整体健康,AI模型卡提供有关AI资产或应用程序的相关文档。 当然,鉴于使用某些简单的生成AI应用程序相对容易,组织 还需要关注可能在公共系统上使用私人数据的“影子AI”实现。 •安全和隐私。生成的AI模