人性化的AI 真实的人类数据生成和预测真正的创新成功 2023年12月 AUTHORS ColinPHo,PhD 穆蒋明 IPSOS 视图 AI系列 #IPSOSHiAi 在益普索,我们拥护人类的独特融合智能(HI)和人工智能(AI) 推动创新并带来影响力, 为我们的客户提供以人为中心的见解。 我们的HI源于我们的专业知识工程、数据科学和我们独特的高 质量数据集-嵌入创造力, 对我们的人工智能解决方案有好奇心、道德和严谨性, 由我们的益普索FactoGenAI平台提供动力。 我们的客户受益于更安全的见解,更快,植根于人类环境。 让我们释放HI+AI的潜力! 我们都是独一无二的人类。作为消费者,我们的决定是复杂的,情绪化的,context,andofteninsorral.Although 人工智能(AI)制造新产品开发比以往更快,更容易 之前,现成的通用模型可以歪曲或歪曲消费者的现实。 在本文中,我们讨论了 与真实消费者一起训练AI模型数据,以捕获驱动的本质 真实的消费者行为,并产生并预测更好的创新。没有 与真实的人类联系,即使是最强大的算法是不够的 保证创新的成功。 《新闻周刊》最近一篇文章的标题, “人工智能:21世纪的黄金” Rush,"1完美地抓住了今天的情绪:大像ChatGPT这样的语言模型(LLM)有涡轮- 对人工智能产生了兴趣,并激发了成千上万的公司首先将头fi潜入这个领域。 虽然几乎每个行业都已经或正在开始 采用人工智能,为新产品提供最佳应用发展尤为明显。 以下页面深入研究更好的应用程序 生成和分析AI的力量创新成功。 在典型的创新过程中,一个想法阶段之后是评估阶段。 AI可以在这两个阶段利用: •在构思阶段,分歧者生成AI的能力可以是 借力开发新的产品创意。 •在评估阶段,收敛 分析AI的能力可以用来预测其市场潜力。 AI提供了一个改善 速度,以及潜在的,新的成功率创新,以及我们如何做到这一点将决定我们是否成功。在 在应用程序中,用于训练AI的数据至关重要。 新产品创意更有可能成功如果这两个相在数据中接地反映消费者内在的人类需求 和欲望。这些数据需要是永恒的,或者至少是最新的。因为数据是如此核心对于AI,我们首先解释训练数据 确定其模型的准确性。 2IPSOS视图|人性化AI人性化AI|IPSOS视图3 大脑就像海绵;他们吸收了什么图1-评估创新应用培训数据充足性的框架 AI模型变得聪明,因为它们可以学习。他们的学习有两种主要形式: 1.监督学习需要一个人 教AI到底要学什么。对于例如,如果我们想教AI认识到积极和消极的社会 媒体帖子,我们需要展示AI 把自我监督学习想象成孩子自己学习语言。作为一个孩子反复接触到言语 和文本,她开始识别模式建立连接。 两种学习形式的共同性 需要用我们的例子来推动人工智能 相关代表永恒 每个例子。通过这种方式,AI可以学习与积极相关的特征 和消极的帖子,并制定决策对新媒体帖子进行分类的协议它从未接触过。 像父母一样思考监督学习指导孩子。如果父母想教她的孩子认识狗和猫,父母会给孩子看照片 想让它学习。让AI变得聪明的不是算法,而是提供的例子。 构建AI的过程就像开发 幼儿的大脑。通过提供一个孩子丰富的学习机会,孩子 变得聪明。如果为孩子提供 机会很少,或者更糟糕的是,不正确的信息,孩子的智力会受到限制或有偏见。 训练数据应该 捕获功能和 相关的情感需求 您的特定fic产品或服务类别 来源:益普索 训练数据应该 来自一个强大的代表性样本 你的目标人口消费者/客户 训练数据应该是 不受通道的影响 时间。总是真实的,有效的 , 和适用 狗和猫。一个人需要提供示例并告诉机器每个例子代表什么。 简单来说,AI的发展 需要数据,并且数据的质量决定了AI模型的质量。 图2-使用现成的LLM生成新的产品创意 2.自我监督学习作品 不同的。“培训”涉及喂养大型语言模型(LLM) 生成预测的文本量。在 这种类型的学习,人们不需要勺子喂AI具体是什么 应该学习。AI可以改为学习 训练数据的质量可以在 与我们评估调查数据质量的方式相同。我们查找与手头任务相关的数据, 目标人群和产品的代表 类别,并及时(即,重新影响时间段我们正在寻找了解)。这是不可能的夸大训练数据的重要性:AI是 相关代表永恒 示例中的结构(例如,这个词通常出现在 单词“谢谢”,或通常的单词出现在“爱你”一词之前)。与大量的文本和重复 曝光,LLM变得非常擅长 预测单词是如何结合在一起的。 只有像提供的数据一样聪明。 我们分享三个将被使用的原则整篇论文(见图1).Whilethis框架是专门为训练而开发的 产生或评估新产品创意的人工智能,它也可以用来评估 法学硕士接受书籍培训,文章、网页和 问答文本 数据。LLM未被训练 对任何一个数据规格fic 产品或服务类别 LLM接受开放培训互联网信息。人们 谁在网上发布可能不是代表人口 你感兴趣 LLM是根据以下数据进行训练的可能有点落后。 例如,GPT-4是对可用数据进行培训 到2021年9月 任何AI应用程序的训练数据。来源:益普索 4IPSOS视图|人性化AI人性化AI|IPSOS视图5 网络世界不是一个完整的代表现实世界。在线内容仅由 那些在网上活跃的人,只有一定的 被认为值得发布的主题。 人性化的一代AI:使用真实 改进LLM的一种方法是引入 额外的数据,以避免单独产生想法来自公共培训数据,特别是当 目标是解决具体和细粒度的问题消费者需求。取决于业务 挑战,这可以使用各种 来源,如调查、社交或搜索数据。虽然益普索同时探索多个 用于模型训练目的的数据源,以下部分将更仔细地介绍使用相关、代表性和永恒的调查创新数据(参见图3). 使用GENERATIVEAI点燃新鲜想法为了说明人性化AI的优势 模型,我们通过捕获进行了试点 消费者对鼻过敏的未满足需求 sprays.Consumerswereaskedto,intheirown 言语,表达他们的问题,挫折,或鼻过敏喷雾剂的挑战。我们 然后使用LLM生成新产品这些数据的想法。优点是清楚当我们比较产生的想法有和没有调查数据(见图4). 总体而言,在没有调查数据的情况下产生的想法是通用的,功能性的,完全没有 的情感。相比之下,产生的想法调查数据反映了消费者如何真正 表达他们的症状(例如,“粘稠的粘液”, “爆耳”)和情绪(例如,“愉快”, “愉快”、“不适”)。 LLM的不同能力使它们 非常适合创意生成。因为LLM 使任何人都有可能 通过自然语言与人工智能互动, 任何新手用户都可以写一个提示来生成新产品创意(例如,“请生成十个 洗衣液的新产品创意“)。 通过及时的工程,AI产生的想法通常口齿清晰,发人深省。 鉴于用于训练的大量文本 LLM,他们在表达想法方面的卓越流利并不奇怪。虽然强大, 有三个很好的理由来改善 2.LLM不包含不成文的离线世界的现实:在线 世界不是一个完整的代表现实世界。在线内容由 只有那些在线活跃的人,只有某些被认为值得发布的主题。对于某些旨在解决的任务 具体的挑战,如思维,这可能导致知识差距 细粒度和真实的消费者知识需要特定领域和在线数据光靠自己是不够的。 3.LLM在时间胶囊中的功能:LLM 图3:通过相关,具有代表性和永恒的消费者数据增强LLM 相关 代表 永恒 现成的LLM(请参见图2): 1.LLM从一个巨大的和未知的 互联网景观:我们知道法学硕士学习来自公共互联网信息:web 页面、Reddit帖子、在线书籍和其他文本来源。我们不知道这些数据是否来源涵盖特定产品或服务 兴趣类别。 通常根据滞后的数据进行训练。对于实例,而ChatGPT-4首次发布 在2023年,它对可用数据进行了培训,直到2021年9月(参见图2)。虽然差距 在时间上因模型而异,这些差距将随着时间的推移,研究人员的角色是确保模型继续准确地反映fi等 消费者的最新现实。 可以收集调查数据 对于特定的fic产品或考虑服务类别 来源:益普索 目标样本可以是defiNed (例如,过去12个月的用户鼻过敏喷雾剂) 可以收集调查数据就在生成新的 想法,并且应该对 长达一年或更长时间 6IPSOS视图|人性化AI人性化AI|IPSOS视图7 第二个想法是在没有调查数据的情况下产生的给出了一个奇怪的结果。第一句 描述了一种为人们设计的新产品“敏感皮肤”。鉴于鼻过敏喷雾直接喷入鼻子,这很奇怪 LLM建议更常见的术语与皮肤或美容产品有关。 我们认为这是因为LLM学习单词通过联想。在英语中, “鼻”和“过敏”两个词经常放在一起,但是“皮肤”和“过敏”这两个词也是如此感觉,收到一个想法并不奇怪 参考敏感皮肤。LLM旨在 预测下一个单词,可能这样做不准确或者不适当。 这并不意味着 从公共培训的LLM中产生的想法。 用于训练的大量数据 LLM可以推动有价值的想法的发现。然而,LLM的黑匣子性质意味着 我们不会知道任何关于使用的数据产生想法-包括其来源, 代表性,或永恒。因此, LLM可能偶尔会引入一些想法 没有意义,即使他们从一个明智的语言视角。 从调查数据中产生想法时,数据的来源,收集的时间,LLM使用背后的原因是 可见。使用调查数据的优势产生新产品的想法是100%透明度。理解推理 AI做出的决策或预测背后可以提供保证的有效性AI回应。 TailoringanalyticalAI: 概念评估的数据 在LLM可用之前,分析AI 支持的研究需求。在世界 创新,一种可以瞬间实现的AI 预测新产品的成功是 许诺的土地,许多企业寻求。 然而,与LLM不同的是,现成的分析 AI模型不可用。因为概念 分析AI的初始探索:人类完全消失! 受数据使用的行业的启发 训练分析AI是刺激(例如,图片健康皮肤与癌变皮肤),一些 研究人员提倡使用以前的 将概念作为训练数据进行测试。也就是说,使用成功和不成功的文字说明 评估主要是在市场调查中进行的,需要定制的分析AI模型 预测创新成功。 建立一个成功的分析AI来预测新的产品的成功与那些 对于生成式AI:相关性、代表性、和永恒。 这种方法确实是我们第一次尝试构建一个分析型AI来预测成功新产品。通过向AI模型提供 过去成功和不成功的例子 来自益普索概念测试的概念描述数据库,我们探索了以前的功能 图4:探索由LLM产生的想法,有和没有以人为中心的调查数据 过去测试过的用于训练AI模型的概念预测新产品创意的成功。 这种方法消除了要求消费者对新产品的反应 想法,并允许即时预测。 预测市场成功的概念。这是第一个尝试失败。AI模型的准确性下降短,因为它认为有更多 比真正成功的概念。 人性化AI|IPSOS视图 9 LLM没有调查数据 一种旨在缓解两者的鼻喷雾剂过敏的症状和潜在的 过敏的原因。这可以通过使用组合成分的工作 减少炎症,清除鼻塞,并防止组胺的释放。 专门设计的鼻喷雾剂皮肤敏感的人。这个鼻 喷雾将由温和的成分制成不太可能引起刺激或过敏reactions. LLM与调查数据 结合盐溶液的鼻喷雾剂 使用抗-infi炎症药物来帮助减少inflinationandclearourthickmuus.The喷雾也会有一个令人愉快的味道使用起来更愉快。 包含组合的鼻喷雾剂天然成分如薄荷醇,桉树和薄荷油提供救济 鼻窦压力,头痛,水汪汪的眼睛,耳朵爆裂。喷雾剂还包含 抗炎和镇痛特性 减少头部的不适和酸痛。 来源:益普索 8IPSOS视图|人性化AI 在诊断问题时,我们发现分析型AI模型在过度的 简单的方式。AI预测了一个概念当某些好处或 短语存在。这个问题消费者不仅仅是对 关键词或短语。消费者要多得多比这复杂;消费者对整个 命题,而不仅仅是个别元素。 建立成功分析的标准AI预测新产品的成功与生成的相同 作为人类,我们评估一个新产品是否价格合理,具有所需的变体,