公共部门实践 释放生成AI的潜力:政府机构的三个关键问题 政府组织可能会寻求跳上AI的潮流,但技术的复杂性可能会使他们的努力处于次要地位。我们的框架解决了一些关键的实施问题。 本文是DamienBruce,AnkitFadia,TomIsherwood,ChiaraMarcati,AldousMitchell,BjörnMünstermann,GayatriShenai,HrishikaVuppala和ThomasWeber的共同努力,代表了麦肯锡公共部门实践的观点。 2023年12月 这只是一年自生成AI(geerativeAI)工具首次引起全球公众关注以来。但是,GeeAI的经济价值估计每年达到数万亿美元-尽管其风险开始使全球企业和政府感到担忧。GeAI为政府领导人提供了指导国家经济发展的独特机会 (图表1)。与此同时,他们面临着监测该技术的缺点并为其使用建立强有力的指导方针和法规的沉重负担。 许多政府机构已经开始投资于由GeneralAI实现的转型,但是该技术的快速发展意味着很难预测它可以在哪里贡献最大的价值。在本文中,我们讨论了公共部门组织在选择投资领域之前可能需要考虑的三个重要问题: —政府机构如何应对GenAI的潜在风险? —公共部门实体如何开始改变自己的服务交付方式? —政府是否应该开发国家通用AI基础模型(构建通用AI应用程序的核心模型)? 最后,我们提出了针对刚刚开始实施通用AI用例的政府组织的八步计划。 1.政府机构如何应对GenAI的潜在风险 ? Bynow,therisksofgenerAI—suchasitstendicipaturetowardsunpredictability,inaccury,andbias—arewidelyknown.Governmentagenciesfacedifferentrisksthandoprivatesectorcompanies.For 例如,该技术可能被滥用来传播政治宣传或损害国家安全。如果政府雇员无意中通过提示将该信息引入基金会模型,则机密政府数据可能会被泄露或被盗。 GenAI模型的某些输出可能包含不准确的信息,也称为“幻觉”,这可能会削弱公众对利用这些技术的政府服务的信任。与许多私营部门组织一样,政府机构面临着GenAI的透明度以及解释GenAI概念基础以及逻辑的困难的挑战。 模型的决策和输出。后果可能包括公众对由genAI驱动的政府服务的接受度低,以及意外影响发生时责任不明确 。与所有组织一样,政府实体也面临着犯罪分子可能滥用genAI进行强大网络安全攻击的风险。 为了应对这些风险,许多国家——如美国、澳大利亚和中国——发起了创建人工智能法规和政策框架的举措,一些国家也扩大了现有的人工智能法规,明确包括通用人工智能。欧盟正在领导一项全球努力,为使用人工智能系统的任何产品或服务建立保障措施。美国许多州政府机构也发布了与人工智能相关的立法、行政行动和政策,重点是减轻人工智能系统的潜在风险——通过强调人工智能的负面影响,透明地传达人工智能在政府中的使用情况,以及解决人工智能使用的伦理方面。 然而,在世界大多数地区,这些缓解措施仍处于早期阶段,而且一代人工智能正在快速发展,这意味着各国政府必须不断修订其法规以跟上步伐。一些政府组织已经开始在利益相关者(尤其是最终用户)中开展有关geerAI风险以及如何应对这些风险的持续意识计划。例如,英国的中央。 附件1 数字和数据办公室发布了公务员安全和知情使用通用人工智能工具的指南。同样,澳大利亚的数字转型局及其工业,科学和资源部为政府机构提供了负责任地使用公开可用的通用人工智能平台的临时指导,重点是道德人工智能使用,安全性和人类监督。 2.公共部门实体如何开始改变自己的服务交付方式? 作为向公众提供服务的关键提供者,政府机构可能会优先考虑这些服务的交付,作为人工智能驱动改进的关键领域。我们的“4Cs”框架可能是一个很好的起点,它包括四个跨行业类别:内容摘要和综合、编码和软件、客户参与和内容生成(图表2)。 我们看到的大多数新一代人工智能实现都属于这四个类别之一,可以适用于私营和公共部门企业。 —内容汇总和综合。此类别涉及从大型知识库中剔除最相关的见解。例如,新加坡的GovTech开发了Pair应用程序,该应用程序汇总文本并生成报告供内部使用。 —编码和软件。软件开发可以通过使用GeeralAI编写代码和自动化测试来提高速度和提高生产率。然后需要根据用例的潜在影响、可行性和风险敏感性来确定优先级。例如,英国的HM财政部(经济和财政部)正在测试GitHbCopilot(提供编码建议的AI对程序员)以加速软件开发。 —客户参与。客户和客户服务可以从一代AI应用程序中获得提升-例如,在政府机构中,聊天机器人可以回答居民的问题或为居民定制服务。德国海德堡市推出了Lumi chatbot,该国第一个数字公民助理。该工具使人们能够轻松浏览政府服务,例如申请新身份证,获得驾驶执照和注册居住地。 —内容生成。GenAI可以帮助生成各种各样的内容,包括电子邮件、社交媒体帖子、合同和提案。例如 ,美国国防部已经开发了一种名为Acqbot的人工智能驱动的合同编写能力,以加快采购速度。 GeAI的实施可以简化政府通常在教育,医疗保健,国防和情报以及城市发展等领域提供的广泛服务(请参阅侧栏“GeAI在政府职能和服务中的潜在应用”)。在所有这些领域,我们已经看到政府机构在外部和内部操作中实施了geeAI用例,这些用例属于我们框架的类别(请参阅图表3和4)。例如,在面向客户的应用程序中,GeerAI可以帮助公众浏览政府服务并获得实时语言翻译。在内部,GeeAI可以起草演讲和官方信函等创意内容,简化复杂的官方文件,并一致按时生成财务报告和KPI。 3.政府应该开发国家通用人工智能基金会模型吗? Somegovernmentsmay立志于开发基础模型—thecoremodelsonwhichgenenAIapplicationsarebuilt.Butleadersofgovernmentagenciesmustbeawarethatthisdevelopmentrequiresconsiderableinvestmentoftimeandresources. 构建、培训和维护geAI模型的人才;必要的计算能力;以及解决构建和服务geAI基础模型所固有的潜在风险的经验。这些模型中的几乎所有当前工作都是由几家大型私营部门科技公司(Cohere,Google,Meta等)和迅速流行的开源计划(例如HggigFace,StabilityAI和Alpaca)领导的。 与全球私营部门的技术参与者不同,政府组织根本缺乏在管理风险的同时开发基础模型的能力。例如,违反知识产权和版权法可能会使拥有基础模型的政府机构面临诉讼;GeneralAI偶尔缺乏适当的 附件2 来源归属使得在其回应中更难发现潜在的版权侵权。法律含义也适用于恶意行为者可能用来骚扰、恐吓或破坏个人和组织的操纵内容,包括文本、图像、音频和视频。用户可以通过利用训练特定基础模型的数据中的固有偏见来肆无忌惮或非法行为。因此,一些政府(如冰岛和芬兰的政府)选择与全球大型语言模型(LLM)提供商合作,通过添加专有数据和见解来访问其现有模型,并根据自己的需求进行扩展和定制。 开始的八个步骤 对于刚刚开始涉足GeneralAI的公共部门机构,我们建议采取以下八步计划: 1.定义您组织的风险状况。在确定您的机构的风险参数后,设计一个计划来降低使用generAI的风险-结合内部政策、指南和意识会议。 2.政府机构可能会发现我们的4Cs框架有助于开发潜在用例列表-然后根据潜在影响和可行性对其进行优先级排序-同时避免具有高风险潜力或对错误的容忍度有限的实施。 3.选择基础模型;根据需要升级技术基础架构。大多数公共部门机构从现成的LLM开始,并使用专有数据进行微调,并与内部系统集成,以提供定制的结果 。在极少数情况下,我们看到政府机构从头开始开发和培训新模型。当发生这种情况时,它主要是由开发国家资产、管理数据主权问题或减少对私营部门科技公司的依赖的愿望驱动的。 4.确保具备必要的技能和角色。“人工智能主管”是最热门的工作之一,政府将需要为此招聘-只有高级管理人员才能协调所有与人工智能相关的活动,并确保有效解决风险。传统上,政府没有人工智能工程师,人工智能 附件3 道德官员,或提示工程师,但现在必须创建和填补这样的角色。 5.与最终用户共同开发genenAI应用程序。GenAI是一种快速发展的技术,因此最终用户的早期参与不仅对于教育他们的隐私和安全,而且对于收集他们的反馈以提高LLM响应的准确性和性能至关重要。例如,用户可以为每个响应的质量提供定量评分。 6.至少在目前,将人类保持在循环中。在一代AI技术成熟和可执行的法规到位之前,政府机构保持人类可能是谨慎的 管理人员负责并使用genenAI实现仅执行模型,而不是监控或评估模型。 7.设计一个全面的沟通计划。在所有沟通工作中嵌入必要的免责声明,以澄清genAI用例的局限性并确保安全采用。 8.从小规模开始,扩大规模。我们的研究 显示72%的领先组织发现管理数据是扩展AI用例的主要障碍之一。在我们关于扩展世代AI程序的文章中 ,我们确定了数据领导者在从实验转向扩展时应该考虑的七个操作。 附件4 GeneralAI在政府职能和服务中的潜在应用 我们看到genAI跨不同公共部门领域的使用。这是一个样本。 在教育中,genAI可以做到以下几点: —担任虚拟导师,对论文进行复习和评分 —充当学生助理聊天机器人,提供来源良好的答案 —帮助学生在研讨会和实验室,通过实验指导他们 —生成教具的初稿,如讲座脚本和测验 —根据学生档案起草大学申请的初始版本在城市发展中,genAI可以做到以下几点: —担任城市管理人员的设计合规助理 —总结市民对城市规划者热线的反馈 —初步城市规划布局草案,以加强城市设计 —设计最佳公共交通路线以减少交通拥堵 —模拟城市设计影响,如交通流量或阳光照射在税务和海关方面,genAI可以执行以 下操作: —作为复杂的导入指导综合的虚拟助手 —成为海关和税务官员的实时文件验证者 —从不同的数据源生成风险评估摘要 —为潜在的违规领域准备初步审计报告 —担任实时报税指导的公共助理 —为纳税人和贸易商准备个性化通知的初稿 在农业、林业和渔业领域,GeneAI可以做到以下几点: —对农民求助热线进行总结和分类,要求及时提供部门援助 —充当虚拟助手,指导农民了解政府计划和福利 —为更新的耕作技术提供个性化的作物管理咨询 —分析作物和土壤图像,提出提高产量的恢复技术 在司法、法院和法律体系中,genAI可以做到以下几点: —充当法官和律师的实时法律助理 —简化和解释复杂的立法和判例法 —通过总结的监管变化使法律专业人员保持最新状态 —为屡犯者提供量身定制的法律教育 —建议法官考虑司法判决的潜在结果 —自动起草各种法律文件以减轻行政负担 在国防和情报方面,genAI可以做到以下几点: —充当情报机构的实时翻译 —初步情报行动报告草案 —为特定军事任务量身定制培训内容 —模拟潜在的冲突情景进行战略规划 —生成合成的错误信息数据以增强AI监视在医疗保健领域,genAI可以做到以下几点: —简化复杂疾病的描述,以提高患者对它们的理解 —总结患者的急性护理指导 —生成简明的出院说明以优化临床操作 —作为副驾驶,为临床医生总结成像诊断 —总结患者的病史以进行简化的审查 DamienBruce是麦肯锡墨尔本办事处的高级合伙人;AnkitFadia是迪拜办事处的合伙人汤姆·伊舍伍德是高级合伙人和ChiaraMarcati是合伙人;奥尔德斯·米切尔是布里斯班办事处的合伙人;比约恩·明斯特曼是慕尼黑办事处的高级合伙人;GayatriShenai是纽约办事处的高级合伙