2023年7月 人工智能月刊 (2023.7.1-2023.7.31) 植德律师事务所元宇宙与数字经济行业委员会AIGC研究小组中国科学院大学经济与管理学院孙毅教授课题组 (排名不分先后) 导读 最新行业动态 1.谷歌更新隐私政策,确认使用公共数据训练AI模型 2.腾讯云发布向量数据库 3.汇丰银行在英国试验量子安全金融交易网络 4.格莱美CEO解释AI新规:愿意接纳新技术,包含AI要素作品也可获提名 5.OpenAI:GPT-4API全面开放使用 6.第四范式携“式说”大模型亮相WAIC现场 7.阿里云发布绘画创作大模型通义万相 8.华为云发布盘古大模型3.0 9.联汇科技发布自主智能体OmBot 10.中国信通院联合华院计算发布《认知智能技术和应用研究报告》 11.OpenAI将向ChatGPTPlus开放代码解析器CodeInterpreter功能 12.世界银行发布《新兴技术系列:生成式人工智能》报告 13.百川开源中英文百亿参数模型 14.Anthropic正式发布全新的Claude2 15.英特尔将最新AI芯片“带到中国” 16.谷歌医疗大模型登Nature:Med-PaLM准确率与人类医生相当 17.京东推出言犀大模型 18.马斯克高调官宣AI公司 19.Meta开发出文生图模型CM3Leon 20.IDC发布《AI大模型技术能力评估报告2023》 21.Meta发布免费可商用版本Llama2 22.GitHub发布CopilotChat公开测试版 23.七大美国AI巨头在白宫作出自律承诺 24.OpenAI官宣将发布安卓版ChatGPT 25.中央政治局召开经济会议,强调推动数实融合,促进经济高质量发展 26.重庆发布《重庆市以场景驱动人工智能产业高质量发展行动计划(2023— 2025年)》 27.深圳数交所、深圳市人工智能学会等共同发起的开放算料联盟成立 28.OpenAI正式上线安卓版ChatGPT,现已面向16国用户推出 29.德国电信、e&、SKTelecom和新加坡电信共同成立全球电信人工智能联盟 30.ChatGPT攻破图灵测试,业界呼唤新基准检测AI技术 31.网易有道发布教育大模型“子曰”及六大创新应用 32.杭州市政府与三六零科技集团签订战略合作框架协议 33.腾讯联合信通院牵头编制国内首个金融行业大模型标准 34.微软、OpenAI、谷歌、Anthropic等巨头联合成立前沿模型论坛 35.华为云数字文娱AI创新峰会召开,发布盘古大模型互联网联创计划 36.谷歌DeepMind发布机器人模型RoboticTransformer2 最新法律与监管动态 1.国家网信办等七部门共同发布《生成式人工智能服务管理暂行办法》 2.欧盟委员会通过“欧盟-美国数据隐私框架”的充分性决定 3.OECD发布《人工智能监管沙盒》报告 4.加拿大网络安全中心(CCCS)发布关于生成式人工智能的使用指南 5.OpenAI遭FTC正式调查:生成虚假信息带来危害 6.联合国安理会就人工智能的风险问题召开会议,秘书长呼吁设立一个新的联合国人工智能监管机构 7.GitHub、HuggingFace等公司联合呼吁欧盟AI立法中不该阻碍开源创新 8.美国七大AI公司自愿向白宫承诺,为AI生成内容添加水印 9.美国参议员警告称,人工智能或被用于生物武器开发 10.绍兴警方侦破利用ChatGPT技术团伙制作虚假视频案 11.上海市消保委称妙鸭相机不支持退款涉嫌侵犯消费者公平选择权,后妙鸭相机进行回应,表示将增加客服人员并优化退费服务 一、最新行业动态 1.谷歌更新隐私政策,确认使用公共数据训练AI模型发布日期:2023年7月3日 来源:Engadget链接: https://www.engadget.com/googles-updated-privacy-policy-states-it-can-use-public-data-to-train-its-ai-models-095541684.html https://policies.google.com/privacy/archive?hl=en-US 摘要: 谷歌在7月1日更新了的隐私政策,内容中明确表示:将会收集个人在网上发布的内容用于训练旗下现在以及未来产出的人工智能产品或工具。 图灵财经短评 这一新政策引发了大量有关版权和隐私的争议。类似ChatGPT这样的生成式人工智能技术由于使用互联网数据进行训练,也引发了广泛的讨论。 在此之前,OpenAI等公司也面临了多起与非法数据收集用于训练大型模型相关的指控。为此,一些可公开访问的网站和平台,如Twitter、Reddit等,已经采取了相应政策,禁止其他公司从中进行数据收集或网络抓取以用于训练大型语言模型和其他人工智能产品的开发。据称,谷歌正在探讨协议以确保有效获取数据。 尽管《通用数据保护条例》(GDPR)等法规旨在保护用户数据免受滥用,但目前主流生成式人工智能开发商获取数据的途径仍处于法律监管的灰色地带。这个问题仍然需要进一步的讨论和解决方案。 植德短评 当前收集数据用于AI训练这一行为目前依然在法律上有争议,谷歌利用公开的数据训练人工智能模型行为合法性还需要结合其具体公共数据类型和范围等确定。公共数据的抓取训练算法模型可能涉及公开个人信息、隐私、版权内容、某些数据运营者的数据权益等。在个人信息利用方面,谷歌对收集与处理用户个人信息的范围和目的作出了详细说明,即使以欧盟GDPR项下更为严格的“告知-同 新的谷歌政策称:“谷歌利用信息来改进我们的服务并开发新产品、功能和技术,使我们的用户和公众受益。”“例如,我们使用公开信息来帮助训练Google的AI模型并构建GoogleTranslate、Bard和CloudAI等产品和功能。” 意”规则为标准,谷歌的这一收集与处理行为至少在形式上具有合法性。而在可版权的作品方面,虽然日本立法已经将用于人工智能的数据训练增加到合理使用的范畴之内,但是包括我国在内的其他地区,对于利用他人作品以训练算法模型,仍需取得著作权人授权。最近美国作家MonaAwad和PaulTremblay就对OpenAI提起诉讼,指控ChatGPT在未经许可的情况下使用了他们的作品来进行训练,违反了版权法。 因此对于谷歌利用公开数据训练人工智能模型,其实施过程中可能涉及的实质合法性判断,及由此可能对AI等行业产生的影响,尚待进一步观察。 2.腾讯云发布向量数据库发布日期:2023年7月4日来源:腾讯云 链接: https://mp.weixin.qq.com/s/dFb08FmUdA20oyM9PsDVOg 摘要: 7月4日,腾讯云正式发布AI原生(AINative)向量数据库TencentCloudVectorDB。该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。 向量数据库专门用于存储和查询向量数据,业界称之为大模型的“海马体”。据介绍,腾讯云向量数据库最高支持10亿级向量检索规模,延迟控制在毫秒级, 图灵财经短评 向量数据库的出现体现了底层IT链条和企业运营模式的剧变。 从产品效能看,向量数据库通过把数据向量化然后进行存储和查询,可以极大地提升效率和降低成本。它解决了大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。 从应用场景看,随着更新模型数据、帮助模型推理等新需求的出现,向量数据库正体现出新价值,许多新兴向量数据库不断涌现,同业者奋起直追。 未来,随着向量数据库的不断发展,其便捷性、易用性也将不断提升,助力“数据库+大模型+数据”模式的不断发展,三者将产生“飞轮效应”,共同助力企业步入拥抱大模型时代。 相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。 3.汇丰银行在英国试验量子安全金融交易网络发布日期:2023年7月5日 来源:CoinTelegraph链接: https://cointelegraph.com/news/hsbc-trialing-quantum-safe-financial-transaction-network-in-the-uk 摘要: 汇丰银行将与亚马逊网络服务、英国电信和东芝合作,利用量子加密技术进行一系列试验和实验。汇丰银行是第一家致力于试验新型量子“地铁”网络的银行,该网络是一种安全交易系统,利用牢不可破的加密技术通过量子密码学来确保交易安全。该量子城域网络由东芝与电信巨头英国电信合作开发,旨在允许机构之间无条件安全地进行交易。汇丰银行将在该网络上试验多个用例,包括金融交易、视频通话和边缘计算。汇丰银行将试验的关键量子技术用途之一称为“量子密钥分发”(QKD),允许相隔一定距离的两方以安全的方式向彼此发送信息。 4.格莱美CEO解释AI新规:愿意接纳新技术,包含AI要素作品也可获提名发布日期:2023年7月5日 来源:APNews 链接: https://apnews.com/article/grammys-ceo-ai-rules-interview-dea135035893deab37719c354f31a889 摘要: 格莱美CEO兼总裁哈维・梅森(HarveyMason)近日接受美联社(APNews)采访时表示,随着音乐行业不断接受AI技术,格莱美奖也将不断接受这项新技术。梅森强调:“AI或包含AI创建元素的音乐绝对有资格获得格莱美奖提名。”但同时梅森也指出:“我们不会为AI部分提供格莱美奖提名。” 梅森表示:“只要人类作出的贡献超过最低限度,且这部作品让我们觉得有意义,那么就可以被考虑获得提名。”关于AI和人类的关系,梅森认为:“我们不希望看到技术取代人类的创造力,我们希望确保技术能够增强或美化人类的创造力。这就是我们在本次颁奖周期前宣布采取这一特殊立场的原因。” 5.OpenAI:GPT-4API全面开放使用发布日期:2023年7月6日 来源:OpenAI 链接: https://openai.com/blog/gpt-4-api-general-availability 摘要: 当地时间7月6日,OpenAI在官网宣布,GPT-4API全面开放使用。现所有付费API用户都可直接访问8K上下文的GPT-4,无需任何等待。该公司计划在本月底之前向新开发人员开放访问权限,然后“根据计算可用性”开始提高可用性限制。这意味着全球开发者都能使用GPT-4大型语言模型,来增强自己的应用程序或开发全新的生成式AI应用。 6.第四范式发布式说大模型发布日期:2023年7月6日来源:InfoQ 链接: https://www.infoq.cn/article/RuOlxrAbu26Juzbfb2Ib 摘要: 第四范式携“式说”大模型亮相世界人工智能大会WAIC现场,这是“式说”发布以来的首次公开展示,更有第四范式“大模型之城”首秀,汇聚了大模型在金融、零售、房地产、航空、制造、司法等行业最具代表性的应用实践,受到广泛关注。 图灵财经短评 世界人工智能大会(WAIC)展示了大模型的显著影响。这些大模型不仅让专业门槛变得更低,使初学者也能轻松创作专业水准的作品,而且对数据处理和应用产生了深远的影响。企业开始更加活跃地搭建“数字乐高”,通过大模型快速提取数据关系和信息,从而提高工作效率。然而,与新技术一样,大模型也带来了新的挑战,例如概率生成的内容可能会有幻觉问题,业界在努力改进语料库的质量和减少“幻觉现象”。 在大模型的快速发展中,安全性也成为一个重要问题。蚂蚁集团的“蚁鉴2.0”等安全检测平台的出现,对大模型进行评估和监控,起到了非常关键的作用。这种AI对AI的评测,有助于保障大模型的安全性和可靠性。 总体而言,大模型的涌现和应用为人工智能领域带来了巨大的推动力。