iOS 18.1 Beta版发布,Apple Intelligence试用初步开放。2024年7月29日,苹果发布iOS 18.1 Beta版,开发者可在iPhone 15Pro和iPhone 15 Pro Max上体验Apple Intelligence部分功能。当前测试版的Apple Intelligence具有以下能力:1)写作工具:用户几乎可以在任何地方重写、校对和总结文本。2)Siri新功能:如能够在文本和语音之间切换以进行Siri交互;可以跟进对话并保持从一个请求到下一个请求的上下文。3)邮件:收件箱显示最紧急的电子邮件、可以看到摘要而不需要打开邮件、智能提供快速回复的建议。4)减少干扰:仅显示可能需要立即关注的通知。 5)照片:支持自然语言搜索特定照片、视频搜索增加了查找剪辑中特定时刻的功能、Memories功能可创作故事。6)转录和摘要。当前还有许多Apple Intelligence功能尚未在iOS 18.1中推出 , 我们认为Apple Intelligence的持续完善将为用户带来全新的终端交互体验。 亚马逊全面推出AI购物助手Rufus,提升购物体验。2024年7月12日,亚马逊宣布其人工智能购物助手Rufus在亚马逊的移动应用程序上向美国的所有用户推出。Rufus接受过亚马逊广泛的产品目录、用户评论、社区问答以及来自整个网络的信息的培训,可以回答用户关于各种购物需求和产品的问题,提供比较,并根据对话上下文提出建议。自推出以来,用户已经向Rufus提出了数千万个问题,用户使用Rufus进行以下操作: 1)了解产品详细信息并听取其他用户的反馈;2)获取产品推荐;3)比较不同选项;4)获取最新产品更新;5)访问当前和过去的订单;6)回答与购物不明显相关的问题。我们认为,购物助手是生成式AI作为智能助理应用的一大重要场景,有望看到各类电商应用跟进推出类似产品改善用户体验。同时购物助手有望与电商的推荐系统相结合,为电商平台的销售和转化率带来积极影响。 OpenAI推出GPT-4o mini替代GPT-3.5,性价比优秀。2024年7月18日,OpenAI推出GPT-4o mini,在ChatGPT中,Free、Plus和Team用户将从现在开始访问GPT-4o mini而不是GPT-3.5。GPT-4o mini是OpenAI最具成本效益的小型型号,定价比GPT-3.5 Turbo便宜60%以上,具有128K个token的上下文窗口,并且拥有截至2023年10月的知识。GPT-4o mini在推理任务、数学和编码能力、多模态推理上与其他厂商的轻量级大模型相比均表现优秀。它还在函数调用方面表现出强大的性能,可以使开发人员能够构建获取数据或对外部系统执行操作的应用程序。我们认为,GPT-4o mini大幅降低了模型调用成本,并在多模态任务和函数调用方面表现优秀,有利于开发者构建各类多模态应用,将利好智能终端交互体验的创新。 建议关注: 1)算力侧:中科曙光、海光信息、寒武纪、中际旭创、浪潮信息、新易盛、工业富联、软通动力、协创数据、云赛智联、神州数码、高新发展、利通电子; 2)Apple Intelligence相关:立讯精密、东山精密、中科创达、漫步者、鹏鼎控股。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加 剧风险。 iOS 18.1 beta版发布,Apple Intelligence试用初步开放 2024年7月29日,苹果发布iOS 18.1 Beta版,开发者可体验Apple Intelligence部分功能。据苹果官网,Beta版是软件的预发布版本,仍在开发中,对于运行iOS 16.4或更高版本的设备,通过设备的设置->一般->软件更新->Beta版更新并选择开发者测试版即可安装iOS 18.1 Beta版。iOS18.1Beta版引入了由Apple Intelligence支持的一组初始功能。要尝试Apple Intelligence测试版,需要在设置中加入候补名单,设备语言和Siri语言都必须设置为英语,设备区域必须设置为美国,目前可在iPhone 15 Pro和iPhone 15 Pro Max上使用。 图表1:iOS 18.1 Beta版更新说明 据海外科技媒体9ToMac报道,当前试用版的Apple Intelligence具备以下功能: 1、写作工具: 用户几乎可以在他们写作的任何地方重写、校对和总结文本,包括邮件、笔记、页面和第三方应用程序。 图表2:Apple Intelligence写作工具 2、Siri的新功能: 1)全新的设计,当Siri处于活动状态时,屏幕边缘会发出光芒。 2)能够在文本和语音之间切换以进行Siri交互。 3)Siri现在可以随时随地为用户提供设备支持,并回答有关如何在iPhone、iPad和Mac上执行某些操作的数千个问题。 4)如果用户说话断断续续,Siri可以跟进,并保持从一个请求到下一个请求的上下文。 3、邮件的新功能: 1)收件箱顶部的新部分显示最紧急的电子邮件,例如当天的晚餐邀请或登机牌。 2)在用户的收件箱中,可以看到摘要而不需要打开邮件。 3)智能提供快速回复的建议,并会识别电子邮件中的问题确保所有问题都得到解答。 4、减少干扰(Reduce Interruptions): 一种新的专注模式,仅显示可能需要立即关注的通知。 图表3:Apple Intelligence减少干扰功能 5、照片的新功能: 1)自然语言可用于搜索特定的照片。 2)视频搜索增加了查找剪辑中特定时刻的功能,以便用户可以直接转到相关片段。 3)Memories功能可以根据用户的描述挑选照片和视频,设计故事情节制作电影。 6、转录和摘要 图表4:借助Memories可以根据用户的描述挑选照片和视频,设计故事情节制作电影 当前还有许多Apple Intelligence功能尚未在iOS 18.1中推出。包括Image Playground、Genmoji、优先通知、具有屏幕感知功能的更强大的Siri和ChatGPT集成。我们认为Apple Intelligence的持续完善将为用户带来全新的终端体验。 亚马逊全面推出AI购物助手Rufus,提升购物体验 2024年7月12日,亚马逊宣布其人工智能购物助手Rufus在亚马逊的移动应用程序上向美国的所有用户推出。此前在2024年2月,亚马逊首次推出Rufus的测试版本,只面向亚马逊移动应用程序的一小部分用户。使用Rufus需要首先确保亚马逊购物应用程序是最新的,然后点击屏幕底部导航栏中的Rufus图标,将出现一个Rufus聊天框,用户可以提出他们的问题,也可以点击其中一个建议的问题开始对话。 图表5:在亚马逊购物应用中使用Rufus的方式 Rufus是一位生成式AI驱动的专家购物助手,接受过亚马逊广泛的产品目录、用户评论、社区问答以及来自整个网络的信息的训练,可以回答用户关于各种购物需求和产品的问题,提供比较,并根据对话上下文提出建议。 据亚马逊博客,自从推出Rufus以来,用户已经向Rufus提出了数千万个问题。用户使用Rufus进行以下操作: 1)了解产品详细信息并听取其他用户的反馈 用户正在向Rufus询问关于产品的具体问题,而Rufus根据产品详情、用户评论和社区问答中找到的有用信息分享答案。用户向Rufus的提问包括“这款咖啡机是否易于清洁和维护?”和“这款睫毛膏是清洁美容产品吗?用户还会点击Rufus在聊天窗口中提出的相关问题,以了解有关该产品的更多信息,例如,“背包的材质是什么?”,用户还可以点击“用户怎么说”,以快速且有用的用户评论概览。 图表6:使用Rufus了解产品详细信息并听取其他用户的反馈 2)获取产品推荐 据亚马逊博客,用户表示Rufus在推荐具有正确功能的产品。最近有一位用户表示,他们向Rufus询问了佛罗里达州的泳池遮阳伞推荐,Rufus分享了佛罗里达州的天气、湿度和推荐的遮阳伞功能。用户会问“最好的无线户外扬声器是什么?”和“最适合儿童生日派对的草坪游戏是什么?”等问题,并会得到高质量、信息丰富的答案,帮助他们做出产品选择。 图表7:使用Rufus获取产品推荐 3)比较不同选项 用户使用Rufus快速比较功能,询问诸如“燃气和燃木比萨烤箱有什么区别?”之类的问题。跑步的用户会问Rufus例如“我应该买越野鞋还是跑鞋?”之类的问题,而购买电视的人会问Rufus“比较OLED和QLED电视”。 图表8:使用Rufus的比较功能 4)获取最新产品更新 用户通常希望根据最新的产品和趋势进行购物,Rufus可以帮助他们及时了解如“最先进的儿童Fire平板电脑是什么?”和“女性牛仔布的流行趋势是什么?”等问题。 图表9:使用Rufus获取最新产品更新 5)访问当前和过去的订单 用户可以通过Rufus快速、轻松地跟踪包裹,并可以询问诸如“我的订单在哪里?”或更具体地问“我的狗粮什么时候到?”等问题。还可以快速访问过去的订单,询问有助于他们根据以前订购的商品做出决定的问题,包括“我上次订购防晒霜是什么时候?”。 图表10:使用Rufus访问订单 6)回答与购物不明显相关的问题 由于Rufus可以回答各种各样的问题,因此它可以在顾客购物过程的任何阶段提供帮助。 对炊具感兴趣的顾客可能会首先问:“做蛋奶酥需要什么?”,为特殊场合做准备也很受顾客欢迎,购物者会问这样的问题:“夏日派对需要什么?” 我们认为,亚马逊的Rufus在购物移动应用程序上的应用,是生成式AI作为智能助理应用的一大重要场景。未来有望看到各类电商应用跟进推出类似助理产品,改善用户体验。同时购物助手有望与电商的推荐系统相结合,为电商平台的销售和转化率带来积极影响。 OpenAI推出GPT-4o mini替代GPT-3.5,性价比优秀 2024年7月18日,OpenAI推出GPT-4o mini,在ChatGPT中,Free、Plus和Team用户将访问GPT-4o mini而不是GPT-3.5。 GPT-4o mini是OpenAI最具成本效益的小型型号。OpenAI预计GPT-4o mini将通过让智能变得更加实惠,显著扩大使用AI构建的应用程序范围。GPT-4o mini在MMLU上的得分为82%,目前在LMSYS排行榜上的聊天偏好方面优于GPT-4。它的定价为每百万输入token 15美分,每百万输出token 60美分,定价比GPT-3.5 Turbo便宜60%以上。目前,GPT-4o mini在API中支持文本和视觉,未来还将支持文本、图像、视频和音频的输入和输出,具有128K个token的上下文窗口,并且拥有截至2023年10月的知识。 GPT-4o mini在推理任务、数学和编码能力、多模态推理上与其他厂商的轻量级大模型相比均表现优秀。它还在函数调用方面表现出强大的性能,可以使开发人员能够构建获取数据或对外部系统执行操作的应用程序。 GPT-4o mini在几个关键基准上进行了评估: 1)推理任务:GPT-4o mini在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准MMLU上的得分为82.0%,而Gemini Flash为77.9%,Claude Haiku为73.8%。 2)数学和编码能力:GPT-4o mini在数学推理和编码任务中表现出色,优于市场上之前的小型模型。在测量数学推理的MGSM上,GPT-4o mini得分为87.0%,而Gemini Flash得分为75.5%,Claude Haiku得分为71.7%。在测量编码性能的HumanEval上,GPT-4o mini得分为87.2%,而Gemini Flash得分为71.5%,Claude Haiku得分为75.9%。 3)多模态推理:GPT-4o mini在多模态推理评估MMMU上也表现出