AI ArtificialIntelligence 目录CONTENTS 亚马逊计划用ChatGPT技术升级其语音助手Alexa07 抖音发布关于AIGC的平台规范暨行业倡议07 AI大模型在智能电视落地应用,长虹开启人工智能电视2.0时代08 Meta开源AI多模态转换模型,实现六模态任意转换08 AI生成3D AIGenerate3D OpenAI推出ShapE:基于文本快速生成高质量3D资产09 ChatAvatar开启影视级3D超写实数字人生成时代09 传输 Transmission 超低损耗氮化硅集成光学技术将使光模块传输速率达每秒200万兆字节.10 我国科研团队再次刷新单模多芯光纤传输容量世界纪录11 深圳打造5G-A全国第一城,推动5G-A应用转化11 联发科发布6GNTN技术白皮书12 中国联通携手诺基亚贝尔建成超高速传输实验网12 终端与应用TerminalsandApplications 日本NHKSTRL正在研究3D图像全息显示技术13 苹果最新眼动追踪专利将惠及VR头显14 联想通过沉浸式技术支持特殊儿童教育14 摘要 P7 AIArtificialIntelligence 亚亚马马逊逊计计划划用用CChhataGtGPTPT技技术术改升造其级语其音语助音手助A手lexAal,ex意a在建造一个搜“索、更个大、性更化通的用节、目更推强荐大以”及的更大具语互言动模性型的,故实事现和对新话闻式阅的读视能频力 P7 等创新功能。 抖抖抖音音发发布布关关于于AAIGIGCC的的平平台台规规范范暨暨行行业业倡倡议,议要求平台生态参与者遵循在对抖人音工应智用能生生成成式的A内I技容术进时行应显避著免标虚识假等信规息范。的生产传播,并 P8 需求,让电视成为家庭的智能中心。 A四I川大长模虹型兼在智容能科电大视讯落飞地星应火用A,I大长模虹型开的启“人超工级智大能脑电”视在2.智0时能代电视的指落令地和应意用图。,搭提载升AI用大户模体型验的,人并工满智足能用电户视在能不更同好生地活理场解景用下户的 P8 实现任意转换,例如可以根据声音生成对应的图像。 MMeettaa公开司源发A布I了多一模个态新转的换换开源模人型工,智实能现模型六——模态Im任age意Bi转nd换,能做够到使在机视器觉更、同文步本、声全音面、、3D更深直度接、地热从量不、同运信动息六形个式模中态学之习,间 AI生成3DAIGenerate3D P9 OOppeennAAII推推出出专S为ha生p成•E3:D资基产于设文计本的快条速件生生成成高模质型量S3hDap资•产E,能3D够资通产过,输兼入具文创本造直性接和生实成用具性有。细粒度纹理和复杂形状的高质量 P9 C国h内atA初va创taArI开科启技影公视司级影3D眸超科写技实推数出字了人生文成本时生代成3D产品C具h有at更Av高at的ar,准该确产性品、采更用快渐的进运式行速3D度生和成较框好架的——CGD管re线a兼mF容ac性e,解文本决生了成3D的模3型D超与写传实统数渲字染人软资件产存可在以的直兼接容接性入问游题。戏其和通影过视输生入产 摘要 传输Transmission P10 超20低0万损兆耗字氮节化硅集成光学技术将使光模块传输速率达每秒我首国次相建关立团超队低正损在耗推、进大超尺低寸损晶耗圆、氮厚化氮硅集化成硅光芯技片术的,生并产在工国艺内。利的速用率这,种是硅当光前技光术纤研千制兆的网光络模的块数可千以倍达。到每秒传输200万兆字节 P11 我中国国信科科研集团团队光再通次信刷技新术单和模网多络芯全光国重纤点传实输验容室量实世现界了纪总录传输容量实验4.,1P相bit比/s其,去净年传的输纪容量录,3.传61输Pb容it/量s的提单升模近1490%芯,光这纤是传目输前系统国内纤传光输纤容传量输的系世统界实纪验录容。量的最高纪录,也再次刷新了单模多芯光 P11 化和绿色低碳信息基础设施的构建。 深深圳圳提打出造打5造G-5AG全-A国全第国一第城一,城,推今动年5将G-打A造应用6大转5化G-A示范区,大倍能力力推的动提5G升-A,从将技大术大到扩应展用5G的应转用化场。景5G,-A并相支比撑数5G字将化带、来智1能0 P12 区域提供基础的卫星通信。 联发科发布6GNNTTNN(技非术地白面皮网书络)技术白皮书,未来将通过卫星盖,和这地将面缩基小站城的乡兼网容络互服补务,的打差造距陆,海为空全球地没形有、地全面空网间络的覆立盖体的覆 P12 中国联通携手诺基亚贝尔建成成超4高00速G传C+输L实超验高网速传输实验网,在同板卡一可对实光现纤里38把.4T频传谱输资容源量从,4有.8助TH于z提翻升倍网成络9.传6T输H能z,力配和合容4量00。G 摘要 终端与应用TerminalandApplication P13 P14 P14 日日本本NNHHKKSSTTRRLL(正NH在K研科究学技3D术图研像究全实息验显室)示正技在术研究和开发一种用户特无殊需的佩3D戴图专像门全的息眼显镜示即技可术观,看采3D用图光像的。干涉和衍射原理,使 苹近期果公最布新的眼苹动果追公踪司专眼利动将追惠踪及专利VR能头够显基于捕获的注视数据提供的眼镜信、息V,R更头准显确和地显校示准器注,视如方电向视或、注iPa视d点或。计该算专机利显将示适器用等于。智能 和社交技能等方面的帮助。 联联想想团通队过和沉英浸国式里奇技伟术学支校持合特作殊使用儿沉童浸教式育技术打造虚拟现实体验造安馆全,、为身2临至其19境岁的之体间验因环发境育,障为碍特导殊致教严育重需学求习的困学难生的提学供生语创言 AI 1 亚马逊计划用ChatGPT技术升级其语音助手Alexa 5月3日消息,亚马逊计划用ChatGPT技术改造其语音助手产品Alexa,为其提供更先进的生成式AI功能。亚马逊的目标是让Alexa变得像是在思考而不是从数据库中提取信息,希望Alexa能成为“世界上最好的个人助理”。 具体来说,亚马逊想要让Alexa在娱乐方面有更多的创新功能,包括对话式的视频搜索、个性化的推荐、以及更具互动性的故事和新闻阅读能力。例如,如果用户想要找一个类似于Netflix的《巴黎恋人》但是不那么关注时尚的节目,Alexa就能推荐亚马逊自制的《了不起的麦瑟尔夫人》,并且给出推荐理由。如果用户想要了解更多关于推荐节目的信息,Alexa就能给出一句话的概括,并在有屏幕的设备上播放预告片,用户可以直接通过语音命令在电视上播放节目。 除了视频搜索外,亚马逊还想让Alexa提供更好的新闻摘要和问答内容,为用户呈现一份个性化的新闻要点,并且通过检索相关的新闻和信息帮助用户深入了解每个故事。此外,亚马逊还计划针对家庭用户推出一个新的故事功能。比如,Alexa能够根据一个8岁孩子对“猫和月亮”的故事需求,创造一个关于“第一只登月的猫”的睡前故事;如果孩子正在玩一个Olaf的玩具,有屏幕的EchoShow设备就能识别出来,并且把这个迪士尼角色加入到故事中。 亚马逊首席执行官AndyJassy在日前的财报电话会议上表示,目前全球已售出超过1亿台搭载Alexa的设备,他们正在建造一个“更大、更通用、更强大”的大语言模型作为Alexa的基础。 (信息来源:IT之家www.ithome.com) 2 抖音发布关于AIGC的平台规范暨行业倡议 5月9日,抖音发布关于人工智能生成内容的平台规范暨行业倡议。抖音方面称将秉承三点理念:一、抖音以人为本,新技术辅助的创作应该尊重并充分保障个人权益。二、抖音鼓励创作优质内容,禁止发布违规内容,无论该内容是否采用新技术辅助创作。三、抖音坚持真实美好,新技术辅助的创作应该避免虚假信息的生产传播。 同时,抖音要求创作者、主播、用户、商家、广告主等平台生态参与者, 在抖音应用生成式人工智能技术时,遵循五点规范:包括“发布者应对人工智能生成内容进行显著标识,帮助其他用户区分虚拟与现实,特别是易混淆场景;发布者需对人工智能生成内容产生的相应后果负责,无论内容是如何生成的;虚拟人需在平台进行注册,虚拟人技术使用者需实名认证;禁止利用生成式人工智能技术创作、发布侵权内容,包括但不限于肖像权、知识产权等,一经发现,平台将严格处罚;禁止利用生成式人工智能技术创作、发布违背科学常识、弄虚作假、造谣传谣的内容,一经发现,平台将严格处罚。” 抖音也将对人工智能生成内容衍生的问题进行治理,同时提供AI生成内容标识能力、虚拟人的注册能力和用户反馈渠道,充分保护用户权益。 (信息来源:TechWebwww.techweb.com.cn) 3 AI大模型在智能电视落地应用,长虹开启人工智能电视2.0时代 5月9日,四川长虹公司兼容科大讯飞星火等多个AI大模型的“超级大脑”率先在智能电视应用落地,并已进入内测阶段,四川长虹正式将智能电视带入AI2.0时代。搭载了AI大模型的智能电视能更好地理解用户的指令和意图,并快速响应和实现用户意图,使得操作更加便捷。 讯飞星火是科大讯飞推出的新一代认知智能大模型。这一模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,包括语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等。通过与AI大模型的结合,电视大屏不仅有用户侧体验的提升,还将迎来产业侧生产、运营等能力的升级。 搭载AI大模型的电视,其理解能力将呈几何倍数提升,“知识面”也将显著扩大,从原来覆盖30多个领域的“百事通”,成为真正的“事事通”;同时,将进一步赋能电视在家庭娱乐、学习辅导、家庭健康、知识百科等领域提供更强大的用户体验;也将进一步满足用户在不同生活场景下的需求,让电视成为家庭的智能中心。据透露,长虹计划6月在CHiQ系列8K电视全面公测,让8K电视用户率先体验人工智能电视,并陆续优化、丰富应用场景,接入更多智能终端。 (信息来源:新华网www.xinhuanet.com) 4 Meta开源AI多模态转换模型,实现六模态任意转换 Meta公司发布了一个新的开源人工智能(AI)模型——ImageBind。该模型以视觉(图片和视频)为核心,结合文本、声音、3D深度、热量(红外辐射)、运动(惯性传感器)数据,可以做到在六个模态之间实现任意转换。 ImageBind模型是机器对数据的一个整体理解,将照片中的物体与它们的声音、3D形状、冷暖程度以及它们的移动方式联系起来,使机器能够更同步、更全面、更直接地从不同信息形式中学习,从而进一步向人类的思维方式靠拢。ImageBind为研究人员开发新的系统提供了思路:可以使用文本、音频和图像的组合信息来搜索相关信息;可以结合3D和运动惯性传感器来设计或体验沉浸式虚拟世界;可以从音频中创建图像,例如根据雨林或熙熙攘攘的市场的声音创建对应的图像,也可以输入鸽子的照片和一段汽车轰鸣声后,生成一张“人开车惊动鸽群”的照片。 研究团队表示未来还将在ImageBind中加入其它感官输入流,包括触觉、听觉、嗅觉和大脑功能磁共振成像信号等,进一步探索多模态大模型的可能性。 (信息来源:网易新闻客户端c.m.163.com) AI生成3D 5 OpenAI推出Shap•E:基于文本快速生成高质量3D资产 5月7日消息,OpenAI推出最新文字生成模型Shap•E,这是一种专为生成3D资产设计的条件生成模型,用户可以通过输入文本来创建逼真且多样化的3D模型,并在几秒内完成渲染。 隐式函数(implicitfunctions)是一种用数学公式来描述3D物体表面的方法。Shap•E的创新之处就在于其可以利用条件扩散模型直接生成隐式函数的参数,而这些参数可以渲染纹理网格(texturedmeshes)和神经辐射场(NeRF)。这意味着Shap•E和当前仅输出点云(pointclouds)或体素(voxels)的模型不同,可以生成具有细粒度纹理和复杂形状