AI ArtificialIntelligence 目录CONTENTS LG发布生成式AI商业化服务CaptioningAI07 高通提出混合AI的概念,实现移动端AI算力突破07 制作 Make 马里兰大学提出从人眼反射重建3D场景的新方法08 普林斯顿大学推出不依赖AI技术的3D数据生成器08 AVS感知无损压缩标准取得重要进展09 SVT-AV1视频编解码器版本更新,编码速度提升超30%09 传输 Transmission 爱立信拟分三步实现面向未来的6G网络演进10 法国在埃菲尔铁塔开展5G广播试验10 电视捆绑服务将成为繁荣5G市场的关键驱动力11 我国星地激光高速通信实验实现10Gbps通信11 终端与应用 TerminalsandApplications 脑机接口新技术或将重新定义未来电视交互方式12 推特将推出针对智能电视的视频应用13 2023年NBA总决赛流媒体收视数据创新高13 无线嗅觉反馈系统可为VR/AR提供更加沉浸式的体验14 长虹发布全球首款多模态、免唤醒交互电视14 Sky推出交互式摄像机,改变电视互动方式15 调查:年轻人喜欢用手机观看更短、更吸引人、更沉浸化的体育节目15 摘要 AIArtificialIntelligence P07 LG发人布工生智成能式研AA究I所商业发化布服生务成式CapAtIi商on业in化gA服I 务CaptioningAI, 句子和10个关键词。 采新物用体零或次场学景习的技能术力,,使可AI在具1备0像秒人内类为一张利图用片经生验成和5知个识描解述读性 P07 上的AI助手有望实现更加个性化的定制服务。 高通提出混合AI的概念,实并现推移出动一端款移AI动算端力突AI破演示APP,可在手的机高上分运辨行率且St风ab格le多Di变ffu的si图on像项。目移,动并端在A1I5算秒力内突生破成意5味12着×手51机2 制作Make P08 马里兰大学提出了人一眼种反利射用重人建眼照3D片场中景的的微新小方反法射来重建摄像头视反射野中外重3D建场3D景场的景新,方有法望,为经实3D验场室景验重证建,开可辟从全真新实途人径像。的眼睛 P08 普林斯顿大大学学推设出计不了依一赖款A基I技于术随的机3数D学数规据则生成的器3D数据生成器I便nfi可n以ige无n限,生不成需各要种任逼何真外的部自参然考场资景源。库,也不依赖于AI技术, P09 AVS感知无损压缩标准取于得5重月要正进式展发布了征求意见稿。经符合国际超标高准清的视主频观海质量量信测号试的,超该低标延准时目传前输达和到处国理际提领供先了水新平的,技为术8K方+ P09 案。 S近V期T-A由V1英视特频尔编和解N码et器flix版共本同更主新导,的编开码源速软度件提编升超解码30器%SVT-AV1取得了线程显并著发进能展力,,最尤新其版适本用的于编服码务速端度的提点升播了和3直0%播-4转0%码。其优势在于多 摘要 传输Transmission P10P10P11 P11 爱立信拟分三步实现面向未来来的的66GG网网络络演演进进:第一步是构建精品是针网对络;6G第的二愿步景是与以研5究G。-A爱为立代信表预的期下6一G的波商5G用演时进间;为第20三30步年则。 法国在电埃信菲公尔司铁TD塔F开和展法5国G电广视播台试在验2023年法国网球公开赛期间在兼容埃的菲智尔能铁手塔机进接行收5试G广播节播目试,验无,需观进众行可手以机在订户阅外或使W用i-F5iG连广接播。 电根视据捆最绑新服的务爱将立成信为移繁动荣研5究G报市告场,的5关G键通驱信动服力务提供商一直在努力的创服新务移越动来服越务常项见目。,视提频供对与于各5G种移流动行宽娱带乐市服场务的(数如据电消视费)和捆流绑量商将产越生来了越巨多大。的积极影响,提供与电视捆绑服务的5G通信服务 国空间信息网络的传输能力和安全性具有重要意义。 我随国着星中地国激科光学高院速空通天信息验研实究现院星10地Gb激p光s通高信速通信业务化应用实验着中的国成已功成,功我地国将星星地地通激信光速高率速迈通入信每应秒用1于0G工比程特领时域代,,对并提意升我味 终端与应用TerminalsandApplications P12 脑工机信接部口宣新布技将术把或脑将机重接新口定作义为未培来育电未视来交产互业方发式展的重要方向,加强未来应电用视场的景交探互索方,式并,加使速交推互动无产感业化发成展为。可脑能机。接口或将重新定义 P13推马特斯将克推在出推针特对上智表能示电,视针的对视智频能应电用视的推特视频应用即将问世。这视频体、现创了作推者特和在商平业台合上作增伙加伴视,频以内振容兴的数新字战广略告。以推外特的还业将务专。注于 摘要 P13 P14 P14 P15 2相0关23流年媒N体BA数总据决显赛示流,媒2体02收3N视B数A据总创决新赛高的播放次数和独立明体观育众观数众均正增逐长步了转两向倍流多媒,体总平播台放。时电间视增占加总了播8放2时%,间表的 40%,继续占据主导地位。 无香线港嗅城觉市反大馈学系研统究可团为队V开R/发AR了提一供种更无加线沉嗅浸觉式反的馈体系验统,能够为V觉R反/A馈R装提置供,更在加沉VR浸/A式R的领体域验具。有同广时泛,的还应推用出前了景两。款可穿戴的嗅 视应用开辟了更广阔的可能性。 长6月虹发20布日全,球长首虹款发多布模了态全、球免首唤款醒多交模互态电交视互电视,首次实现使了用电体视验,交标互志的着免电唤醒视能迈力入,了给“用强户人带工来智更能便”捷时、代更,智也能为的电 照片等,使得客厅大屏变得更加智能、社交和互动。 S最k近y推,出英交国互天式空摄广像播机公,司改S变ky电发视布互了动一方款式名为SkyLive的交互式友分摄享像电机视,时扩刻展、了进Sk行y互Gl动as锻s电炼视、的体功验能互,动让游用戏户、可分以享与短亲视朋频好和 已落伍。 P15调节目查:年轻人喜欢用手机观看更短、更吸引人、更沉浸化的体育相过电关视体观育看消体费育习内惯容调,查但显年示轻,人超更过倾7向6%于的使受用访手者机仍观然看更。喜并欢且通越来更越吸多引的人年、轻更人沉喜浸欢化观的看体精育彩节片目段。、不体考育虑赛这事些新元闻素、的A广R播等公更短司、都 AI 1 LG发布生成式AI商业化服务CaptioningAI 6月19日,LG人工智能研究所在加拿大温哥华举行的全球最大计算机视觉会议CVPR2023上推出首个生成式AI商业化服务CaptioningAI,该服务旨在为用户提供更高效的图片管理解决方案。 CaptioningAI采用零次学习(Zero-shotLearning)技术,使AI具备像人类一样利用经验和知识解读新物体或场景的能力。CaptioningAI可在10秒内为一张图片生成5个描述性句子和10个关键词。 CaptioningAI的研发是LG人工智能研究所与全球知名图库Shutterstock深度合作的成果,双方在图像标签方面拥有丰富的专业知识,并且进行了AI伦理验证,确保版权透明度。目前,Shutterstock正在为全球10家客户使用CaptioningAI服务做进一步的完善工作。 (信息来源:IT之家www.ithome.com) 2 高通提出混合AI的概念,实现移动端AI算力突破 6月17日消息,高通技术公司在世界移动通信大会MWC2023上展示了一款移动端AI演示APP,可以在手机上运行StableDiffusion项目,并在短短15秒内生成512×512的高分辨率且风格多变的图像。该演示APP主要依靠高通自家的AI引擎Direct和第二代骁龙8移动平台等技术,无需依赖云服务器算力。 高通表示,过去一些可以在手机上运行的StableDiffusion项目往往生成时间长、内存占用高、耗电量大,且生成的图像风格单一,而依靠云端算力运行大型生成式AI模型同样存在一些问题:一是基于生成式AI的单次查询成本较高,随着用户数量增加,云端算力也无法支持大规模的AI应用同时运行;二是在云端运行生成式AI模型时,会涉及到处理用户数据等涉及隐私安全的问题。 鉴于此,要实现生成式AI技术的规模化落地,需要在算力和应用等方面都有所突破。高通提出了混合AI的概念,将一些AI模型放到终端侧进行处理,随着移动端AI处理能力的不断提升,预计在未来几个月内,移动端将能够运行有着100亿参数的大型模型。该突破意味着手机上的AI助手有望实现更加个性化的定制服务。 (信息来源:量子位微信公众号) 制作 3 马里兰大学提出从人眼反射重建3D场景的新方法 6月18日消息,马里兰大学的研究团队提出了一种利用人眼照片中的微小反射来重建摄像头视野外3D场景的新方法。该方法联合优化了角膜姿态、用于描述场景的辐射场以及观察者的眼睛虹膜纹理,其基础假设包括:健康成年人的角膜几何形状基本相同;可以通过训练获取眼睛反射的辐射场;可以训练一个二维纹理映射来进行虹膜纹理分解。 研究者通过Blender场景和真实人像数据集对该方法进行了评估,甚至尝试利用歌手LadyGaga的MV重建了她眼中的景象。结果显示,尽管存在角膜位置和几何估计的不准确性,但该方法可以从真实人像中重建3D场景。这项工作不仅验证了许多科幻作品中的想象场景,还为3D场景重建开辟了全新途径。 目前,从人眼反射中重建渲染3D场景的方法存在两个主要限制,一是目前的实验结果是在“实验室设置”下获得的,例如对人脸进行放大拍摄、使用额外光源照亮场景等,其在传感器分辨率较低、动态范围较小和存在运动模糊等环境中可能难以建模;二是目前该方法假设虹膜纹理是恒定的,颜色在径向上也是恒定的,在眼睛大幅度旋转时,该方法可能会失效。 (信息来源:新智源微信公众号) 4 普林斯顿大学推出不依赖AI技术的3D数据生成器 3D数据是计算机视觉领域的重要资源,但目前缺乏高质量的3D数据集,尤其是真实世界里的自然场景。为了解决这个问题,普林斯顿大学的研究团队设计了一款基于随机数学规则的3D数据生成器Infinigen,可以无限生成从山脉到海洋,从树木到珊瑚等各种逼真的自然场景。 3D数据生成器Infinigen的核心是一个程序规则库,其使用Blender的基元来生成各种子对象,如山脉、鱼类、花朵等。每个子对象都有一组高级参数,用户可以通过PythonAPI来调整这些参数,以实现对数据生成的细粒度控制。Infinigen还利用Blender的内置插件和粒子系统来模拟流体、天气等物理现象,以增加真实感。Infinigen不需要任何外部参考资源库,也不依赖于AI技术,而是完全基于数学规则来生成3D数据。这样做的好处是可以保证数据的多样性和无限性,而不受限于现有的数据样本。Infinigen还可以提供各种生成数据的真值图像,如光流图、深度图、分割图等,方便进行计算机视觉任务的训练和评估。 目前,Infinigen已在CVPR2023大会上进行了展示,并开源了代码。研究团队表示,希望Infinigen能为计算机视觉领域提供一个强大而灵活的 3D数据生成工具。 5 AVS感知无损压缩标准取得重要进展 (信息来源:量子位微信公众号) 制定A工VS作感自知20无21损年压1缩2(月P启LC动,,P历erc经ep1t8ua个l月Lo的ssl深es入sC研o究m和pre激ss烈io讨n)论标,准于2国0际23标年准5的月主正观式质输量出测感试知,无目损前压达缩到标了准国征际求领先意水见平稿。(FCD1.0)。经符合件芯P片LC(标AS准IC包)含设接计口,档后次者和则帧可存广档泛次应,用前于者主主观要无面损向或信信号号传无输损接质口量的等硬级能。的P图L像C压缓缩存流,程减主轻要图包像含处信理号系处统理中、的模内式存预与测带、宽量压化力和,系提数升编系码统四总体个性模块轻,量另级有压码缩率技控术制的作研