AI ArtificialIntelligence 目录CONTENTS Meta推出文本生成三维动态场景AI模型07 英伟达发布四款AI推理芯片07 华为将上线盘古系列AI大模型08 Newsbridge公司推出生成式AI索引技术MXT-108 腾讯正式发布AI智能创作助手“腾讯智影”09 为规避过度依赖,OpenAI之外的同类公司受到青睐09 传输 Transmission 中国联通现有117万个5G基站,约占全球30%10 YouTube近期加入安全可靠传输协议联盟10 MuxIP公司推出支持广播的免费流媒体电视方案11 终端与应用TerminalandApplication 国科微面向AR/VR市场推出GK68系列芯片11 海信发布百吋MiniLED电视E8K12 新华网、新华智云联合发布首个AIGC元宇宙系统12 腾讯公布可还原人脸朝向、表情的视频换脸专利13 UE5用视频转换实现高精度面部捕捉与数字人建模13 以色列yes公司多措并举,增强智能电视用户体验14 苹果在为AppleTV应用测试“多视图”新特性14 制作 Production HitachiKokusai展示最新4K超高清相机系统15 摘要 P07 AIArtificialIntelligence Meta推提出首本个生通成过三文维本动描态述场生景成A3ID模动型态场景的方法MAV3D,基3D于/4D4D数动据态即神可经生成辐能射在场任和意文视本角到下视观频看的的扩三散维模动型态,视无频需。任何 P07 英伟达在布GT四C款20A2I3推大理会芯上片发布了四款AI推理芯片,分别适用于视查频询云与推理、。生成式AI图像处理、大模型处理和海量数据的存储、 P08 华为将官上网线显盘示古,其系盘列古AI系大列模A型I大模型中的NLP大模型、CV大模型生成和、科内学容计理算解大,模C型V即大将模上型线兼。顾其了中图,像N判LP别大与模生型成用能于力中。文内容 P08 Newsbridge公司推出生成式AI索引技术MXT-1,能够每分钟索引基于超过AI5大0规0小模时索的引视频,等媒可体极资大产降成低为大商规业模现使实用。AI的成本,使 P09 腾讯正式发布全AI新智的能A创I智作能助创手作“助腾手讯“智腾影讯”智影”,推出智影数字人、文和本UG配C音的、创文意章转转化视提频质等增A效I创。作工具,可为PGC的工业化规模产出 P09 为避避免过对度AI依GC赖领,军Op企enA业IO之p外enA的I同的类过公度司依受赖到,青以睐及削减成本方面的考基础虑模,型十提多供家商初开创展公合司作和,投以资建者立正健在康转运向行与的除生O态pe系nA统I之。外的其他AI 摘要 传输Transmission P10 中截国至联2通月现,有中国11联7通万已个有5G5基G套站,餐 约用占户全近球2.230亿%户,5G基站117 P10 万元。个6,G计方划面今,年联在通5预G计基础到设20施25建年设推和出科技6G创应新用方场面景投,入2近03千0亿年 实现6G规模商用。 端低延迟视频传输方面的广泛普及。 Y实ou时Tu视be频近网期络加和入安视全觉可协靠作传解输协决议方联案盟提供商Haivision宣布YSoRuTT的ub支e持已是加开入源安协全议可的靠一传个输重协要议里(程S碑R,T)体联现盟了,该Y协ou议Tu在b端e对到 费流媒体电视频道,从而大幅降低广播公司的成本。 P11M流u媒xI体P公自司动推化出解支决持方广案播提的供免商费M流ux媒IP体推电出视支方持案广播的FASTHub方公司案,和旨有在线创电建视通运用营商传能输最的大单限一度工利作用流基程础,设使施卫,星能运快营速商生、成广免播 终端与应用TerminalandApplication P11 P12 国科微公向司针AR对/VARR市/V场R市推场出推GK出6了8系高列集芯成片度、低功耗的GK68系列以及芯片HD,R支Vi持vid8、KM12E0MFCP、S边的缘全计景算36和0超度分视辨频率解图码像和处显理示。输出, 海信发布百行吋业MM首in款iL千ED级电分视区E百8K吋MiniLED电视E8K,除了尺寸升声环级绕外音,响其系在统分方区面数都量有、所控提光升能。力、环境光感智能技术和双侧发 P12 P13 新华网、新华智云联合发布布首首个个AAIGIGCC元元宇宇宙宙系系统统“元卯”,将集景在合元多宇类宙虚世实界融的合智软能硬生件产,品消,解实元现宇数宙字数人字、内数容字生内产容成和本数压字力场。 腾讯公视布频可换还脸原专人利脸“朝待向播、放表视情频的中视人频脸换的脸替专换利方法和装置”获授权还,原视该频专中利人提脸供的一朝种向将和视表频情中。的人脸替换为其他人脸的技术,可 人到数字人的转换。 P13U虚E5幻用引视擎频转U换E5实最现新高精版度本面的部捕Li捉ve与Li数nk字F人ac建e模和MetaHumanA频n中im真at人or一应比用一程还序原可的以高将保仅真用数字iP人ho动ne画录,制在的几视分频钟转内换实成现和从真视 P14 以色列电ye信s公司多B措ez并eq举的,付增费强电智视能子电公视司用户ye体s采验用最新版本的 P14 S和y视na频m网ed络ia技G术o,体用验以管增理强器智,能以电及视S用yn户am体e验di。a的安全解决方案 苹果在正为在为ApApplepTleVT应V用应测用试测“试多一视项图名”为新“特多性视图”的新特性,该内容特。性的实现与完善将可支持用户同时观看多达四个画面的直播 制作Production P15 HNAitBacShhioKwok2u0s2a3i上展,示H最it新ac44hKiK超ok高u清sa相i公机司系展统示了最新研发的4K超作和高广清播相制机作系,统还,可该作系为统组具件有应突用出于的下性一能代可摄用像于机专中业。现场活动制 AI 1 Meta推出文本生成三维动态场景AI模型 3月19日消息,Meta首次提出通过文本描述生成三维动态场景的模型MAV3D(Make-A-Video3D),可以为视频游戏、视觉效果或AR/VR应用生成3D动画。 在具体实现时,MAV3D使用了4D动态神经辐射场(NeRF)、基于输入文本到视频(T2V)的扩散模型,对生成的动态场景外观、密度和运动一致性进行了优化。模型不需要任何3D或4D数据,只在文本图像对和未标记的视频上进行训练。模型生成的动态场景视频可以在任意机位或角度进行观看,并可以合成到任意3D环境中。但是目前的生成效果还处于初级阶段,只能生成一些简单的对象。 图:MAV3D沿时间维度和视角维度生成的样本。左图:一只正在打球的柯基犬。 右上角:一个骑士在砍柴。右下角:一只袋鼠在做饭。 (信息来源:arXivarxiv.org) 2 英伟达发布四款AI推理芯片 英伟达在3月21日的GTC2023大会上发布了四款用于AI推理的新芯片。 第一款AI视频芯片L4具有视频云推理功能,其功能主要集中于视频解码和转码、视频内容审核、视频通话等,可在视频通话过程中实现背景替换、重打光、眼神交互、语音转录和实时语言翻译等。 第二款推理芯片L40主要用于Omniverse(英伟达的“工业元宇宙平台”)、图形渲染和生成式AI,能够胜任文本到图像、文本到视频等跨模态生成任务。同为针对图像的AI推理芯片,L40相比L4更通用,可以实现所有与图像相关的场景优化。 第三款芯片H100NVL是面向ChatGPT等应用的针对预训练大模型的芯片。一台8卡的H100NVL的速度是目前标配8卡A100服务器的10倍。 该芯片的推出不仅可提升大模型训练速度,也将降低相关公司在算力方面的成本。 第四款芯片GraceHopper是存算一体的超级芯片。其由GraceCPU和HopperGPU连接而成,拥有一个900GB/秒的高速接口。相较于CPU和GPU之间传统的通过PCIE连接的方式,在Grace中查询嵌入并传输到Hopper的速度快了七倍。GraceHopper可以用来处理大型数据集,适用于推荐系统和大型语言模型的AI数据库。 3 华为将上线盘古系列AI大模型 (信息来源:甲子光年公众号) 3月27日消息,华为旗下的盘古系列AI大模型即将上线,包括自然语言处理(NLP)大模型、计算机视觉(CV)大模型等。据官网介绍,盘古大模型使用了大量的中文语料库进行训练,拥有超过1千亿个参数,可以支持文本生成、文本分类、问答系统等多种任务。 盘古NLP大模型是被认为最接近人类中文理解能力的AI大模型。其使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性,当适用于下游应用时,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。 盘古CV大模型兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。模型使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。基于模型大小和运行速度需求,盘古大模型支持自适应抽取不同规模的模型,使得AI应用开发快速落地。 (信息来源:TechWeb网www.techweb.com.cn) 4 Newsbridge公司推出生成式AI索引技术MXT-1 4月4日,AI公司Newsbridge宣布推出生成式AI索引技术MXT-1。该技术使用自然语言模型生成易于理解的视频内容描述,即基于文本、徽标、地标、对象、动作等原始的视频输入来生成对应的语义描述,旨在提高视频内容的可搜索性。 MXT-1专门针对数十万小时的娱乐和体育视听内容开展了训练,能够每分钟索引超过500小时的视频,使用户可以在短时间内查询和了解大量内容,在定位视频后可快速精准利用视频具体内容。MXT-1极大降低了大规模使用AI的成本,使基于AI大规模索引视频等媒体资产成为商业现实。目前,MXT-1已推出测试版,并逐步部署在包括JustIndex、Media Hub、MediaMarketplace、LiveAssetManager等Newsbridge的所有云解决方案中。 (信息来源:TVNewsChecktvnewscheck.com) 5 腾讯正式发布AI智能创作助手“腾讯智影” 耀KPL比赛,可为听障人士进行赛事报道和解说。 了智3影月数3字0人日、,文腾本讯配正音式、发文布章全转新视的频AI等智A能I创作工助具手。“这腾些讯智能影创”作,工推出具旨的创在意从转“化人提”质“增声效”。“影”三个方面,为PGC的工业化规模产出和UGC或音“频智内影容数,字几人分”钟是内“即腾可讯生智成影数”字最人核播心报的视功频能。,“用腾户讯只智需影要”输目入前文开本放了字数人十服款装、风添格加多不元同的的数动字作人、,背用景户等可,根让据真自人己出的镜需的求视选频择制数作字变人得形更象、加数简单片。、此视外频,和“音智频影素数材字,人就”能还得能到实自现己形的象数克字隆人功分能身,。用“户智通影过数上字传人”少创量作图工在多具个价场格景亲里民都且有操成作功便应捷用,,利比于如实智现影数手字语人数自字由人。服目务前了,“冬智奥影会和数王字者人”荣 (信息来源:腾讯网new.qq.com) 6 为规避过度依赖,OpenAI之外的同类公司受到青睐 随着AIGC日益火爆,有人预计AI市场将在未来几年内增长数倍,到2025年市场规模有望达到900亿美元。出于对依赖单一公司的戒心以及削减成本的意愿,十多家初创公司和投资者表示,他们正在转向同AIGC领军企业OpenAI的竞争对手开展合作。 比如,AI讲故事初创公司Tome已经引入OpenAI竞争对手Anthropic的文本模型,并计划从OpenAI的照片生成模型Dall-E转向由StabilityAI开发的开源模型StableDiffu