制作 Production 目录CONTENTS 英国学者推出文本到音频生成系统AudioLDM07 浙大、北大联合火山语音推出文本到音频生成系统07 看到科技与PICO、抖音打通一键3D全景VR直播08 爱奇艺应用百度“文心一言”探索影视产业新模式08 松下一体化摄像机AW-UE160亮相ISE202308 Ai-Media公司与英国GBNews频道推出实时字幕09 传输 Transmission 高通推出全球首个5GNR-Light调制解调器及射频系统09 高通推出5GAdvanced-ready调制解调器及射频系统10 全球广播公司的欧洲光纤主干线将扩容至100G10 中兴发布FTTR家庭及商企两大场景系列新品11 终端 Terminal Meta携手SK海力士、LGD合作开发MicroOLED,发力XR市场12 MicroLEDinPackage技术再次引发大屏显示竞逐12 生成式AIChatGPT或将革新智能家居交互13 韩国研发出智能隐形眼镜3D打印显示技术13 元宇宙热度消退,搜索量下降约80%14 摘要 P07 制作Production 音频缺失填充和音频超分辨率。 英国学者推出文本到音频生成系统AudioLDM,在生成质量和计算还能效在率不上做表额现外优训异练。的该情系况统下可支以持从文本引生导成的音音乐频、风语格音的和迁音移效、, P07 作用。 浙大、北大大联联合合火火山山语语音音推推出出文文本到本音到频音生频成生系成统系统Make-An-A质u量di音o,频能合够成实,现未文来本将、在音电频影、配图音像、、短视频等创任作意等模领态域输发入挥的重高要 P08 平台。 看到科技与PICO、抖音开打放通平一台键达3D成全合景作VV,R降直低播了VR内容创作和相分机享进的行门VR槛全。景创直作播者,可并使支用持看一到键科推技流旗至下抖Q音oo和CaPmIC系O视列频全双景 P08 爱奇艺全用面百接度入“百文度心“一文言心”一探言索”影,视丰产富业的新在模线式视频娱乐资源与A用IG户C体前验沿等技方术面相的结生合产,能将力拓,展推爱动奇影艺视在产影业视变内革容与创升意级、制。作效率、 P08 松下一在体2化02摄3像年机ISEAW视-U听E1设60备亮展相上IS展E2示023了一体化4K摄像机AW-U理E念16。0,体现了一体化、全IP、自动化远程控制和制作的新场景、新 P09 A得Ai-益Me于diaAi公-M司ed与ia英公国司GB将自Ne动ws语频音道识推别出技实术时与字专幕家人工策划相结合的字24/幕7(解一决周方7案天,,英一国天GB24N小ew时s)频全道时能段够提以供高实达时字98幕.5%。的准确率在 摘要 传输Transmission P09 P10P10 P11 高通推技出术全公球司首推个出5G首N个R-5LGighNtR调-L制igh解t调制及解射调频器系及统射频系统骁220龙MXb3p5s,峰能值够速支率持这四5G大和性4能G。语N音R-、Lig精ht准技定术位填、补超了低高时速延连接和的扩展移到动更宽多带应终用端和与行极业低。带宽的NB-IoT终端之间的空白,并使5G 射频系统——“骁龙X75”,旨在实现更高的连接速度、能效、 高通推技出术公5G司A推dv出an全ce球d-首rea个dy5G调A制d解va调nc器ed及-r射ea频dy系调统制解调器及 领域不断增长的带宽需求。 全球广播公公司司的G欧lo洲be光ca纤st主将干从线今将年扩3容月至起1将00其G欧洲光纤主干线(兰该克公福司和全巴球黎光的纤接网入络网的点一,部旨分在)满扩足容远至程10制0作G,和特4别K视是频伦传敦输、等法 以及跌倒检测等创新应用。 中兴发布了FT家TR庭家及庭商及企商两企大两主大流场场景景系下列的新F品TTR系列新品,在带宽提速升,率、可W承i载-Fi4覆K盖IP能TV力、及绿安色装上部网署、便视捷频性/等游方戏面加均速、实全现屋了智显能著 终端Terminal 进行MicroOLED开发和量产,用于Meta未来的XR设备。 P12 M场eta携手SK海力士、LGD合作开发MicroOLED,发力XR市M的i新cro一O代LE显D示更面薄板、。体M积e更ta小将且携非手常韩精国细S,K是海用力于士头和戴L式GXDRis设pla备y 亮相国际ISE展会。 P12M在i索cro尼L等ED海in外P企ac业ka积ge极技布术局再M次ic引ro发LE大D屏in显P示ac竞ka逐ge(MiP)技术并20推23出年相伊关始大,屏芯显映示光设电备、后晶,台Mi等P技国术内再企次业引也起带国着内M产iP业技界术关产注品。 P13 P13 P14 生聊成天式机器AI人ChCahtGatPGTP或T的将爆革火新使智能生家成居式交AI互有望以其极高的理解能力高品和智类能似家应居用渗。能透力率。解国决内智外能科家技居巨交头互已吸纷引纷力开不始足准的备问推题,出从相而关提产 韩国研蔚发山出国智立能科隐学形技眼术镜研究3D院打和印韩显国示电技工术研究院合作开发出了智能的隐导形航眼,镜有的望核将心先技进术的,智可能通隐过形眼3D镜打商印业实化现。基于增强现实(AR) 风向由元宇宙转变成了人工智能。 元据宇Go宙o热gle度T消re退nd,s搜数索据量显下示降,约me8t0a%verse(元宇宙)一词的搜索流持续量亏在损过趋去势一。年随间着下降20了23约年8初0%C,ha并tG且PTM的et出a的现元,宇整宙个业互务联也网的呈 1 制作 英国学者推出文本到音频生成系统AudioLDM 2月13日消息,来自英国萨里大学等机构的学者推出文本到音频生成系统AudioLDM。该系统可以通过给出的文字生成音乐、语音和各种音效,甚至是想象的声音。由于其在生成质量和计算效率上的优势,AudioLDM在发布之后迅速火遍国外,并在开源后出现了大量衍生工作。 AudioLDM基于隐式扩散模型和对比学习框架,模型亮点包括:1)可以从文本同时生成音乐、语音和音效;2)能用更少的数据和更低的计算资源实现目前最好的效果;3)使用自监督的方式训练生成模型,使文本到音频生成不再受限于文本-音频数据对缺失的问题;4)可以在不做额外训练的情况下实现音频风格的迁移、音频缺失填充和音频超分辨率;5)在声学环境、音乐的情绪和速度、音调高低以及先后顺序等方面模型展现出了很强的控制能力。 在作者发布可用接口后,网友们使用AudioLDM生成了各种各样具有创造性的声音,甚至生成了一系列不同风格的音乐专辑;还有网友结合图片生成文字的模型和AudioLDM,制作了图片指导音效生成的应用。 (信息来源:机器之心公众号) 2 浙大、北大联合火山语音推出文本到音频生成系统 由于高自由度音频生成需要依靠大量文本-音频对数据,且长时波形建模还有诸多困难,音频音效领域的AIGC技术一直没有重大突破。2月9日消息,浙江大学与北京大学联合火山语音,共同推出了一款创新的文本到音频生成系统Make-An-Audio,可以将任意模态(例如文本、音频、图像、视频等)的自然语言描述作为输入,输出符合描述的音频音效。 研究团队提出“Distill-then-Reprogram”的文本增强策略来解决音频-自然语言对数据稀少的问题,同时基于隐式扩散模型避免了直接预测长时波形。但现阶段的Make-An-Audio并不完善,由于丰富的数据来源中不可避免的样本对质量问题,导致可能在训练过程中产生副作用,生成不符合文字内容的音频。 音频合成AIGC将会在未来电影配音、短视频创作等领域发挥重要作用。Make-An-Audio在技术上被定位是“辅助艺术家生成”,借助Make-An-Audio等AIGC模型,或许在未来人人可能成为专业音效师,可以凭借文字、视频、图像在任意时间、任意地点,合成出栩栩如生的音频和音效。 (信息来源:机器之心公众号) 3 看到科技与PICO、抖音打通一键3D全景VR直播 2月12日,3D全景VR影像技术品牌“看到科技”与PICO、抖音开放平台达成合作,创作者可以使用看到科技旗下QooCam系列全景相机进行VR全景直播,并支持一键推流至抖音和PICO视频双平台。 看到科技与PICO、抖音开放平台通过接入抖音SDK完成了技术对接合作,大大降低了VR内容创作和分享的门槛,简化了直播流程。通过QooCam8K行业版开启全景直播后,观众可直接在抖音平台观看,跟随手机重力感应移动手机或上下左右滑动屏幕画面,可以自由切换视角。同时,直播内容也会同步推流至PICO视频,观众佩戴PICOVR头显观看,视觉冲击感更强。 (信息来源:IT之家www.ithome.com) 4 爱奇艺应用百度“文心一言”探索影视产业新模式 “文心一言”(ERNIEBot)是百度基于文心大模型技术推出的生成式对话产品。近日,爱奇艺将全面接入百度“文心一言”,双方共同探索将AIGC(人工智能生成内容)技术应用于爱奇艺内容搜索、内容宣发、内容创作工具、小说创作等业务。此次合作将把爱奇艺丰富的在线视频娱乐资源与百度的前沿技术相结合,进一步赋能爱奇艺,拓展其在影视内容创意、制作效率、用户体验等方面的生产能力。 爱奇艺将可优先内测试用“文心一言”,集成“文心一言”的技术,与百度在产品研发、标准制定等多个领域展开深化合作,在百度技术团队协助下打造联合解决方案,通过技术共享、培训赋能、联合营销等方式强化竞争力,为用户打造全场景人工智能解决方案及服务,同时依托智慧互联、创新互联,帮助影视产业变革与升级。 事实上,技术创新始终是推动影视产业进化的重要关键因素,AIGC等新技术或将成为影视产业的“新生产力”。此次爱奇艺全面接入百度“文心一言”,在提升内容生产和推广效率的同时,也将帮助创作者打开想象力,为用户创作更多高品质影视作品。 (信息来源:流媒体网www.lmtw.com) 5 松下一体化摄像机AW-UE160亮相ISE2023 行。2松02下3展年出度了的多欧洲款视产听品设,备其与中信最息为系瞩统目集的成是技一术体展化览摄会像(机ISAEW)-于UE近16期0,举它技是术一,款具全有新演研播发室的摄、像具机有级突别破的性高的灵一敏体度化F摄14像/2机00,0l采x,用可全在新黑的暗4条K件传下感拍器 摄更精高准质。量画面。全新设计的一体化摄像机移动机制令运动画面更平滑,也对焦U和E1参6照0还物配自备动了对图焦像两相者位的检优测势自,动对对焦焦速系度统快,、它精结度合高了,相无位论检是测对自移动物体本的次持展续会对上焦,,松还下是还在展多示个了对其焦他目产标品之的间流切程换自,动都化能和很远好程地控完制成能任力务,。并带to-来Gl了as未s(来从演拍播摄室捕制获作到的最新终理展念现。)松解下决的方未案来、演全播I室P的制工作作理流念和基自于动Gl化as的s-远域折扣的”专。制业和人制士作提三供个灵原活则而。强基大于的这控几制项,原同则时的还制能作保理证念在将内为容媒质体量和上“娱不乐打领 (信息来源:松下专业公众号) 6 Ai-Media公司与英国GBNews频道推出实时字幕 2月16日,全球直播字幕、转录和翻译解决方案提供商Ai-Media已在英国免费电视新闻频道GBNews上推出24/7(一周7天,一天24小时)实时字幕。 Ai-Media的SmartLexi混合字幕解决方案将ASR(自动语音识别技术)与专家人工策划相结合。得益于此解决方案,GBNews现在可以以高达98.5%的准确率对其24/7的全时段范围进行实时字幕处理。 据Ai-Media称,SmartLexi制作的字幕是通过符合SDI数字视频接口标准的编码器iCapEncodePro编码,以及基于iCap协议(因特网内容修改协议)的网络传送至屏幕。实际上,基于iCap协议的网络是世界上最大、最可靠的字幕传送网络。 (信息来源