您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[ABP]:科技动态2023年第11期(总第11期) - 发现报告
当前位置:首页/其他报告/报告详情/

科技动态2023年第11期(总第11期)

2024-08-05-ABP李***
科技动态2023年第11期(总第11期)

AI ArtificialIntelligence 目录CONTENTS AI图像编辑技术DragGAN新近问世07 Meta开源新AI语言模型,可识别超过4000种口语07 清华大学发布文本AI生成3D内容新算法08 AI生成广告首次通过图灵测试08 传输 Transmission 英国超高速宽带推广速度缓慢09 LTN公司通过支持组播的IP网络为全球媒体传输服务09 终端 Terminal Q-Pixel推出超高分辨率全彩MicroLED显示屏10 报告预计2023年全球VR/AR设备市场低迷10 机顶盒已成为制约4K/8K超高清电视产业发展的因素11 爱奇艺电视果投屏器新品支持真4K超高清投屏11 市场 Market 因有线电视用户减少,ESPN频道将推出流媒体服务12 未来5年全球付费电视收入将下降260亿美元12 2028年全球SVoD订阅量将增至17.6亿13 应用 Apply 虚拟数字人热潮正在影响直播乃至整个视听行业13 摘要 P07 AIArtificialIntelligence A由I图MP像II编、辑MI技T、术宾D大rag、G谷AN歌新等近机问构世的学者联合发布的DragGAN技层术对可象,实甚现至交互还式能的旋转AI3精D准图修像图,,可不应仅用能于利绘用图A、I来动重画新、生电成影、底 P07 电视剧制作等领域。 MM5e月ta2开2日源,新MAeIt语a言公模司型推,出可了识一别款超开过源4A00I0语种言口模语型——大规模多还可语以言将语文音本(语MM音S互)转模技型术。从该1模00型多可种以语识言别扩超展过至40101000种多口种语。, P08 持。 清华大大学学发T布SA文IL本团A队I生发成布3了D一内容种新文算本法AI生成3D内容新算法P量ro的lifi3cDD内re容am,e为r,构在建无高需保任真何的3虚D拟数世据界的和前元提宇下宙即提能供生了成技超术高质支 P08 AI生成的图像和文本。 A在I一生项成衡广量告广首告次创通造过力图和灵激测发试情绪反应潜力的测试中,AI生成广告使的用表AI现技优术于制传作统更的高美质国量平的面广广告告仍,需并首利次用通营过销图专灵业测知试识。来不编过排, 传输Transmission P09 英国超信高息速通宽信带管推理广局速O度fc缓om慢发布的数据显示,尽管英国政府正在率的推增动加千并兆不项匹目配,,但超千高兆速宽宽带带业务(>的30普0M及b与it/全s)光推纤广千速兆度宽缓带慢覆。盖 P09 提供可靠、可扩展和智能的分发。 L媒TN体公技司术通和过视支频持传组输播解的决I方P网案络提为供全商球LT媒N体公传司输表服示务,它已经通过其专可有以的提支供持小组于播20的0全毫球秒的IP延网迟络和提供99了.99190%0的万可个靠实性时,视为频高源价。值该内网容络 摘要 终端Terminal P10 P10 P11 P11 Q-Pixel推公出司超宣高布分推辨出率全全球彩首M款ic全ro彩LE、D超显高示分屏辨率的MicroLED显度示高屏达,每该英显寸示50屏0首0像次素使(用P专P有I)的,多可色以M大ic幅ro度LE地D提技升术A,R像/V素R密的 视觉和使用体验。 成长,出货量年长幅度有机会接近4成。 报集告邦预咨计询发20布23报年告全,球预V计R/2A0R23设年备全市球场低VR迷及AR设备出货量共计7及45AR万设台备,市全场年发减展少进1程8.2受%限。,集预邦期咨2询02认5为年,才2会02看3-到20市25场年明V显R 高清电视产业发展的因素。 机20顶22盒年已全成球为电制视约的4平K/均8K尺超寸高为清4电8.9视寸产,业中发国展电的视因的素平均尺寸为5星7用.4户寸仍。然使我用国的有是近标5清0机%顶的盒有,线机电顶视用盒户已、成约为制96约%4的K直/8播K卫超 爱奇艺电视果投屏器5K品新支品持近真日4K发超布高,清该投产屏品采用2.4G+5G双频投屏传需输求技,术可,以操让作普简通单电、视画秒面变稳“定互流联畅网,智全能面电满视足”真。4K超高清 市场Market 泛的电视行业将产生深远影响。 P12 因ES有PN线体电育视电用视户频减道少是,美ES国PN有频线道电将视推的出主流要媒卖体点服,务随着越来越多的直消接费为者取告消别了有线电视,的E消S费PN者准服备务在。未这来一几转年变推对出该流公媒司体和业更务广, P12未相来关报5告年显全示球,付2费0电22视年收到入2将02下8降年全26球0付亿费美电元视收入将累计下降2字6电0亿视美收元入。减其少中近,1卫30星亿电美视元收,入有将线减模少拟近电1视20再亿损美失元近,1有0亿线数美元家的基付本费消电失视,收IPT入V都则将减下少降约。6亿美元。138个国家中有71个国 摘要 P13 2全0球28S年Vo全D球预S测Vo报D告订显阅示量,将全增球至S1V7o.6D亿订阅量在2022年至 大的平台。 2家0的28S年Vo间D将订增阅加量将4超亿过,达101070.万6亿,N。e到tfl2ix0仍28将年是,订2阅4个量国最 应用Apply 听行业的影响正在不断扩大。 P13 虚随拟着数技字术人的热发潮展正,在虚影拟响数直字播人乃的至热整度个不视断听提行升业,其中以虚拟主播的制播受成众本最低为等广特泛。点虚成为拟备主受播关凭注借的场媒景介灵形活态多,变对、直高播效乃不至知整疲个倦视、 AI 1 AI图像编辑技术DragGAN新近问世 由MPII、MIT、宾大、谷歌等机构的学者联合发布的名为《DragYourGAN》的论文最近引爆AI绘图圈,论文中提及的DragGAN技术可实现交互式的AI精准修图,不仅能利用AI来重新生成底层对象,甚至还能旋转3D图像,可应用于绘图、动画、电影、电视剧制作等领域。 DragGAN是一种基于点的交互式图像编辑方法,可以轻松对图像进行任意拖动操作。通过使用DragGAN,不论是改变对象的形状、布局、姿态、表情、位置还是大小,都能实现精准控制。《DragYourGAN》论文中展示了一些演示案例,包括增加山峰的高度,改变模特的姿势和衣服的长度、形状,张开或闭合狮子的嘴巴,以及将一个人的表情从平淡变成微笑。下图所示即为通过交互式编辑实现的“让动物转身”。 DragGAN具有广泛的应用场景,Midjourney、StableDiffusion、Dalle-E等AI绘图工具生成的图像,都可以用DragGAN来微调细节,生成任何想要的效果。DragGAN类似于Photoshop中的扭曲变形(Warp)工具,但更加强大,因为它不是“挤压像素”,而是使用AI来“重新生成底层对象”,甚至可以旋转3D图像。DragGAN的问世带来了一种更加直观和灵活的图像编辑方式,它不仅让我们能够轻松地实现各种图像编辑需求,还展示了机器学习在图像处理方面的巨大潜力。 (信息来源1:Arxivarxiv.org) (信息来源2:新浪看点k.sina.com.cn) 2 Meta开源新AI语言模型,可识别超过4000种口语 Meta开源了一种新的AI语言模型,叫做大规模多语言语音(MassivelyMultilingualSpeech,MMS)模型。该模型可以识别超过4000种口语,是以往任何已知技术的40倍;该模型还将文本语音互转技术从100多种语言扩展到1100多种。 MMS模型是一个基于wav2vec2.0技术的自监督语音表示学习模型。它可以在无标签的数据上进行训练,比如不同语言的人们说话的音频录音。研究人员使用了一个超过1100种语言的“《新约》阅读数据集”,以及其他各种宗教类读物的无标签录音。这些数据集提供了大量多样化和高质量的语音数据,涵盖了许多稀有或濒危的语言。MMS模型在多个基准测试中表现出色,相较于现有模型,它在覆盖更多语言的同时保持了较低的错误率。 目前,Meta开源了MMS模型,并将持续改进此模型,旨在探索更多 与多语言相关的应用场景。这一创新的语言模型为全球范围内的跨语言交流和合作提供了强大的支持,并为语音技术的发展开辟了新的前景。 (信息来源:Meta官网about.meta.com) 3 清华大学发布文本AI生成3D内容新算法 清华大学TSAIL团队最新提出的文本AI生成3D内容新算法ProlificDreamer,在无需任何3D数据的前提下能够生成超高质量的3D内容,为文本生成3D内容领域带来重大进展。 ProlificDreamer算法将3D参数建模为随机变量,并用粒子来表示其分布,达到了更加逼真和高质量的3D场景生成效果。它解决了现有“蒸馏采样”方法容易产生的3D场景过饱和、过平滑和低多样性的问题。利用该算法,输入文本“一个菠萝”,就能生成非常逼真且高清的3D菠萝;给出难一些的文本,比如“一只米开朗琪罗风格狗的雕塑,正在用手机读新闻”,算法也能生成高质量的3D内容。 这项研究为构建高保真的虚拟世界和元宇宙奠定了技术基础。未来,随着3D内容AI生成方法的不断进步,虚拟现实内容的视觉效果和真实感必将大幅提升。ProlificDreamer算法的提出为3D内容AI生成领域的发展打开了新的思路,这必将对虚拟现实技术产生深远影响。 (信息来源:arXivarxiv.org) 4 AI生成广告首次通过广告图灵测试 据英国《新科学家》杂志网站报道,在一项衡量广告创造力和激发情绪反应潜力的测试中,AI生成广告的表现优于传统的美国平面广告。AI生成广告首次通过广告图灵测试。 这项比赛的灵感来自最初的图灵测试,比赛项目为根据一个名为Volt的虚构能量饮料品牌的描述和标志制作平面广告。比赛要求非人工制作的参赛作品使用ChatGPT等AI工具创建和组织广告中所有的图像和文本。17名营销专家识别3个AI制作的广告和7个由营销学生制作的广告,结果显示识别的准确率仅为57%。 评分研究公司System1Group对广告的创意质量和引发情绪反应的能力进行了评分:5颗星是最高分,1颗星是最低分。结果表明,典型的美国平面广告平均得分为1.8颗星,而两个AI制作的广告分别获得2.1颗星和2颗星。该公司表示,得分超过2颗星的广告被认为“超出常规,非常棒”。此外,在大会上,两位经验丰富的营销专业人士使用AI工具,在大约10分钟内制作出了50个广告。他们还制作出得分为2.8颗星的广告,不过, 在此过程中,他们利用了自己的专业知识来编排AI生成的图像和文本。 (信息来源:科技日报digitalpaper.stdaily.com) 传输 英国超高速宽带推广速度缓慢 5 人们对负担能力的担忧。” 在推据动英千国兆B项ro目a,db但an千dU兆K宽公带司业分务析的的普O及fc与om全光数纤据千显兆示,宽尽带管覆英盖国率政的府增正加并目标不是匹:配到。英20国25政年府底的,千英兆国项有目8是5%一的项地耗区资连数接十到亿千英兆镑宽的带计。划O,fc该om项目发的布的3002M02b2it年/s)互的联使国用家趋报势告,显但示超了高从速标连准接连(>接30(0<M30bMitb/sit)/的s)使转用向较高为速滞连后接。(30-表示英,国截通至信2办02公3年室网3络月和,全通光信纤集宽团带总覆监盖林约赛·5福0%塞的尔英在国近家期庭的和一企份业声,明中这是执行政官府萨努维力恩改·善拉国詹家评宽论带说基:础“设尽施管的超一高个速重宽要带里基程础碑设。施英在国英宽国带各公地司不首断拓席展不,仅但迫其切可需用要性提与高消公费众者对的超实高际速接连受接程好度处之的间认仍识有,很而大且差还距需。要这有突效出地表解明,决 (信息来源:Ofcomwww.ofcom.org.uk) 6 LTN公司通过支持组播的IP网络为全球媒体传输服务 媒体技术和视频传输解决方案提供商LTN公司表示,它已经通过该公司专有的支持组播