您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:阿里大文娱CTO妙鸭相机–20230818 - 发现报告
当前位置:首页/会议纪要/报告详情/

阿里大文娱CTO妙鸭相机–20230818

2023-08-18未知机构Z***
阿里大文娱CTO妙鸭相机–20230818

阿里大文娱CTO「妙鸭相机」2023-08-18 「妙鸭相机」独立发展, 不强行和大文娱主业务协同 01 问:「妙鸭」爆火后,大文娱集团层面有什么反应?作为CTO,你的感受怎么样? 郑勇:大家感受都挺兴奋的,本来只是觉得它能解决一些问题,但没想到用户非常喜欢。对于「妙鸭」的火,我们一开始也是措手不及。不过既然已经这样了,我们会继续加大投入。 阿里大文娱CTO「妙鸭相机」2023-08-18 「妙鸭相机」独立发展, 不强行和大文娱主业务协同 01 问:「妙鸭」爆火后,大文娱集团层面有什么反应?作为CTO,你的感受怎么样? 问:但「妙鸭」跟大文娱的主业务并没有协同性。 郑勇:大家感受都挺兴奋的,本来只是觉得它能解决一些问题,但没想到用户非常喜欢。对于「妙鸭」的火,我们一开始也是措手不及。不过既然已经这样了,我们会继续加大投入。 郑勇:妙鸭立项的时候,我就有过这个考虑。但当时我们还是鼓励内部创新,大文娱主要做长视频,但这不意味着它只能做长视频。我觉得它(妙鸭)应该会成为一块新的业务。 问:所以当时内部有反对声音吗? 活性有什么关系? 郑勇:有,但最多是觉得(产品增长)空间不大。这些意见听听就好,最终决策还是在我们手里。问:「妙鸭」成功背后,跟阿里大文娱的组织灵 郑勇:做「妙鸭」有两个关键时间点,一是去年的12月份,我们开始整个团队去研究AIGC这个事情,包括图片大模型、文字大模型。二是今年3月「1+6+n」(阿里)组织架构调整,其实对我们做「妙鸭」影响非常大。 如果按以前的组织结构,我们想拓展一个新的业务,整个流程还是挺复杂的。但变革之后,我们组织更敏捷了。比如做「妙鸭」,我们从3月份开始研究,4月份开始立项,7月份就真正对外发布了,这个响应速度非常快。 问:具体来说,「1+6+n」给大文娱的创新机制带来了什么变化? 问:「妙鸭」诞生过程中就没有遇到过组织掣肘吗? 郑勇:核心是决策链路变短。以前我们要做一个事情,审批挺长的。但今天我们做一件事情,做和不做的决策周期都很短。如果你感兴趣某个点子,我们评估后觉得也靠谱,你就可以去做。就这么简单。 郑勇:坦白讲,内部阻力倒没有太多,我们内部从立项到上线都很支持这个项目。 但外部阻力确实挺大,毕竟是一个新的商业事物。比如我们会被质疑隐私问题,比如因为微信的合规问题,我们小程序上有些功能用不了,还面临下架的风险。最后我们花4天时间上线了iOS版本、3天上线了支付宝版本。当然这也体现了我们的组织敏捷度。 问:作为面向C端的生成式产品,妙鸭做了哪些合规努力? 郑勇:妙鸭不算严格意义上的生成式产品,我们都是照着正常合规的流程在走。 问:你怎么总结「妙鸭」的成功? 郑勇:核心原因还是它满足了用户痛点,那些写真照超出了用户预期。当初我们立项的时候,调研的内部员工基本都很满意(生成的照片),我们才决定去做。当然还有组织敏捷度和对创新的包容度。最后,很多东西和运气有关系,我们也没有说自己能力有多强,运气还是很重要的。 问:是否担心用户热情的退潮? APPStore里的「妙鸭相机」 郑勇:这个问题无非就是怎么让用户持续使用「妙鸭」。我们还在探索新玩法,比如继续丰富人像模板、上线好玩功能等,下个礼拜应该就能和大家见面了。 要做成这件事,无非就是投入情况。「妙鸭」火了之后,我们的投入只会更多。 问:最近你们成立了「神力视界」公司,把「妙鸭」并了进去,原因是什么? 郑勇:「神力视界」是大文娱科技业务的公司主体。 坦白说,妙鸭上线之前,我们也没有想到它这么火,那时候着急上线、就放到了目前这个公司主体下面(上海未序)。但现在为了便于管理,我们就把「妙鸭」主体放入了神力视界。与其说「搬家」,不如说是「回家」。 问:可否理解为「妙鸭」将在这个公司下面独立运作?未来,「妙鸭」将怎么跟大文娱业务做协同?郑勇:我们现在尽量让它独立发展。我们担心一旦协同,有时候是反作用力。 如果(妙鸭)对别的一些业务有帮助,我们会用。如果用不上,我们也不强用。因为这个(人像)赛道确实和视频不是同一个事情。 大模型时代, 视频行业的机会和挑战 问:阿里大文娱在 AI时代的战略布局是什么? 02 郑勇:大文娱的AI核心战略就是两个,ToC的AIGC(妙鸭等)和ToB的影视工业化。 大文娱有三块主要业务,优酷、阿里影业、大麦网,它们涵盖了影视工业化的全流程,如影视制作、宣发、传播等。我们会围绕各个环节,用AI 去做一遍。这也是我作为CTO的主要工作。 问:大文娱做影视工业化,主要是在内部做、还是有可能普及行业? 郑勇:我们现阶段先围绕自己的内容去做,后面肯定希望整个行业能够用起来。到时候我们也会受益。问:以影视制作为例,AI会改变其中哪些环节? 郑勇:影视制作环节其实是一个非常长的链路。它包括最早的剧本筹备创作阶段,接着是拍摄制作环节,比如拆文字分镜、图片分镜、预演、再到拍摄、后期等。 AIGC能够带来的,既有(剧本)创作上的提效,比如帮助创意方向的确定和素材的收集。在图片上,它也会给服装、妆造定型、整个艺术审美提效。最后是拍摄,我们重点做虚拟拍摄,分2D和3D两套方案,大部分剧组都会用2D方案,3D这一块案例还不太多。但总体成本能降40%以上。问:国内的影视工业化水平和国外差距如何?背后原因是什么? 郑勇:今天中国整个影视工业化水平,和好莱坞差距还是挺大的。我们都不是按几年比,是按十年、二十年去比。 影视工业化包括内容质量、生产成本和周期等等。大家如果细心去看一下最近国内上线的视效很好的电影,再去看十年前人家拍的《阿凡达1》,制作上的质量差距都还是很大的。好是好在,人家已经把标杆放在那里,我们今天可以去学。 这种差距的根本原因,主要是国内外整个影视生产的模式不一样。国外是制片中心制,而国内到底以谁为中心,每个剧组不一样,有些是导演、有些是制片人、有些是片方。由于底层机制不一样,制作 问:面对技术冲击,像美术这样的岗位会被取代吗? 人员相关的接受度也不一样。今天我们只能说,通过技术、或别的方式,如何改变这个现实。阿里影业|图片来源:视觉中国 郑勇:其实最终还是落到审美上。不管是用MidJourney、StableDiffusion,最终图片效果和人的审美关联度还是挺强的。我们内部发现,一个美术生和一个理科生做出来的图片档次会差很多。所以不用担心美术这个工种不存在,只要你审美功底在,你做出来的东西就比别人好。 问:你是否和业内投资人有过交流?他们最关心AI技术会对影视行业实现哪些突破? 郑勇:我和投资行业聊得不多。AIGC能够让影视行业整个生产方式大大提效,这是非常明确的。而且今年在电影赛道,可以看到显而易见的复苏。 问:为什么 AIGC在影视文娱行业的渗透和融入程度,比工业、汽车等行业要更深? 问:关于文字和图片的模型现在已经比较成熟了,视频领域的大模型何时会出现? 郑勇:今天AIGC归功到底,一个是文字上的突破,一个是图片上的突破。文娱行业就是艺术表达,虽然最终以视觉的方式呈现,但前期的基础都是文字和图片。这也是为什么文娱行业会第一步先应用。 郑勇:我们没有做视频大模型,因为技术难度很大。今天AI生成文字和图片都可以,但生成高精度、高质量的视频还不行。这几年我们攻克它的可能性不太高。 虽然目前有一些产品,能够用AI把文学小说生成视频,那个确实做出来很快,但它的质量就在那里。现阶段可能有些人看,但后面就没有人看了。 「扶不起」的大文娱, 迎来了新的十字路口吗? 问:「妙鸭」火了之后,内部士气是不是得到了一些提振? 03 郑勇:那肯定,对士气是很大的提振。 问:阿里集团对它的关注到哪一个层级了? 郑勇:我不知道。但我觉得集团能把「妙鸭」写到财报里,应该还挺高的吧。 问:在 AI时代,大文娱的决心是怎样的? 郑勇:我们的目标就是要大力发展科技,无论在人和资金的投入上,都是有做加法的。 问:身处阿里体系,你们会因此得到更多的资源支持吗?比如算力。 郑勇:算力问题,我们也需要跟阿里云去协调。因为我们只能算它的内部客户,也要走正常的商业结算,协同机制一直很良性。 另外,我们在模型调优上也做了很多工作。比如以前100张卡训练100个人,现在100张能训练300人。所以现在你会发现用「妙鸭」基本不用排队了。 问:目前 AI的能力似乎只停留在图文层面,它是否主要影响的是小红书、抖音等产品,而非优酷这样的长视频产品? 阿里大文娱|图片来源:视觉中国 郑勇:其实不管是小红书还是长视频网站,用户核心消费的还是内容。在长视频这个赛道上,AI也能降低内容生成的成本、缩短生产周期。现阶段看,AI可能只是辅助小红书,但拉长时间看它还是会回来(辅助长视频)。 问:PGC、UGC曾先后改变了文娱行业的商业格局,AIGC会是下一个变量吗?这是否是大文娱集团的新机会? 问:现在「妙鸭」盈利吗? 郑勇:AIGC核心是GC(生成内容),UGC、PGC也是生成内容。它核心影响的还是内容。以视频为例,这绕不开最开始的IP故事吸不吸引人、剧本够不够好,以及后面的制作和呈现效果好不好。而大文娱给自己的定位是,「为好内容全力以赴的科技公司」。 郑勇:我们不会亏太多。接下来我们会提供一些付费模板,做更多的商业化尝试。