您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:计算机:Pika1.0发布,多模态AIGC应用有望加速落地 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机:Pika1.0发布,多模态AIGC应用有望加速落地

信息技术2023-12-03钱劲宇德邦证券还***
计算机:Pika1.0发布,多模态AIGC应用有望加速落地

Pika发布Pika 1.0,全新模型功能丰富。2023年11月28日,AIGC公司Pika在官网正式推出Pika 1.0,Pika 1.0亮点功能具体包括:1)文本生成视频/图像生成视频:输入几行提示词或上传一张参考图像,就可以通过AI创建简短、高质量的视频。2)将现有的视频转换为不同的风格:包括不同的角色和对象,同时保持视频内对象的结构。3)扩展视频画布(Expand):扩展视频的画布或宽高比。将视频从抖音的9:16竖屏尺寸更改为宽屏的16:9格式,AI模型将预测超出原始视频边界的内容。4)更改:使用AI编辑视频内容,比如更换衣服、添加另一个角色、更改环境或添加道具。5)延长视频(Extend):使用AI扩展现有视频剪辑的长度。 相较传统视频编辑工具,Pika 1.0优势明显。据AI绘画生成器小助手,Pika 1.0有如下优点:1)智能识别:Pika 1.0能够自动识别图片中的各种元素,并根据其特点和动作特征生成相应的动画效果,无需手动设置动画效果。2)丰富的素材库:Pika 1.0内置了大量的动画素材,包括各种特效、过渡效果和背景音乐,用户可以根据自己的需要自由选择,同时用户也可以通过导入自己的素材来定制独特的视频。3)简单易用:Pika 1.0拥有直观的用户界面,无论是专业的视频编辑师还是普通的用户,都能够轻松上手。4)快速生成:Pika 1.0的算法经过优化,可以在短短几分钟内生成完整的视频,不再需要花费大量时间等待视频渲染,可以更好地利用时间进行其他创作工作。 科技巨头、初创公司纷纷下场,有望加速多模态AIGC落地。据新智元消息,科技巨头Adobe Systems收购了Rephrase.ai,Meta推出了Emu Video,Stability AI发布了Stable Video Diffusion,Runway对RunwayML进行了更新,Pika的闯入无疑再次搅动了AI视频领域格局,而众多玩家的纷纷入局,有望共同推动多模态AIGC行业发展,接下来有望诞生更加优秀的多模态AIGC应用。 后文附录为德邦计算机团队实测Pika 1.0使用,使用案例均由团队成员自行把握。 风险提示:AI技术落地不及预期、市场需求不及预期、全球供应链风险加剧Pika文生视频、图生视频使用实测: Pika和Mj一样都需要在discord的入口进去,然后选择一个对话框进去进行prompt即可。 (一)文生视频: 方法一:使用/create指令,直接用自然语言的方式去描述方法二:按照官方重要参数的格式去描述 官方重要的参数包括以下:My concept is : (My concept)Movie Style : (Movie style) Apply the parameters to each prompt gs xx (guidance scale, thehigher, the more related to text, recommended to be 8-24) neg "xXx" (negative prompt, what you don't want the video to have)hide : (Something you want to hide) ar xxxx (aspect ratio, e.g. 16:9, 9:16, 1:1, 4:5) seed xxxx (seed number for more consistent generation)案例一:纯自然语言描述 演示视频(高清): 案例二:Prompt:A cat wearing space suit, 3D 我们可以根据自己的需求prompt,例如我想要一个3D动画的效果 (二)图生视频: 使用/create命令,点击+1more添加图片,可以不输入prompt也可以让系统自己发挥 案例一:指定了图片头发向左被风吹动的效果演示视频(高清): 利用GPT先生成一张图片,例如微笑的狐狸: 上传图片,首先不对Pika输出prompt,让其自动生成视频,效果如下 我们可以看到,Pika识别到了这张图的重点(微笑),并且根据重点进行了动态处理,最终呈现了狐狸的嘴部动作,并且加入了风的元素(用狐狸毛的动态来体现)。在这一方面Pika独立创造性会更强。 演示视频(高清):