2024年AIGC「发展现状」剖析 AIGC,即人工智能生成内容,是近年来在人工智能领域兴起的一项重要技术。它通过使用机器学习和深度学习等技术,使得计算机能够自动生成各种形式的数字内容,如文本、图像、音频和视频等。 AIGC的发展可以追溯到上世纪80年代,但真正取得突破性进展是在过去的十年里。随着深度学习技术的发展和大数据的积累,AIGC技术在自然语言处理、计算机视觉和语音识别等领域取得了进步。 随着互联网和移动互联网的普及,用户对多样化、个性化内容的需求日益增长,这为AIGC技术的应用提供了强大的驱动力。AIGC技术在内容创作、个性化推荐、智能客服等领域的应用,能够有效提高生产效率、降低成本,并提升用户体验。 在国内,百度、腾讯、阿里、科大讯飞、字节跳动等科技巨头在AIGC技术的研究和应用方面取得了许多重要成果,推动了国内AIGC技术的发展。 AIGC技术在2023-2024年飞速发展,对多个行业产生了颠覆性的影响。其中AIGC已经在广告、游戏、自媒体等内容创作领域实现了广泛应用,教育、电商、软件开发、金融等领域也尝试扩大AIGC的应用范围。 从商业视角来看,AIGC技术可以提高生产效率,降低成本。例如,在内容创作领域,AIGC技术可以帮助创作者更快地生成高质量的内容;AIGC技术可以提供个性化的服务,提高用户体验;AIGC技术可以帮助企业进行创新,帮助领导者开拓新的商业模式。 AIGC技术的前景非常广阔。随着技术的不断进步,AIGC技术有望在更多的领域得到应用,并进一步提高生产效率和用户体验。同时,AIGC技术的发展也面临一些挑战,如数据隐私、算法偏见等问题,需要进一步的研究和解决。总体而言,AIGC技术的发展将对社会产生革命性影响,并成为未来科技发展的重要方向之一。 2024年AIGC「应用场景」 目前,大部分智能手机已经内置了先进的AI大模型。这些模型结合本地计算能力和云端资源,极大地提升了手机助手的功能。例如,文心一言、Kiwi等传统对话型AIGC产品已广受市场认可,这些产品的普及加速了AIGC技术在消费者市场的应用。同时,社交媒体平台如微博、快手、哔哩哔哩等也开始采用评论机器人等技术,通过AIGC的拟人化特性,增强用户体验并提升互动的趣味性。 在商业领域,AIGC技术已被广泛应用于办公流程优化和AI素材库的建立,有效提升了工作效率和专业性。例如,AIGC产品不仅帮助企业优化客服、美术和宣传发行等工作流程,还显著降低了人力成本。这些进展证明了AIGC技术在帮助企业实现降本增效方面的巨大潜力。 AIGC在「影视」行业的应用 在短剧行业,部分内容生产者已开始尝试利用AIGC工具拓展海外市场。这包括使用AI换脸技术,将演员的面孔更换为目标市场观众熟悉的人种,以及利用AI配音和字幕转换为当地语言。然而,这些工具目前主要用于快速占领市场,往往不会优先考虑质量,因此这些技术将很快经历迭代更新。 在影视宣传领域,AIGC工具也开始被应用,主要用于生成部分美术物料,从而支持宣传设计师的创意工作。 至于内容制作本身,AIGC技术目前还未在真人影视制作流程中广泛应用。预计随着如Sora等AIGC产品的成熟和商用推广,未来将在这一领域看到更多的实际成果。 AIGC在「游戏」行业的应用 AIGC技术在独立游戏领域已广泛应用。自2023年起,部分大型游戏公司也开始逐步推进工业化的AIGC美术流程。尽管如此,这些公司在实际应用中仍保持了相当的克制。除了美术外,AIGC技术在声音和配音领域也已稳定使用,同时在市场推广和用户获取等方面,游戏行业同样展示了AIGC广泛应用的可能性。 虽然AIGC在游戏行业的发展速度非常快,但它也是目前游戏公司收到消费者投诉和争议最多的话题之一。 AIGC在「漫画」行业的应用 在漫画行业中,AI技术用于上色已非常成熟。许多流水线式的网文改编漫画项目已经开始采用AI上色技术,这项技术可以有效替代传统的手工上色过程,大幅提高生产效率。AI不仅能够快速匹配漫画的风格和色调,还能根据不同的情节和氛围自动调整颜色,以增强视觉效果和情感表达。 AI上色技术的使用还降低了制作成本,使漫画创作者能够将更多时间和精力投入到创作原创内容和质量需求较高的作品上。随着技术的进一步发展,预计AI将在漫画创作的其他环节,如分镜绘制、角色设计等前期工作中发挥更大的作用,进一步推动行业的创新和发展。 AIGC在「动画」行业的应用 在动画行业中,AIGC逐渐成为创新工具。部分动画制作公司已经开始利用AI技术来生成动画的部分场景,或是基于原画生成道具模型。这不仅优化了前期流程,还显著降低了制作团队间的沟通成本。例如,通过AI自动生成的场景可以帮助快速传达视觉效果的风格需求,从而加速决策过程并提升效率。 到了2024年,动画领域已见证了「全AI流程」制作的动画作品的问世。这类作品虽然在表现形式上更接近于动态漫画,但它们的出现标志着AI技术在动画制作中的潜力和前景。尽管这些早期作品在视觉呈现和剧本上还有极大的提升空间,但它们已经展示了AI在动画创作中的初步应用,是比较实验性的结果。 展望未来,我们期待如Sora这样的技术产品的迭代,他们有可能为AI动画引入更丰富的镜头语言和表达手法。这将使AI不仅仅是动画制作的辅助工具,而是能够完全参与到创作的各个环节中,从而开启AI动画的新篇章。随着这些技术的成熟和普及,我们可以预见到一个更加多样化和创新的动画垂类产业的兴起。 AIGC在「网文」行业的应用 在网文行业,AIGC的应用尽管面临一些技术和实践的挑战,但已经开始在辅助创作方面显示出其独特的价值。现阶段,完全由AIGC生成的网文还未能广泛实现,原因在于当前大型AI模型在长篇连续文本生成时会受到记忆持续性和深度理解方面的局限,这些问题限制了AI在理解复杂剧情和维持文本一致性方面的能力。 目前,AIGC技术已经在协助网络文学作者方面发挥了重要作用。AI可以帮助作者设计复杂的角色性格和背景故事,提供创意的剧情发展思路,以及生成与文本内容匹配的插图。这些工具不仅可以提升创作效率,还能激发作者的创新灵感,帮助他们突破创作瓶颈。 尽管AIGC在网文创作全自动化方面还有进步空间,它的辅助功能已经成为推动网络文学创新和发展的重要力量。未来,随着技术的进一步发展,我们可以期待AIGC在网文行业发挥更大的作用。 2024年AIGC「常用工具」 总的来看,受惠于OpenAI的可开发性和GPT4的易用程度,大量基于GPT4的AIGC工具诞生,国内在文心一言等大模型的API开放后也迎来了中文化AIGC产品潮。全球互联网迎来了移动互联网时代后的又一个产品爆发期,硬件厂商、云服务厂商、AI厂商也在爆发期中获得了新的机会,配合民用产品的百花齐放,得到了社会和资本的关注和垂青。 随着头部AI厂商不断推出可商业化使用的产品,大量开源技术也随之公布于众,学术界、商界就开源和闭源的AI发展发表出了不同的看法。就目前来看,开源和闭源AI产品都在为AIGC的普及做出积极的贡献,并未出现垄断的态势。 但与此同时,关于AIGC产品的伦理和版权风险在不断扩大,利用AI作恶的成本因为产品滥用而降低,这也是各家厂商需要迫切解决的风险点。 下面我们将从文字、图像、音频、视频、办公五个方向切入,例举现阶段AIGC常用的工具,并选择一款进行详细介绍。 「文字工具」 userid:520426,docid:161545,date:2024-05-10,sgpjbg.com 工具名:ChatGPT开发商:OpenAI 应用场景:目前大部分网民的AIGC入门产品,现阶段最实用的文字类AIGC工具。用户只要简单的了解,就可以通过对话完成知识检索、文本概括、创意获取等流程。 发展现状:GPT4已相对成熟,对中文兼容性比较好,可开发性高。 「图像工具」 工具名:Midjourney开发商:Midjourney 应用场景:场景创作、海报创作、人设创作 发展现状:开源图片AIGC工具StableDiffusion在开发性上更强,但Midjourney的易用性更高,对于二次优化需求不强的美术环节更实用。 「音频工具」 工具名:Suno开发商:Suno 应用场景:为低成本剧集、广播剧、独立游戏等制作配乐,包括纯音乐和AI人 声歌曲。 发展现状:能够满足对音乐品质要求不高的听众需求,但目前中文人声清晰度还不够,加工再创造的难度更高。 「视频工具」 工具名:Dreamina开发商:字节跳动 应用场景:基于图片或文字描述,生成3秒以上的视频。可用于部分图片的动态化,以及补足部分拍摄镜头的缺陷。 发展现状:目前国内可使用的文生视频/图生视频中生成效果比较好的产品,但和Sora仍存在差距,生成时长较短,视频稳定性不足,很难直接应用。 「办公工具」 工具名:WPSAI 开发商:金山软件 应用场景:协助使用者完成文字、排版上的优化。 发展现状:综合功能完备,但仍与专业做文档调整、PPT优化的部分细分工具存在差距。 2024年AIGC十大「发展趋势」 趋势一:AIGC,推动文娱产业转型升级 随着AI技术在文字、声音、图像和视频等多个领域的发展,其相关产品的普及程度持续提升。用户对这些大型AI模型的运用越来越熟练,将AIGC应用到文娱领域已经不再是一个新奇的概念。尽管在文娱产业全流程中引入AIGC还不现实,但越来越多的工具正在优化至可用。AI的应用使得企业在低端需求上降低了对专业人员的依赖,同时也降低了行业的入门门槛。 这种趋势预示着文娱内容生产的工业化过程将会迎来一系列创新的AIGC产品。这些产品不仅能够降低成本、提升效率,而且标志着行业对未来技术的积极拥抱。随着技术的进步,我们可以预见到AIGC将在创作、编辑、分发乃至营销等多个环节中发挥重要作用,极大地推动文娱产业的转型和升级。 总的来说,文娱行业,尤其是比较新的ACG相关领域,其工业化正处于一个由点到面的转型期,AIGC技术的融入无疑将为这一行业带来前所未有的创新机会和发展潜力。 趋势二:开源与闭源产品互补,形成良性循环 随着AIGC技术的快速发展,开源与闭源产品之间的相互作用日益显著。由于训练一个大型AI模型需要巨大的成本投入,许多公司选择将其大模型闭源,以便专注于提升自身产品的性能和特色。然而,尽管这种趋势明显,如Meta、Google等公司仍然坚持推动开源技术的发展,这大大促进了AIGC技术的普及和创新,为中小规模的团队提供了接触和使用AIGC工具的机会。 在未来,随着AIGC技术门槛的逐渐降低,越来越多的个人开发者和初创团队将利用开源技术开发出创新且实用的AIGC应用。这些产品往往会在遵守开源协议的前提下维持开放状态。同时,闭源产品也从开源社区获得灵感,不断开发出商业性更强的功能。这些商业功能也有可能被开源社区借鉴,从而丰富了开源工具的功能性和易用性。 这种互补的关系创建了一个良性循环,不仅推动了技术的快速发展,也帮助商用AIGC产品逐步成熟。在这个过程中,开源和闭源产品的互动不断提升彼此的价值,共同促进了整个AIGC领域的创新和扩展。 趋势三:使用门槛再降低,覆盖领域更多元 在2022至2023年,虽然像ChatGPT和Midjourney这样的AIGC工具已能以自然语言进行交互,但大多数其他AIGC工具的使用便利性仍待提升。从2023年下半年开始,AIGC产品通过应用程序(APP)和硬件集成等方式取得了显著进步,使得绝大多数常用AIGC工具在使用上变得更加友好。 此外,市场上出现了大量“一键包”和“云机房”产品,极大地简化了用户的使用门槛。这些产品允许用户无需复杂的环境搭建,也不用受限于本地计算能力,即可轻松地开始使用相关工具。这种变化不仅提高了AIGC技术的可达性,也极大地扩展了其应用范围。 展望未来,随着AIGC技术栈的持续成熟和稳定化,我们可以预见到基于当前技术栈的AIGC产品将进一步拓展到更多领