您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国AIGC产业联盟&无界AI]:2023中国AIGC文生图产业自皮书 - 发现报告
当前位置:首页/行业研究/报告详情/

2023中国AIGC文生图产业自皮书

2023中国AIGC文生图产业自皮书

x 中国AIGC文生图产业白皮书 中国AIGC产业联盟x无界AI 2024年1月·杭州未来科技城 引言 x 中国AIGC文生图产业白皮书 “理性是人类独有的禀赋,艺术与科学总是在山脚下分手,最后又在山顶上相遇,AIGC时代到来,期待看到人工智能与人类智慧在此消彼长中逐渐对齐,实现二者的双向奔赴与双向丰富。” 张媛,上海广播电视台SMG著名主持人、制作人 “未来的时代是科技的时代,是AI的大时代,AIGC将显著提升生产效率,助力人人都是创作者成为现实,给经济带来新活力。” 吴太兵,万兴科技(300624.SZ)董事长 “AIGC未来要和各产业深度融合,必须先把制造业作为主攻方向。” 倪考梦,温州市社科联副主席,中国AIGC产业联盟发起人 “AIGC可能复制人类文明的进化历程,从通用模型走向专用模型或行业模型。对于AIGC,我们要以宏观叙事,从微观行事。” 长铗,无界AI创始人,著名科幻作家,连续三届中国科幻最高奖“银河奖”(2006~2008)得主 “从无中生有到言之有物,AIGC+东方审美是人工智能传承和发展中华传统造型与造物观念的创新利器。” 张光帅,教授,山东工艺美术学院人工智能设计研究中心主任、数字艺术与传媒学院副院长 “放飞每个个体的创意和想象,在AIGC时代遇见共同的美好。” 章乐焱,恒生电子(600570.SH)首席架构师 “AIGC时代将诞生前所未见的超级商业模式,过往的企业估值逻辑有望出现极大变化。” 刘兴亮,《刘兴亮时间》创始人,拥有数百万粉丝的知名数字经济学者 “每个人都可以用AIGC的思维、技术、工具对自己现有的工作和生活进行前瞻性构想、创新性应用、开拓性实践。” 梁伟,教授级高工,中国电信研究院大数据与人工智能研究所副所长,科技部重点研发计划评审专家 “从AIGC到AIAGENT,集合群体智慧共上新的台阶。” 余波,追梦者基金合伙人 “AIGC的出现,使今天人类社会信息符号的传递与分享成为了数字世界自驱进化的能量基因。” 张四化,山东大学计算机科学与技术学院党委副书记 “对人工智能而言,图象信息真正可能被觉知而成为视觉,不同的视觉,即是不同的风格而已。而区分其特征并标注的还是人,因为人具有命名的能力,也是标注智能的方法。我们选择视觉的风格,就是营造文化的能力,人类就是在审美和选择中发展新一代的未来。” 沈华清,浙江大学设计艺术系副主任 注:本报告编写委员会邀请各行业知名人士分享对AIGC时代的推荐语(排名不分先后) 目录 x 文生图通识篇 中国AIGC文生图产业白皮书 01从AIGC到AI文生图04AI文生图的终局:AI视频 02 AI文生图的发展历程 03 主流AI文生图工具 产业实践篇 01AIGC产业与就业影响02AIGC+泛娱乐产业 03 AIGC+影视与传媒 04 AIGC+设计工具 05AIGC+营销 06 AIGC+电商 07 AIGC+服装模特与时尚设计 08AIGC+动漫与游戏 09 AIGC+家装与建筑设计 10产业实践的先决条件:AIGC版权保护与流转 11结论展望与产业图谱 x 中国AIGC文生图产业白皮书 文生图通识篇 文生图通识篇01节:从AIGC到AI文生图 AIGC产业架构图 x 中国AIGC文生图产业白皮书 文生图通识篇01节:从AIGC到AI文生图 人工智能生成内容(AIGC)风靡全球 x 中国AIGC文生图产业白皮书 AIGC,即ArtificialIntelligenceGeneratedContent,人工智能生成内容。它是生成式AI(GenerativeAI)技术所激发的新一轮内容创作者经济浪潮;让人人都可以简易、便捷、低成本地借助AI的力量完成文本、图片、视频、音频等多媒体内容的高效高质量生产;是对以短视频、自媒体等为代表的大规模UGC(用户生成内容)经济的进一步范式升级,故称“AIGC”。AIGC擅长制造和传播爆款内容,尤以图片、视频等视觉形态最为突出。所示AI图片皆为广泛影响网络的代表: 左图:2023年索尼世界摄影奖落幕,AI作品《虚妄记忆:电工》荣获创意类大奖; 中图:2022年由OpenAI与时尚COSMO杂志合作制作的首个AI杂志封面; 右图:2022年9月,由Midjourney生成的绘画作品《太空歌剧院》在美国科罗纳州博览会上获得艺术比赛一等奖。 虚妄记忆:电工COSMO女宇航员太空歌剧院 10年以来推进AIGC浪潮过程中重大技术节点与代表 文生图通识篇01节:从AIGC到AI文生图 AIGC就在身边:新西湖、古良渚、古温州 x 中国AIGC文生图产业白皮书 新西湖@白小苏古良渚@AIBEN古温州@白小苏 AI“新西湖”全名为《新西湖繁盛全景图》,由人类画师与AIGC共同参与完成。主要用到三项主流的AI绘画技术:线稿上色(ControlNetLineart)、无限拓展(Outpainting)、建筑模型训练(Dreambooth&Lora)等。创作方将该作品的使用权无偿捐赠给杭州市贸易促进会、中国国际 动漫节执行委员会、杭州西湖风景名胜区管委会、杭州万事利丝绸文化股份有限公司、杭州灵伴科技有限公司(Rokid)等多家单位和企业以共创、推广杭州文化,共享AI作品版权。 AI“古温州”,则以温州朔门古港遗址的资料为基础,以“千年商港,未来温州”为主题,借助AI工具为古港遗址勾勒出了一幅“东方威尼斯”繁华景象。2023年3月29日,这幅图片刊登在温州日报,成为温州日报“商周刊·文博”板块元宇宙主题报道的靓丽一笔。 案例虽小,管中窥豹,可见一斑。从2022年至2023年,国内AI绘画产业正是从这样微小的案例开始了举世瞩目的产业应用浪潮,从最初的静态图片走向复杂、交互式的AIGC产业应用场景。 文生图通识篇02节:AI文生图的发展历程 2022遇见AIGC的序章:AI文生图 x 中国AIGC文生图产业白皮书 图像编辑 图像生成 设计 助理 图片Logo图像 增强生成搜索 由aiwatch.ai发布的《生成式AI年终数据报告》中提炼并量化出了AIGC文生图赛道的细分分支(备注:量化数据取自2023年11月份全球同类产品的流量访问数据,不含大公司产 品)。市场份额从高到低依次为:图像生成(11亿)、图像编辑(1.6亿)、设计助理(4849万)、Logo生成(1890万)、设计工具(928万)、艺术(605万)、Avatars(460万)。 注:图片以及内容数字来源aiwatch.ai,经授权 AI时代与互联网时代开源热度对比 曾经互联网时代靠着开源精神完成了一次次科技商业变革,如搭建网站、云计算、APP……每条曲线都见证了那个十年的飞速发展。而今天AI开源运动,出现即巅峰,项目的下载和引用正在以指数级速度蔓延…… 文生图通识篇02节:AI文生图的发展历程 AI文生图的艺术质量呈现出指数级进化速度 故事始于2022年春天,DiscoDiffusion的开源打开了AI绘画的浪潮之门—— 2022年4、5月份:AI绘画只擅长抽象之美或者色彩美学,以令人“眼花缭乱”的色彩涂抹构图向世人展示出AI艺术的别样魅力。这段时期人们常用的工具是DiscoDiffusion以及Midjourney初代版本。 2022年6、7、8月份:AI绘画开始集中突破绘画的逻辑性和质量,可以逐步写实、产出具有艺术性的作品。这段时期以Midjourney为主要工具代表。 2022年9月份:AI绘画最重要开源力量StableDiffusion成为社区大热门,且凭借成本低、高质量、高逻辑性、更强的通用绘制能力以及快速生成等优势迅速占领市场,AI绘画的艺术质量和逻辑能力开始进入“飞轮式”发展,且Midjourney也开始引入其开源技术。 2022年10、11月份:AI绘画的第一个现象级潮流“二次元模型”横空出世,以NovelAI等开源产品和力量为突出代表,进一步蔓延到整个StableDiffusion社区,更多的开源模型和产品加入到这个队伍中,生态力量开始形成。二次元模型的高质量性和现实影响力也令世人展开了对AI绘画版权的争议。11月份,国内AI绘画第一波大浪潮启动,抖音迅速推出的“抖音AI绘画(二次元)”流量成功辐射数以千万计网民,国内第一波千万级AI绘画用户群形成。 2022年12月份:紧接着二次元浪潮,人们仿佛打开了“通往异次元的大门”,开始让三次元、2.5次元照进AI绘画,于是新一波浪潮“AI真人模型”形成。传统互联网上充斥着大量由AI生成的“美女”、“真实场景”、“平行时空新闻”等新形态内容。与此同时,闭源力量Midjourney也几近AI绘画的艺术巅峰,各行业的大量设计师与内容工作者群体开始用Midjourney生成极高质量且满足现实生产需求的AI图片。 2023年至今:AI绘画在极高质量、通用逻辑能力、细节完美度以及精准控制层面已经开始大范围“侵蚀”各行各业的生产与消费过程,各产业以及互联网都到处充斥着AI生成的内容。第一波AI大范围赋能产业的 春 夏 秋 冬 2023 x 中国AIGC文生图产业白皮书 共识正逐步形成。StableDiffusion生态力量和Midjourney产品力成为当下人们唯二选择。创作者@刘秋杉 文生图通识篇02节:AI文生图的发展历程 2023年AI文生图“侵蚀”的商业版图:实用性AI绘画时代到来 x 中国AIGC文生图产业白皮书 上海师范大学影视传媒学院副教授戴菲:“看到AI做的特朗普被捕图,以假乱真,你会发现这里面没有任何曝光失误、构图失误。” 我们在2022年曾预测,2023年数以亿计的AIGC内容将充 斥着整个互联网,绝大多数网民在刷抖音或者小红书时都会在不知不觉中浏览到AIGC内容,占比可能达到5~10%;以小红书平台为例,都会将疑似AI生成的内容打上“疑似包含AI创作信息,请注意甄别真实度”的标签以供用户警惕。一时间,泛娱乐场景成为AI文生图商业化的“第一阵地”。 面对AI绘画一年来指数级的进化速度,2023年AI绘画正式开启“全面商用”时刻。从多样性的艺术维度冲击多样性的行业商业,在流量平台等虚拟内容经济的加持下,数以千万甚至上亿计的互联网用户群深受其影响。其中以“摄影模型”和“真人模型”等为代表的“真实世界模型”对现实世界的冲击最为显著,包含商业应用、泛娱乐消费甚至诸多负面影响。 案例:网友用真人模型画出了“儿童版的马斯克”,并戏谑道“马斯克正在研制的抗衰老药方实验失败”。凭借极高的现实还原度和容貌特征,这样令人耳目一新的内容在全网病毒式蔓延,最后受到了马斯克本人的关注和回复:“我可能吃太多了。” 借助类似技术和模型,麦当劳在六一儿童节期间发起了“童趣滤镜,回到童年”的全民参与AI互动的营销事件:只需上传自己的一张自拍,便可一键变回小时候的模样。其大胆之创新,广受好评。 userid:414195,docid:150769,date:2024-01-08,sgpjbg.com 文生图通识篇03节:主流AI文生图工具 AI文生图工具变迁之路:面对这万般变化,请掌握先进的生产力工具 x 中国AIGC文生图产业白皮书 文生图通识篇03节:主流AI文生图工具 AI文生图模型阵营及简史 x 中国AIGC文生图产业白皮书 一切都始于CLIP开源,CLIP是一个通过自然语言监督有效地学习视觉概念的神经网络。通过使用CLIP可将文本和图像连接在一起 CLIP(ContrastiveLanguage–ImagePre-training)是文本和图像对照的预训练模型,数据集使用的是LAION-400M,包含4亿组从互联网上收集的文本图像对。文本编码器提取文本特征,图像编码器提取图像特征,两个放到一起对比相似度,从而让AI“掌握”文本图像的匹配关系 文生图通识篇03节:主流AI文生图工具 开源之王StableDiffusion的模型风格