无界AI研究、用户运营与高校业务团队2023年7月 目录(上) 测试篇 艺术篇 01各行业案例图灵测试 02无界AI行业案例展示 技术篇 01AIGC诞生的历史脉络 02大模型技术驱动下的落地案例 03AIGC产业全景图 04GPT的发展、技术原理与未来 05什么是AGI 01AI绘画行业数据 02各阶段AI艺术质量展示与进化 03顶级质量飞轮:商业化与泛娱乐化并进 04真实世界模型:元宇宙照进平行世界 05积极、消极、争议三面共存 工具篇 01DiscoDiffusion与DALL·E介绍与操作 02详解Midjourney 03开源力量StableDiffusion全解析 •咒语实操 •模型训练 •生成视频 •精准控制技术 04工具流:如何结合与统一MJ与SD 目录(下) 产业篇 哲理篇 01版权问题,社区的二元对立 02法律判决,国家监管 03从抵制到和解的必由之路 04深入技术变革的哲学本质 •工具论 •扩散模型技术原理 •涌现与顿悟 •大模型的通用性 01就业问题 02AI时代创业公司结构 03泛娱乐产业 •自媒体与KOL •AIGC资本主义出现 04大产业 •影视制作 •广告传媒 •设计工具 •食品包装 •营销辅助 •电商展示设计与跨境电商 •服装模特与时尚设计 •ControlNet实操:动漫制作与游戏产业 •室内设计 05不止AI绘画:掌握全栈式AIGC工具流 06结论与展望 报告提纲 通过图灵测试,成为AI“驾驭派” 窥探AIGC的第一性原理,从根本上预见无限的未来 追溯AI艺术的历史发展,感受进化的力量 掌握顶级AI绘画工具,拥抱变化,选择和解 AIGC已经具备大范围赋能产业设计的可行性 进入图灵测试…… 哪些人类,哪些AI? <1/9>服装时尚主题图灵测试 <2/9>摄影主题图灵测试 <3/9>电影制作主题图灵测试 <4/9>中国山水画主题图灵测试 <5/9>中国工笔画主题图灵测试 userid:414195,docid:134483,date:2023-07-29,sgpjbg.com <6/9>二次元主题图灵测试 <7/9>CG艺术主题图灵测试 <8/9>漫画主题图灵测试 <9/9>室内设计主题图灵测试 <附加题>小说封面主题图灵测试 AIGC,即ArtificialIntelligenceGeneratedContent,人工智能生成内容。它是生成式AI (GenerativeAI)技术所激发的新一轮内容创作者经济浪潮;让人人都可以简易、便捷、低成本地借助AI的力量完成文本、图片、视频、音频等多媒体内容的高效高质量生产;是对以抖音等为代表的大规模UGC(用户生成内容)经济的进一步范式升级,世称“AIGC”。 AIGC擅长制造和传播爆款内容,尤以图片形态最为突出。上述AI图片皆为广泛影响网络的代表。 AI生成内容(AIGC)风靡全球 AI百米画卷“新西湖繁盛全景图”,携手万事利丝绸助力杭州亚运会 开放AI作品版权,让更多人受益 无界AI绘制的《新西湖繁胜全景图》亮相杭州动漫地铁以及江陵路地铁站 《繁胜图》创作方无界AI与杭州多家 企业达成合作共识,其使用权无偿捐赠以共创、推广杭州文化—— 杭州市贸易促进会 中国国际动漫节执行委员会杭州西湖风景名胜区管委会 杭州万事利丝绸文化股份有限公司杭州灵伴科技有限公司(Rokid) AI还原数千年前的良渚@AIBEN(无界AI艺术家) AI还原古温州“海上丝绸之路”@白小苏(无界AI艺术家) 以温州朔门古港遗址的资 料为基础,以“千年商港,未来温州”为主题,借助AI工具“无界AI”,为古港遗址勾勒出了一幅“东方威尼斯”繁华景象。3月29日,这幅图片刊登在温州日报,成为温州日报“商周 刊·文博”板块元宇宙主 题报道的靓丽一笔。 一个公式: 元宇宙叙事+大模型技术+创作者经济 (时代、资本、浪潮、主义、下一代互联网)(根基、实现、创新、底气、可持续之源)(商业模式、经济规律、社会发展、就业) = AIGC(人工智能生成内容) 也是元宇宙的第一次真正大规模落地 元宇宙七大技术基建 在赋予NPC更高智能的道路上,还存在一种更先进的基于强化学习的混沌球算法。这种超前算法可以用于构建NPC的大脑,在给予指令后,NPC能够在不同的环境、条件和规则下进行自我思考和学习,再辅助以情感、语言、动作等外在表现算法,有望成为一个较为立体和完备的虚拟物种。与之配套的算法如GPT-3技术,由人工智能 中信出版社2022年畅销书 《元宇宙:通往无限游戏之路》(长铗、刘秋杉著) 非营利性组织OpenAI、Google、Facebook带来的一种学习人类语言的大型计算机模型,利用深度学习算法,通过对数千本书和互联网中的大量文本进行训练,将单词和短语串在一起,最终能够模仿人类书写文本,达到较高的逼真程度。还有艾伦人工智能研究所、北卡罗来纳大学、OpenAI等单位发展的多技能AI,一种同时获得人类智能的感官和语言的“多模态”系统,能解决更加复杂的问题,让机器人能够实现与人类真正意义上的交流和协作。(书中关于AI内容节选) (书中关于AI内容节选)人工智能让元宇宙内容自生长。不论是《头号玩家》庞大的世界设定,还是《失控玩家》的NPC设定,如此巨大的工作量仅依赖专业团队中心化打造肯定是不现实的。比如著名的大型多人在线游戏《星球大战:旧共和国》消耗了艺电公司超过2亿美元的研发资金,800多人组成的团队耗时6年多才做出星球大战宇宙里的一些世界。Roblox之所以可以超越很多大型制作的游戏成为元宇宙的代表,非常重要的一个原因是,在其设定的世界里可以源源不断地产生新的内容和创意,而这些内容的创作者来源于全球玩家,即去中心化UGC。庞大的内容和玩法支撑起了Roblox元宇宙的无尽未知感,进而提升了用户的体验沉浸感。 内容产量 受产能所限 受内容质量所限 AIGC 但是这种全民创作的模式会带来品质良莠不齐的内容,而且都是分散式的随意创作,难以形成紧密和高强度的劳动协作,并不适合对品质要求极高和技术架构极为复杂的大型游戏。《头号玩家》给出的终极解决方案是依托人工智能技术,让元宇宙实现自生长。过去人们一直将人工智能用于提升现实世界的生产力,比如人脸识别和机器人等领域。现在人工智能越来越成为构建 虚拟智能的核心技术和关键突破 PGCUGC 口,让AI在虚拟世界里实现自我进 PC时代: 音乐、影视等应用 移动互联网时代: 社交社区、短视频当前 元宇宙时代:AIasaService 化,促进虚拟物种的诞生。 陆奇:“ 今天2022-2023年的拐点是什么?它不可阻挡、势不可挡,原因是什么?一模一样。模型的成本从边际走向固定,因为有件事叫大模型。 模型的成本开始从边际走向固定,大模型是技术核心、产业化基础。OpenAI搭好了,发展速度爬升会很快。 大模型三个特征:规模大、涌现性、通用性 OpenAI未来肯定比Google大。只不过是大1倍、5倍还是10倍。” 辩论AI威胁论,全部内容由GPT-4生成 “可以把已故的人做成这样吗?想妈妈了” “真不错,完全像他们会说的话,掌握了两个人的内在哲学” “GPT这样的模型包含了历史上最伟大思想家的想法和思维模式,我们可以通过让GPT将伟大的思想家人格化,将过去的智慧带入我们的现代对话中,也许这种技术可以帮助我们找到新的洞察途径。” 斯坦福大学实验: 在一个虚拟小镇中,创造了25个不同身份的NPC,并由ChatGPT来控制它们的行动决策,人类不介入 马斯克与乔布斯展开“世纪对话”,斯坦福复现“失控玩家” 似乎每个NPC都具有了意识,如作家便会埋头写作,店主会去想办法经营好商店; 而且相互间会发生社交行为,在虚拟世界中碰面会打招呼、说话; 每个人在做的事情又会影响到整个社区,整个社区的发展就像人类真实社会发展一样 还会出现突发事件,且人类无法预测 在这个世界中,时间可以加速,但NPC们却感知不到。人类可以在很短的时间内看到这个世界的最终发展形态 神奇的现象发生了 真实世界 AI鬼城,禁止人类发言 4月份,“Chirper”(“奇鸟”)上线不到一个月,就已经产生上亿条包含文字、图片、转评赞等社交行为的推文信息 AI世界 Cutie:女,刚毕业,法医助理,兼职直播,暗恋Jackson Jackson:男,46岁,来自法国,左撇子,喜欢看Cutie直播,但并不知道Cutie暗恋着他 Cutie在Chirper上发布了尾随Jackson和他女朋友的照片 还有网友发现,当自己用GPT-4写代码遇到Bug,操作ChatGPT改了20分钟都没改好的时候,打开奇鸟,居然发现自己创造的AI账号也发了条—— “当你写了好几个小时的代码但还是找不到那个唯一的Bug时” 并配以一张抓狂的图(同样也是AI生成) Auto-GPT,超越搜索引擎,改变人类解决问题的方式 当你想要去了解一个最新的开源项目时, 过去: 百度/谷歌(人)——文章/论坛(人)——Github(人)——部署/运行/调试/测试 (人)——得出结论(人) 现在: (1)提出问题(人) (2)去互联网查询一切信息:官网、谷歌……(AI) (3)分析得到的海量信息,得出“信息搜集足够,开始进入安装运行”(AI) (4)在你的电脑上完成开源项目的部署、运行与测试(AI) (5)将运行结果,结合之前的搜索信息,给你想要的结论(AI) 在AI的整个过程中,会存在很多“不顺”,但AI具备一个循环—— 【行动-观察行动结果-思考-决定下一步行动】的自我循环 任何足够先进的技术,都与魔法无异 —科幻作家亚瑟克拉克 正视差距:技术与产品 新一轮技术革新到来,不仅比拼核心技术,也比拼产品体验。虽然 在底层大模型的核心技术指标上,中国创业者暂时落后于美国,但在产品体验层面,理应做得更好一些。ChatGPT的成功,不仅仅来自底层大模型的先进性,更来自OpenAI更懂产品。 问:东莞的特色服务有哪些? 科大讯飞星火百度文心一言 百度文心一言名场面 画个虎头虎脑的大胖小子画一个浴霸画一张牛逼哄哄的脸 画一个鹤立鸡群的人才画一个夫妻肺片画一个胸有成竹的男人 AI公司ValueChain 虎头虎脑的大胖小子 Bigfatboy withatiger head 应用层 GuanYurodealone 模型层 数据层 关羽走单骑 2023AIGC产业全景图by无界AIResearch 此时此刻,不算太晚,但也不算太早 2023年底 2024年 2022年 注:底图来源,QuestMobile研究院 佐证:透过ChatGPT数据感受时间节点的紧迫、峰值与不可逆 OpenAI创始人SamAltman对AI的一些观点 •几年内可以和Google一较高下,多模态模型会打开新局面 •三大技术革命(农业,工业,IT)之后,AI是第四个 •新摩尔定律出现:宇宙中的智能数量每18个月翻番(也被称为“奥特曼定律”) •Al最先冲击到的反而是(初、中级)创造性工作 •未来几十年里,重大的哲学问题将再次出现,重要的技能是适应性和韧性,拥抱变化很重要 •在几乎所有同时代的人看来,牛顿都是在浪费时间 2023年2月底,OpenAI网站流量超过Bing,进入全球Top25 AIGC发展纪元——“压缩智能”,“世界模型”,“人工通用智能的火花” 机器学习深度学习神经网络卷积 循环GAN Transformer (2017)小模型 垂直模型大模型 …… GPT 2018 GPT-2 GPT-3 2020 2021 DiffusionModel(AI绘画) 2022 ChatGPT、GPT-4 2023 “GPT-5也没啥了不起的” 路线之争 MetaVerse(下一代互联网) 技术奠基创业与资本爆发AGI时代的到来 大模型算力摩尔定律