ChatGPT对 广播电视和网络视听行业的影响分析 目录 一、ChatGPT概述1 1.1ChatGPT简介1 1.2ChatGPT的发展历程2 二、ChatGPT核心技术解析4 2.1核心技术点4 2.2技术创新点6 2.3技术局限性9 三、ChatGPT的相关争议10 3.1数据泄露10 3.2代写论文与作业10 3.3诽谤诉讼11 四、ChatGPT对本行业发展的影响分析11 4.1促进行业进步11 4.2风险与挑战17 4.3对策与思考17 五、参考文献19 附件:生成式人工智能服务管理办法(征求意见稿)20 一、ChatGPT概述 1.1ChatGPT简介 ChatGPT(全名:ChatGenerativePre-trainedTransformer),美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构模型,这是一种用于处理序列数据的模型,可以通过连接大量的包含了真实世界对话的语料库来训练该模型。ChatGPT能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。 ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,都会拒绝提供有效答案。 ChatGPT可以进行归纳性的文字类工作、代码开发相关工作、图像生成领域、智能客服类工作。此外,ChatGPT的应用场景还包括:用来开发聊天机器人,也可以编写和调试计算机程序,还可以进行文学、媒体相关领域的创作,包括创作音乐、电视剧、童话故事、诗歌和歌词等。在某些测试情境下,ChatGPT在教育、考试、回答测试问题方面的表现甚至优于普通人类测试者。 1.2ChatGPT的发展历程 2022年11月底,人工智能对话聊天机器人ChatGPT推出,迅速 在社交媒体上走红,短短5天,注册用户数就超过100万。 2023年一月末,ChatGPT的月活用户已突破1亿,成为史上增长最快的消费者应用。 2023年2月2日,美国人工智能(AI)公司OpenAI发布ChatGPT试点订阅计划——ChatGPTPlus。ChatGPTPlus将以每月20美元的价格提供,订阅者可获得比免费版本更稳定、更快的服务,及尝试新功能和优化的优先权。 2023年2月2日,微软官方公告表示,旗下所有产品将全线整合ChatGPT,除此前宣布的搜索引擎必应、Office外,微软还将在云计算平台Azure中整合ChatGPT,Azure的OpenAI服务将允许开发者访问AI模型。 2023年2月3日消息,IT行业的领导者们担心,大名鼎鼎的人工智能聊天机器人ChatGPT,已经被黑客们用于策划网络攻击时使用。 黑莓(BlackBerry)的一份报告调查了英国500名IT行业决策者对ChatGPT这项革命性技术的看法,发现超过四分之三(76%)的人认为,外国已经在针对其他国家的网络战争中使用ChatGPT。近一半(48%)的人认为,2023年,将会出现有人恶意使用ChatGPT而造成“成功”的网络攻击。 2023年2月7日,微软宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器。微软CEO表示,“搜索 引擎迎来了新时代”。8日凌晨,在华盛顿雷德蒙德举行的新闻发布会上,微软宣布将OpenAI传闻已久的GPT-4模型集成到Bing及Edge浏览器中。 2023年2月16日消息,微软在旗下必应搜索引擎和Edge浏览器中整合人工智能聊天机器人功能的举措成效初显,71%的测试者认可人工智能优化后的必应搜索结果。 2023年2月16日,百炼智能潜客宝团队在进行了市场调研之后,决定集成以“内容生成和智能互动”见长的ChatGPT,正式上线智能营销助理。 2023年2月27日消息,Snapchat正在推出一个基于OpenAI的ChatGPT最新版本的聊天机器人。这款名为“MyAI”的机器人将被固定在应用界面的聊天选项卡上,虽然最初仅适用于每月3.99美元的SnapchatPlus付费订阅用户,但最终目标是让Snapchat的7.5亿月活跃用户都可以使用该机器人。 2023年3月15日,OpenAI正式推出GPT-4。GPT-4是多模态大模型,即支持图像和文本输入以及文本输出,拥有强大的识图能力,文字输入限制提升到了2.5万字。GPT-4的特点在于,第一,它的训练数量更大;第二,支持多元的输出输入形式;第三,在专业领域的学习能力更强。 2023年3月,谷歌宣布,ChatGPT—Bard正式开启测试。 2023年3月24日,OpenAI宣布ChatGPT支持第三方插件,解除了其无法联网的限制。 2023年4月,ChatGPT已停止Plus付费,OpenAI给出的理由是需求量太大。 二、ChatGPT核心技术解析 2.1核心技术点 ChatGPT是基于Transformer框架的自回复网络,核心技术点包括: (1)语义编码 采用BERT或GPT-2等语义嵌入模型来对输入的句子进行语义编码。 (2)流程控制 定义语法规则来控制对话的流程,例如跳转到不同节点,改变主题等。 (3)问答理解 基于自然语言处理(NLP)和实体识别技术,可以跟踪句子中的关键字和实体,快速理解和回复问题。 (4)回答生成 基于Seq2Seq网络技术或者无监督式学习方法,可以实现自动回复。 图1Transformer的核心算法结构 ChatGPT是一种强大且可扩展的聊天机器人技术,它可以在各种环境中自然地和人对话。它可以接受输入,操作上下文,捕获意图,进行长期和短期记忆,并返回有用的输出。 ChatGPT的核心技术包括语言理解、自然语言处理、记忆网络。语言理解采用仿真学习法训练数据模型,用于跟踪机器之间的社交交互语境。自然语言处理模型用于训练ChatGPT,以便它能够理解输入的文本。此外,ChatGPT还使用记忆网络,以便能够操纵上下文,回复更有意义的输出。 作为一种机器学习技术,ChatGPT具有诸多优势,并且能够适用 于多种不同的应用场景。与传统机器人技术相比,它可以更自然地与人类进行交流,具有更好的仿生特性。它可以被用来支持人机对话,实现聊天助手,智能客服,智能搜索,语音助手等应用场景。 ChatGPT是一种基于对话的人工智能系统,可以让机器通过与用户进行交互而自动“学习”。它使用计算机来处理自然语言,以回答问题并提供有意义的讨论。 ChatGPT的三个重要技术包括:语义解释、上下文分析和响应生成。 语义理解是ChatGPT最重要的技术组件,它将文本输入转换为机器可以理解的语言结构。它利用NLP技术来识别语义,将它保存在搭配数据库中,并使用数据科学和机器学习算法来根据上下文进行翻译和了解。 上下文分析是ChatGPT的第二个核心技术,它通过检测上下文中的关联性来分析用户的输入。它使用自然语言处理(NLP)技术和机器学习算法来识别用户的脆弱性,测量其话语的相关性,并捕捉所有上下文细节。 最后,响应生成技术,它将研究通过语义理解和上下文分析中发现的文本转换为新的输出。它允许系统根据上下文情况创建和表达这些句子,以及确定正确的考虑方式和表达。 2.2技术创新点 (1)ChatGPT架构突破在预训练 大型语言模型(LLMs)是在包含巨大数据量的大规模数据集上训 练的,核心特征就是模型参数多、训练数据量大,被大多数专家认为是走向通用人工智能(AGI)的重要途径之一。随着参数增多,使语言模型学习进阶到更复杂模式。GPT-3.0已经可以做到其他模型无法做到的事情,不仅能够生成流畅自然的文本,还能完成问答、翻译、创作小说等一系列NLP任务,甚至进行简单的算术运算,并且其性能在很多任务上都超越相关领域的专有模型,通用性极强。可以说ChatGPT火热背后,是OpenAI的GPT家族从2018年以来持续投入完善大模型,引领了AI大模型研究的热潮。 Google在2021年1月推出的SwitchTransformer模型以高达 1.6万亿的参数量打破了GPT-3.0作为最大AI模型的统治地位,成为史上首个万亿级语言模型。但是,仅仅追求绝对量级的参数不是一个明智的选择,因为参数要有足够的数据来匹配,全世界的优质数据就这么多,参数量搞得再大,效果也不会有太大提升。ChatGPT之所以能被国内外各界称为划时代的产物,一是因为其迭代前的GPT-3.0版本已经拥有了在参数上领先的时间研发优势,二是在千亿量级参数优势的基础上叠加了预训练等技术。简言之,即使ChatGPT的参数没有达到万亿级的水平,但这并不会影响到其核心技术优势。如果ChatGPT在后续的迭代中再把参数增加,效果会更好。 (2)引入人类反馈强化学习(RLHF)进行数据训练 人类反馈强化学习(HumanFeedbackReinforcementLearning,RLHF)就是基于人类反馈对语言模型进行强化学习。其中,强化学习使得这一训练范式增强了人类对模型输出结果的调节,并且对结果进 行了更具理解性的排序。深化学习在ChatGPT的应用方法是采用了评估式强化人工训练代理(TraininganAgentManuallyviaEvaluativeReinforcement,TAMER)框架。这里的Agent可以理解为ChatGPT本身,该框架将人类标记者引入到ChatGPT的学习循环中,可以通过人类向ChatGPT提供奖励反馈(即指导ChatGPT进行训练),从而快速达到训练任务目标,真正理解人类语言,检测上下文,并相应地做出响应,而不是使用关键字匹配。 (3)ChatGPT用法多样 根据OpenAI官网公开的信息显示,ChatGPT有49种用法,其中最特别是它的对话模式的功能——文本生成,该程序使用其预先训练的数据库来接收输入和提示,并以自然的、类似人类的文本结构生成适当的响应,再通过官方网站,让任何人来用对话的形式跟大模型进行交互。可以说如果没有文本生成,ChatGPT就什么都不是,因为这就是它与人类用户交流的方式。 此外,与“生成式”功能相类似的功能还包括:文本补全,如果用户提供开头,ChatGPT可以根据内容和含义完成输入的句子;问题解答,ChatGPT可以识别用户喜欢的方式进行回答其预训练知识内一部分的每个问题,比如世界知识和一般事实;对话式人工智能,ChatGPT可以用类似人类的对话语言进行响应,等等。此外,ChatGPT还可以进行情绪识别,即在分析文本时实际上可以确定情感或人类感受。例如,当客户在电子商务网站上留下评论时,ChatGPT可以分析文本并确定它是正面的、负面的还是中立的。程序语言转换、修复代 码BUG等也可以通过ChatGPT来实现。 2.3技术局限性 ChatGPT的使用上还有局限性,模型仍有优化空间。ChatGPT模型的能力上限是由奖励模型决定,该模型需要巨量的语料来拟合真实世界,对标注员的工作量以及综合素质要求较高。ChatGPT可能会出现创造不存在的知识,或者主观猜测提问者的意图等问题,模型的优化将是一个持续的过程。若AI技术迭代不及预期,NLP模型优化受限,则相关产业发展进度会受到影响。此外,ChatGPT盈利模式尚处于探索阶段,后续商业化落地进展有待观察。ChatGPT的三大局限性表现如下: (1)内容准确性不高 ChatGPT的内容准确性不够高并且会非常固执地坚持错误的结果。这其实也是这一类大规模语言模型一直以来面临的难题。在InstructGPT的论文中,作者明确提到了这个模型会犯非常低级的错误,甚至是加减运算也有可能会出错。比如,当你问它关于“松鼠桂鱼”的做法时,它有时回答要用烤箱来烤,有时回答要用水煮,甚至会