数据壁垒:手握海量正版数据,积极迎接百模新时代。国内生成式大模型的发展不仅需要大量数据,更需要高质量、有版权的数据。国内外大模型相关的版权和数据纠纷案频出,相关监管法律趋于完善,数据合规性得到更高重视。中文在线拥有超过60TB的正版数据,含文字/音频/视频多种类型,覆盖小说、科普、社会等多个品类,通过文学网站和驻站作者持续更新数据,通过完备的数据保护和版权保护体系放大数据资产价值,有望深度受益于多模态时代。 内容壁垒:手握头部网文IP,多模态AI打开变现空间。公司聚焦优质IP,已有IP类型多样、经典IP经久不衰。如《修罗武神》自2013年连载以来热度不减,已改编为有声书和漫画,动画预告片也已上线。2023年6月公司发布公告,拟成为寒木春华控股股东,取得优质动漫IP《罗小黑战记》。多模态大模型行业快速发展,公司亦有相关布局,已在有声书、漫画、动漫、视频领域进行探索。多模态大模型有望进一步扩大IP改编产能、降低IP改编成本、提升用户体验。 财务表现:2022年业绩承压,2023有望实现收入利润双增长。收入方面,2022年公司营收受宏观及行业不利因素影响,预计2023-2025年随着不利因素淡去、AI改编技术迭代、数据需求提升,公司营收增速有望显著改善。海外CrazyMapleStudio子公司5月1日出表,对收入造成一定影响,但对归母净利润影响有限。公司于2022年已全额计提教育业务减值,不再影响未来财务表现;公司版权成本逐年摊销、占收入比例整体呈下降趋势;值得关注的是,AI对运营维护成本的降低作用已在海外子公司财务数据中初步体现,我们看好公司通过AI技术迭代和应用深化,进一步实现降本增效,实现利润改善。 盈利预测与投资评级:考虑到AI研发投入对费用端影响,我们将2023-2025年EPS预测从0.22/0.30/0.36元下调至0.18/0.24/0.31元。公司当前股价对应2023-2025年PE为83/62/48倍,我们看好公司的IP+AI业务布局和优质内容壁垒,维持“买入”评级。 风险提示:海外采集价格上涨风险,版权诉讼与盗版侵权风险,AI技术发展不及预期风险。 1.数据壁垒:手握海量正版数据,积极迎接百模新时代 1.1.深耕厚植,公司手握大量优质正版数据 存量数据质优量大。截至2023/8/8,公司拥有的数据总量超60TB,其中1)中文内容超万亿字,包含小说、科普、社会、经管、法律、教育等品类。公司旗下拥有原创网站17K小说网、四月天小说网、奇想宇宙科幻站、谜想计划悬疑站等原创平台,累积数字内容资源超550万种,驻站作者450万名;与600余家版权机构合作,签约知名作家、畅销书作者2,000余位。2)音频资源超46万小时,内容涵盖原创文学、传统文学、影视、教育、曲艺、管理、少儿等领域。AI主播录制的有声书时长超过18万小时。 3)视频方面,公司旗下中文万年和中文奇迹负责将文学IP改编为影视剧,海外应用Reelshort提供竖屏短剧。 增量数据源源不断。公司拥有完整的商业生态链,驻站作者可提供最新数据,让AI模型持续学习、不断迭代、更贴近市场和用户。公司于2013年始建“网络文学大学”,诺贝尔文学奖得主莫言老师担任第一届名誉校长。网络文学大学分为青训学院、精英学院、研修学院三个部分,为不同阶段的网络文学爱好者与作者提供写作培训。2020年1月,网络文学大学上线新年度青训学院第一学期基础课程与手速课程,此后启动的2020年第二学期,除青训学院原有基础课程与手速课程外,还上线17K编辑部集体创作的全新原创课程——技能课程,为新人作家提升写作质量保驾护航。 1.2.技术赋能,网络版权授权收入稳步增长 知识产权技术保驾护航。公司高度重视知识产权保护工作,拥有旗下内容的全部版权,可为AI大模型提供有版权的数据集。公司已推出三个知识产权保护平台:“权哨”“无抄”和“创珍链”,维权范围涵盖文字、音频、视频、外观专利等类型。1)知识产权服务平台“权哨”拥有全国公证资源和知识产权律师团队,对侵犯著作权的内容进行维权,并向权利人提供咨询服务。2)原创保护平台“无抄”为权利人和大众提供H5一键举报侵权服务,已帮助某作家完成抄袭案一审程序,法院认定侵权方赔偿数十万元。 3)数权服务联盟链“创珍链”为权利人提供确权和取证支持,该平台由公司开发,并与北京东方公证处、北京知识产权保护协会、中国科学技术法学会达成合作。 图1:中文在线版权保护体系 表1:中文在线相关版权诉讼案件 图2:中文在线文化行业收入(百万元) 1.3.百模竞争,数据需求有望持续增长 数据是大模型训练的石油,大模型训练热潮推动了数据需求。公司深耕文化数字产业20余年,拥有海量正版中文数据,有望深度受益于AI大模型更新迭代。 大模型训练需要海量的数据。7月7日,上海数交所官网上线语料库,挂牌近30个语料数据产品,涵盖文本、音频、图像等模态,金融、交通运输、医疗等领域,旨在通过市场配置方式推动语料库建设。华为数据存储产品线总裁周跃峰于估算,截至2023/7/15,大模型的数据清洗和预处理成本(不含数据存储硬件成本)占总成本22%左右,已接近算力成本(占比25%)。 大模型训练需要高质量的数据。智源研究院副院长林咏华表示,数据质量的提升对于模型性能突破十分重要,模型的训练语料在一定程度上会影响AIGC应用、微调后模型等内容生成的合规、安全以及价值观等问题。清华大学副教授、聆心智能创始人黄民烈表示,当前国外大模型和部分国内模型采用国外开源数据集训练,然而互联网数据虽多,质量却参差不齐,数据清洗面临挑战。 中文大模型训练需要中文数据。智源分析100万条Common Crawl网页发现,中文网站共计25842个,其中仅17%的IP地址位于中国内地,中文数据的准确性和安全性都较低(AI科技评论公众号于2023/7/11报道)。 1.4.监管落地,正版数据价值有望重估 ChatGPT破圈以来,国内外大模型竞赛持续走热,相关版权和数据纠纷案例频出,相关监管法律趋于完善。对于大模型而言,使用公开数据和盗版数据的风险上升,正版的、合规的数据得到更多重视。 海外,已经发生多件版权纠纷案例,AIGC立法得到高度重视。1)诉讼层面。美国3名漫画艺术家状告Stability AI等3家AIGC商业应用公司,认为其侵犯了数百万艺术家的权利;美国盖蒂图片社起诉Stability AI侵犯版权和商标保护权,认为Stability AI非法复制和处理了数百万受版权保护的图像。2)立法层面。欧洲议会于2023年5月通过《人工智能法案》提案的谈判授权草案,其中包括“在使用受版权法保护的数据进行训练时,需要进行公开披露”。 国内,数据要素相关规范出台,正版数据有望实现价值重估。 2022年12月国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》,明确数据要素的确权授权、交易流通、收益分配制度。文件发布半年以来,已有北京、上海、深圳、福建、厦门等超40个省市出台数据要素政策,设定发展目标。 2023年3月,中共中央、国务院印发《国务院机构改革方案》,提出足见国家数据局,统筹推进数字经济和数字社会建设。2023年4月,网信办发布《生成式人工智能服务管理办法(征求意见稿)》,要求AI生成内容真实准确,提供者应负责预训练数据来源合法性。2023年7月11日,人民网面向全国正式发放数据要素市场“三证”——“数据资源持有权证书”“数据加工使用权证书”及“数据产品经营权证书”。2023年7月13日,网信办等七部门正式发布《生成式人工智能服务管理暂行办法》,要求预训练大模型所用的数据来源需合法合规,该办法自2023年8月15日起施行。 表2:2023年上半年地方层面数据要素相关法规(部分) “十四五”规划提出知识产权战略,强化产权保护要求。《知识产权强国建设纲要(2021-2035年)》提出,2025年知识产权强国建设取得明显成效,专利密集型产业增加值占GDP比重达到13%,版权产业占GDP比重达到7.5%;知识产权使用费年进出口总额达到3,500亿;到2035年,综合竞争力跻身世界前列,中国特色、世界水平的知识产权强国基本建成。截至2022年8月,北京、上海、广州、海口已设立知识产权法院,26个城市已设立知识产权法庭,国家知识产权局已批复设立57家知识产权保护中心,对于有效遏制侵权交易现象,改善权利人维权“举证难、周期长、成本高、赔偿低”的不利局面。 2.内容壁垒:手握头部网文IP,多模态AI打开变现空间 2.1.聚焦头部,经典IP价值经久不衰 中文在线拥有类型多样的优质网文IP。中文在线旗下作品《星辰与灰烬》《混沌剑神》《九星霸体诀》分别入选中国网络文学影响力榜“网络小说榜”“IP影响榜”“海外传播榜”。此外还有讲述创业的《探索者》、描绘粤绣的《天衣》、悬疑小说《五个失踪的少年》《解连环》、武侠小说《吾名玄机》《浪淘沙》等作品。 图3:中文在线重点IP 经典优质IP经久不衰,具有多元化变现潜力。公司头部IP《修罗武神》自2013年连载至今,长期位居17K小说网点击榜首。作者善良的蜜蜂是公司旗下17K小说网的大神作家,也是中国作协会员,曾获第二届橙瓜网络文学奖“五大至尊”称号。该IP已开发多种形式,改编漫画阅读指数破百万,收听人次超40亿。根据《修罗武神》改编的动画番剧是公司与企鹅影视联合出品,由原力动画制作,已发布预告片,将在腾讯视频独家播出。 图4:《修罗武神》小说 图5:《修罗武神》有声书 图6:《修罗武神》漫画 图7:《修罗武神》动画预告片 网络小说的IP转化路径多元,延伸市场空间宽广。IP改编是文学价值的放大器和产业转化的重要路径。根据易观分析,2022年中国网络文学的IP全版权运营市场规模(含出版、游戏、影视、动漫、音乐、音频等细分领域)超过2520亿元,预计2025年将突破3000亿元。中国信息经济社编制的“中国文化产业IP价值综合榜TOP50”中,文学类IP占比超一半,其中网络文学占比文学类IP超八成。2022年网络剧播放量Top50中,IP改编占比提升至64%。 图8:2020-2022年网络剧TOP50 IP改编占比 影视剧方面,公司已与爱奇艺合建中文奇迹,与万年影业合建中文万年,将优质网文IP改编为真人影视。 图9:中文在线付费视频剧收入(百万元) 2020年,中文在线和爱奇艺共同成立中文奇迹影视公司,注入各自在IP内容生产和影视化开发资源,集中发力IP影视经营,实现网络文学和影视联动。 2022年,中文在线与万年影业合资成立了海南中文万年影视文化传媒有限公司,以真人影视开发制作等为主营业务,持续推进公司优质IP影视化改编。 2023年3月,短剧《招惹》上线,该剧改编自四月天小说网同名小说,上线后10小时热度破2万,创腾讯短剧最高纪录。《招惹》在“全网微短剧正片有效播放·霸屏榜”夺冠,累计分账破1800万元。 后续值得关注的产品:中文在线出品的短剧《我家大人有点甜》《皎月流火》于4月开拍,预计年内上线。改编自17K小说网作品并中文万年承制的短剧《咕咚咕咚喜欢你》于6月开机。改编自四月天小说网作品并由中文在线自制的中短剧《佳偶天成》于8月开机。 图10:中文奇迹营收及净利润(百万元) 中文在线2022年8月在海外推出ReelShort短剧App,主打1分钟竖屏短剧,节奏快于优爱腾、抖快,内容部分来自国内短剧直翻及欧美面孔的“本土化定制”。收入来自单集付费,每集10美分。根据Appmagic数据,ReelShort应用近一个月流水超200万美元,其中99%来自美国用户。 图11:ReelShort应用截图 2.2.战略扩张,控股动漫IP“罗小黑战记”所属公司 6月28日中文在线发布公告,拟通过与原股东签署《股权转让协议》获得寒木春华51%股权,成为其控股股东。寒木春华以“罗小黑”IP为核心,通过动画番剧、动画电影、IP授权和衍生品销售变现。2022年寒木春华营收2832.07万元,净利润955.7