博彦科技专家交流20230403 1.业务类型 产品与解决方案、研发工程服务、IT运维。近几年重点在解决方案类业务(公司有数据管理及应用的各类平台、工具和行业解决方案)。海外业务占比30%,国内业务占比逐年提升 2.客户结构 金融、互联网、高科技等垂直行业。 金融(IT需求大,增速快),互联网(头部大厂为主, 包括BAT、360等,增速较快)、高科技(微软、Meta、谷歌等) 3.技术壁垒 持续20余年高研发投入,培育了数千名业内对口高端数据工程师,拥有1231项计算机著作权、29项授权专利,7个全系列资质认证 4.AI领域竞争优势 1)自主研发团队,取得很多认证和专利,在垂直领域有很多应用场景落地经验 2)大模型需要大量数据训练,数据清洗、标注、调优等与客户深度合作,积累了大量工具和能力 3)AI最终要和垂直行业结合才能发挥作用,公司和客户、科研单位等合作加速项目落地5.金融行业 1)提供数据全生命周期解决方案(从数据采集、加工、存储、治理、安全、分析到应用),智能化场景的研究研发力度大(金融银行、智能风控、渠道服务等),竞争力强 2)疫情放开后,垂直行业数字化转型比较迫切,特别是金融信创一直在加速 6.数据标注业务 1)博彦与BAT、微软、Meta、谷歌等巨头保持着多年的基础数据业务合作,提供语料、标注、训练等服务(公司是百度文心一言首批生态伙伴)2)数据标注不是独立的业务部门,是博彦基础数据业务的重要一部分 3)博彦自己会通过爬虫、购买版权知识库等途径收集数据,客户会从博彦购买标注数据or提供标注服务(数据版权问题目前还没有严格界定)4)数据标注方面,考虑到数据安全等问题,客户一般会跟博彦签订保密协议。 5)博彦数据标注的体量还在不断扩充,学生兼职也很多(线上办公) 6)数据标注业务展望:随着人工智能的发展,通用大模型基础数据标注、垂直领域大模型专业数据标注,都将会是各个大厂及金融等垂直行业发展人工智能业务必不可少的研发投入,数据标注业务有望快速放量(OpenAI在肯尼亚数据标注员上万名) 7.与360合作 1)360没有自己的数据标注工程师,数据处理主要依赖外部团队,与博彦合作,主要包括数据采买和标注,量级目前不方便透露2)目前是大语言模型国内刚起步阶段,未来几年仍然需要收集用户数据,变成训练数据,进行模型迭代,缩短跟国外的差距 8.与微软合作 微软是公司最早的客户,合作时间长也很深入,保密协议的原因,具体内容不方便说,但 OpenAI带动的人工智能浪潮下,给公司带来大量增量业务是肯定的 9.AI聊天机器人 技术积累了很多年,不直接研发产品,而是为客户提供解决方案,主要服务包括:智能语音识别、图片识别、机器训练等(微软小冰、百度度秘都有提供服务) 10.业绩展望 GPT等人工智能应用场景落地中,除模型、算法外,数据非常重要。未来公司重点会在垂直领域开展深度合作。目前各类业务订单充足,加班加点。过去保持20%复合增长,未来有望加速