目录CONTENTS 主任致辞02 实验室概况05 发展历程07 实验室组织架构09 常务理事单位11 常务理事会13 实验室主任、副主任14 分中心介绍与科研成果15 实验室核心科研团队16 共性技术研发平台38 数据处理及统计分析中心38 机器学习中心42 数据管理与分析中心48 可视分析中心51 知识集成和智能决策中心57 行业应用示范中心64 大数据高性能分析处理中心64 智慧交通中心68 多媒体大数据分析中心70 网信智能中心73 大数据分析技术创新中心77 郑州数字创新中心83 异地科研机构88 北京大学重庆大数据研究院89 北京大学长沙计算与数字经济研究院97 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 指标基金沪深300 收益3.91%-1.74% 年化收益18.37%-7.43% 最大回撤4.73%7.03% alpha0.198 beta0.678 信息比率2.947 夏普比率1.139 索提诺比率5.098 波动率0.107 38 39 40 软件名称 时间 依托单位 疫情数据收集系统新冠肺炎全国疫情趋势分析系统APP 2020.102020.10 北京大学北京大学 新冠肺炎疫情监控分析平台 2020.10 北京大学 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 源文本字符串 文件解格析式 文件底层描述信息布局结构分析 版式分析版面分割 布局结构信息 篇文章档划级分 层次识别 段表页落格面分级析 目功能页 引文识别 公图形式识别 逻辑结构理解 文件底层信息反解 文档底层数据解析 布局结构分析 全局排版信息提取 版式分析 页面级 脚注 图形 段落 标题 公式 表格 功能级 引文识别 目录识别 文档级 阅读顺序 篇章层次 版面理解技术 逻辑结构理解 逻辑结构信息 布局结构信息 功能页结构 页面标注 文档底层信息 61 外部应用 原始文档 外部应用 62 63 64 65 66 67 68 69 70 71 数据接入 内容分析引擎 数据存储数据消费可视化 网页蜘蛛图片蜘蛛视频蜘蛛 APP蜘蛛 图像识别 API推送办公文档 音视频图像理解 文字识别 语音识别 色情检测 基础数据 智能搜索 智能推荐语义问答 信息订阅内容审核 文字音频 图片向量化 视频图片 视频向量化 文档基本属性 音频蜘蛛 智能文本理解解析 关键信息提取 智能理解数据 结构化表示 智能图谱 摘要 智能摘要实体识别质量分级 主体识别关系识别文本分类 分类信息语义向量 主题 质量信息 时序数据分析 图数据分析 日志数据机器数据格式解析结构化数据 72 73 74 75 76 77 78 79 80 环境质量 绿色经济与可持续政策规划 社情民意公众参与 成本与效率 资源利用 电子商务 智慧产业发展水平信用体系建设 公共安全 经营与合作 生态保护 智慧农业经济运行基本情况应急响应 电子政务 监管与保障 资源环境 市民服务 经济与产业 人文与交流 智指慧标城体市系科技创新 公共管理 信息与网络 企业服务 基础设施 智慧社区社会保障就业服务 教育服务医疗服务交通出行居住水平 国际交流包容性 文化素养旅游吸引力 人才结构知识产权企业创新 公众应用开放共享 信息与网络安全 信息网络基础设施市政基础设施 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 生产数据生产设备 监测数据监测设备 96 97 98 99 100 101 高级 102 103 104 105 106 107 108 109 110 111 112 113 114 115