2013 趋势科技高端CIO峰会上,Jon Clay提出了大数据安全在Hadoop环境中的挑战。他指出,2012年全球互联网用户达到了224亿,Google索引的URL数量超过26亿6千5百万,Facebook用户数量达到43亿,微信用户数量达到4亿2千7百万。Hadoop已经成为65%业务分析系统内嵌的工具,预计到2015年这一比例将上升到75%。
然而,Hadoop的安全性令人担忧。Hadoop的安全性依赖于Kerberos,但客户常常选择放弃安装或配置非常复杂。此外,Hadoop的Web UI存在漏洞,如CVE-2012-3376,即使已启用Kerberose,仍然存在高威胁。Hadoop数据的私密性和完整性也是一个问题,因为数据没有加密,篡改数据错误的结果会导致错误的决策。
为了保护Hadoop,可以使用客户端和/或虚拟设备提供防护。例如,日志审计可以检测恶意软件,完整性监控可以阻止入侵,防火墙可以保护敏感数据。此外,趋势科技的Deep Security(Hadoop版即将发布)可以提供层次防护,包括访问控制、防火墙、日志审计、网络威胁IDS/IPS、系统应用程序威胁防恶意软件/Web应用防护/虚拟补丁和数据私密性数据加密。
在混合式IT环境中,Hadoop计算集群的弹性安全管理也是一个巨大的挑战。合规性法规仍然适用于大数据分析,因此需要采取措施来保护Hadoop。一种典型保护Hadoop系统的方案是HTTP Web网关、Job Tracker、Task Tracker、Name Node、Data Node、AD/LDAP Server防火墙和足够的防护。
总之,Hadoop在大数据分析中扮演着重要角色,但其安全性需要得到足够的关注。通过采用适当的技术和措施,可以保护Hadoop免受恶意软件和数据泄露的威胁。