大多数工业控制系统(ICS)都是几十年前设计和部署的。因而,它们缺乏IT网络中基本的资产发现和管理功能。
制造工业从传统上就一直挣扎于维护准确的资产清单。自动化营销软件公司TechValidate为工程和地理空间软件供应商鹰图公司做了一次针对185位制造工业从业者的调查,发现61%的业主经营人对自己找到支持应急响应所需信息的能力缺乏完全自信。超过半数的受访者20-80%的时间都耗费在查找和验证工厂信息上,包括进行工程验收。
随着网络威胁日益严重,很多制造工业公司希望能捍卫自身ICS网络。然而,缺了对资产的全面掌握,风险评估和有效防御应用都是不可能的。
为什么ICS网络缺乏资产管理
不同于高度进化的IT网络世界,工业网络常依赖于人工过程、注释和电子表格,没有自动化发现解决方案和非常高级的资产管理实践。很多工厂存储了一堆各种杂乱工程信息系统的设备信息,难以获得自身资产的完整视图。随着自身操作人员的离职,跟踪这些资产的改变就变得更加困难了。
ICS网络中实现资产管理需要什么
ICS网络资产管理通常在3个主要方面存在缺陷:发现、维护准确的当前资产清单,以及跟踪资产变化。
自动化资产发现是保护这些网络安全的关键。发现刚部署的新资产,或者退役的旧资产,可提供保护ICS网络所需的可见性,有助于安排安全工作优先级。因为网络部署往往伴随着对原始设计的有记录更改,依赖原始蓝图是不靠谱的。
典型的ICS网络包含各家厂商出品的控制器(PLC(可编程逻辑控制器)、RTU(远程终端单元)、DCS(分布式控制系统)),比如通用电气、罗克韦尔自动化、西门子和施耐德电气。每种技术都尤其独特的要求和难点。若不清楚范围内都部署了哪种资产,就难以规划维护项目和设计有效防护。一份包含制造商、当前固件版本、最新补丁和当前配置的,全面完整的资产清单,可以为这些设备带来更好的持续管理,在需要重置设备时也能提供支持备份和恢复。
同时,清单管理通常采用人工过程来跟踪变更,这往往是不准确且易出错的。由于这些网络随时间流逝不断改变,确保完整准确资产清单的唯一办法,就是实现自动化的持续发现过程。由此,网络上新增资产可被及时发现,也有助于跟踪和确认资产是否恰当部署或退役。
结论
自动化资产发现和管理是确保操作连续性、可靠性和安全性的第一步。缺了这一步,就不可能知道存在哪些设备,在什么时候设备做了哪些变更,以及怎样将设备重置回"已知安全"状态。规划维护项目、部署防御机制和进行有效事件响应与缓解工作,同样需要自动化资产发现的有力支持。
黑客技术官网地址:http://www.hackdig.com/
本文将推荐五种机器学习算法,你应该考虑是否将它们投入应用。这五种算法覆盖最常用于聚类、分类、数值预测和朴素贝叶斯等四个门类。
1. 聚类算法:k-means
聚类算法的目标:观察输入数据集,并借助数据集中不同样本的特征差异来努力辨别不同的数据组。聚类算法最强大之处在于,它不需要本文中其他算法所需的训练过程,您只需简单地提供数据,告诉算法你想创造多少簇(样本的组别),算法会为每个簇来分配一个编号。这种规范聚类算法就是k-means。
举个例子,你的应用可用k-means来按照营销目的区分你的网络服务的用户。你只需要输入(从电子商务网站获取的)一组客户的购买历史,并确定四组客户以进行分类营销。此时,你为k-means提供了一个数据表,每行代表一名客户,每列则是各种对客户的购买行为特征(如成为客户的时间、每月评价花费、每月评价订单量、地理位置、对当天航运的使用比例等等)。算法会为表格增加一栏:编号1-4来表示不同的分组。
提示:使用kmeans函数或rxKmeans. 用以执行bt rx的函数是ScaleR的一部分,所以不能支持量很大的数据集。
2&3. 两类、多类分类算法
分类算法的目标:输入一行数据及一个类目名称表,通过对数据的校验估测其所属的类目。分类算法通常按照分类时的类目总数分为两类和多类分类算法。在你使用种算法预测新数据前,你需要预先使用一组类目可知的数据对算法加以训练。
不妨举个简单的例子来说明两类分类算法:想象一个你希望得到是/否(或真/伪)的两极化情形。此时,类别分别为"是"和"否"(或者"真"和"伪")。两类分类的典型应用是:根据历史天气条件(如温度、风速、降水、气压)和航班信息(如航空公司、起飞时间、航班号)来预测未来航班会推迟15分钟离开还是照常起飞。输出分为"延迟"和"不延迟"两类。在大多数情况下,两类分类算法的核心是逻辑回归的使用,后者用于生成一个在0到1范围内的值。如果该值小于0.5,往往会解释为第一个类(如"不延迟"),否则会划为第二类(如"延迟")。
另一个应用是:预测贷款的偿还情况,来作为拓展信用的一部分。你必须提供贷款人的相关数据,譬如信用分数、房产年限、工作时长、信用卡债务总额、数据采集年份以及有贷款违约记录。分类为"会违约"和"不会违约"。这个例子之所以非常有趣,是因为对于一些机器学习所处理的难题来说,仅仅有预测结果并不足够,还必须知晓结论是怎样得出的。这时多组分类算法形成的决策树就派上用场了,决策树中的多组分类算法可以分析从输入到最终生成预测的过程。回到贷款这一案例,不妨想象你是银行方,当你拒绝了消费者的贷款新的信用卡要求时,消费者的下一个问题可能是"为什么?"。通过决策树,你可以具体回答:"好吧,你的信用分数太低了,信用卡债台高筑,工作年头又太短了。"
充分理解两类分类算法后,进一步理解多类分类算法就顺理成章了。多类分类算法可应用于电影院,来告诉后者某部电影究竟是垫底的票房毒药(不仅口碑差,而且主流观众不感兴趣)、口碑导向(叫好不叫座)还是票房导向(口碑差,但是票房高)。三个分类分别是"毒药"、"口碑导向"、"票房导向"。你也可以使用决策树,来了解一部电影为何会得到这样的评价。
提示:使用glm或rxLogit来进行两类或多类分类。进行多类分类时,你可以使用rpart或rxDTree来建立可观察决策树。
4. 数值预测
数值预测算法的目标:根据一组输入,预测一个具体数值。仍然使用上文中航班延误的例子,我们现在要做的不再是预测航班是否会推迟15分钟,数值预测算法将让你知晓航班将具体被推迟多久。数值预测算法的核心是线性回归的使用(不要与分类算法使用的逻辑回归混淆),通过对历史数据的线性拟合,线性回归可以有效地进行数值预测。最好的例子是股票的预测,线性回归根据过往数据的分布,拟合出一条最合适的直线,延长这条线你就可以预测将来的股票价格。
提示:使用Im或rxLinMod函数。
5. 朴素贝叶斯算法
最后,你的采纳清单上还缺一个机器学习中劳苦功高的算法――朴素贝叶斯算法。它的核心是因果关系。更具体地说,朴素贝叶斯算法是在给定已知的成因的情况下,预测这一成因将产生的效果以及效果的程度。现实生活中的典型例子是癌症检测。你可以通过对病人特定病状(效果)的观察,来预测病人患有癌症的概率(疾病是成因)。再举个和你相关的例子,朴素贝叶斯算法可以根据你已购买的商品为你推荐其他商品。例如,你网购了一些鸡蛋,算法会提醒你买些牛奶,因为你的购买历史显示:购买鸡蛋(成因)会导致购买牛奶(效果)。朴素贝叶斯有趣的一点在于,它可以用于分类和数值预测。。
提示:使用naiveBayes和rxNaiveBayes函数。
结论
好了,你有了一个实用算法的清单。现在,重新审视你的应用,想一想哪些地方可以增添点机器学习带来的智能性。
相关阅读
DARPA:机器学习的关键限制条件是什么?
利用机器学习、人工智能和认知计算找到威胁
利用机器学习追踪黑客 佐治亚理工学院获1700万美元溯源项目
黑客技术官网地址:http://www.hackdig.com/
没有评论:
发表评论