经典图书 当前,制造过程中所产生的数据的规模、类型和速度正在呈指数级增长,带来了巨大的发展机遇。通过认真分析这些数据,企业可获得竞争优势、快速响应不断变化的市场动态、显著提高制造利润、生产力和效率。工厂车间中的设备会生成成千上万种不同的数据类型,例如多个级别的单位生产数据、设备运行数据、流程数据、人工操作员数据等。这些数据可以在存储后用于数据分析。
尽管大型制造商多年来一直在使用统计流程控制和统计数据分析来优化生产,但当今数据的复杂结构成为部署新方案、基础架构和工具带来了重大机遇。得益于更卓越的计算性能的涌现、开放标准的推出和广泛可用的行业专长,制造业已经准备好充分利用大数据。此外,在学术研究的推动下,技能娴熟的数据科学家数量庞大,他们将能够在使用大数据方面为制造业提供更出色的支持。
借助全新的制造智能特性,制造商能够提高质量,增加产量,更准确地了解制造问题的根本原因,以及减少机器故障和宕机情况。借助新的业务价值和技术能力,制造商将能够改变业务模式和实践,以优化设计,实现出色的可制造性,从而改进供应链管理,并采用定制的制造服务缩短专为各地消费者量身定制的产品的上市时间。
本文概述了英特尔一家制造工厂的物联网(IoT)试点计划,以说明将数据分析应用于工厂设备和传感器可如何提升制造流程的运营效率并节约生产成本。在实施这一物联网大数据分析项目的过程中,英特尔与Cloudera、戴尔、三菱电机和Revolution Analytics进行了紧密的行业协作,预计每年将能够节省数百万美元,并带来更高的投资回报。
挑战:如何从所有的制造数据中提炼价值?
大数据实质上是包含各种数据类型的庞大数据集,可以分为结构化、半结构化或非结构化,如表1所示。结构化数据适合放在格式整齐的表格中,因此相对容易管理和处理。结构化数据的优势是便于输入、存储、查询和分析。相关示例包括关系数据库中存储的制造数据,以及来自制造执行系统和企业系统的数据。另一方面,非结构化数据(例如图片、文本、设备日志文件、人工操作员生成的值班报告和制造社交协作平台文本等)可能为原始格式,需要经过解码才能提取数据值。半结构化数据是结构化数据的一种,其格式不符合关系数据库或其他形式的数据表关联的数据模型标准结构,但包含用于分隔语义要素的标记或其他记号,并且数据中明确了记录和字段层次结构。在制造业,要想发挥大数据技术的强大作用,需要将这些数据集类型进行合并与关联,从中发现新的洞见,从而创造出色的业务价值。大数据技术的另一个价值定位就是,支持制造商以经济高效、可扩展的方式聚合并集中各类数据。
表1 制造数据示例
制造流程存在各种变量,如材料、流程方案和方法以及设备差异,这就要求制造商采用基于可扩展平台的大数据解决方案,这种平台能够随着业务增长和制造要求的提高而扩展。机器数据与产量和质量密切相关,因此能够为主动检测将要失去控制的流程提供重要信息。然而,一些类型的制造流程会产生大量数据文件(每个工具类型几天就可产生GB级数据,如表2所示),限制了使用传统方法从这些数据中分析、提取和存储有用信息的能力。如果不使用大数据技术,直观呈现来源广泛的大型数据集中的信息都非常困难。
表2 数据大小示例
应对挑战:英特尔制造部门使用大数据分析服务器和物联网网关的物联网试点计划
图1 支持为从工厂车间到数据中心的整个过程提供制造智能的端到端基础架构构建模块
图1所示为面向大小型数据集的高级物联网制造架构,这些数据集包含来源于制造车间和制造网络、可供收集和聚合的各类数据。该架构为通过数据可视化、监控和挖掘创建新型商业智能提供了全新可能。
举例来说,该架构可以清理、提取和转换来自现有数据库的结构化数据、来自工具传感器的非结构化数据以及来自传统设备的日志文件,并将它们整合在一个数据存储平台(即Hadoop)中。然后,运行在内部服务器(即数据存储服务器)上不同虚拟机的高级工厂应用可对数据进行可视化和分析。或者,用户可使用网络上的其他分析或监控应用访问这些数据。其他增强功能包括在Hadoop或其他类型文件系统中进行分析或在内存中进行分析以提升性能。分析结果可通过网络商业智能层中的直观可视化功能展示给用户。
英特尔制造部门试点计划中的大数据分析物联网服务器设置
图2 大数据分析服务器 |