■ TIG
將數據轉化為信息
我們的世界正在經歷一場技術繁榮的浪潮。通過數位化、工業4.0、大數據、人工智慧和機器自我學習等關鍵詞,我們可以找到無數描述下一次工業革命的文章、書籍、討論和概念。不可否認,這個新的競技場為世界提供了巨大的潛力和價值。而另一方面,對於數位化項目的實施成本,以及投資回報率問題,大家尚沒有清楚的瞭解。不過,在這個充滿危機和盈利壓力越來越大的時代,數位化讓我們能夠樂觀的看待行業的未來和機遇,特別是塑料行業。我們在建立大數據架構或人工智慧應用開發的過程中,從始至終都會面臨有關效率、品質、穩定性或可靠性的問題:
- 如何減少殘次品?
- 如何減少停機時間?
- 如何擴大工藝窗口,從而提高工藝穩定性?以及這些問題引出的其他問題:
- 哪些工藝參數影響我的產品品質?
- 工藝是否穩定,以及工藝窗口是否有效?
- 機器的部件是否有磨損的跡象?
- 原材料的變化和波動會對最終產品產生什麽影響?
無論是連續還是離散製造業,機器製造商還是塑料加工企業——都無時無刻在面臨這些問題。如果有讀者願意相信上述問題的答案是:「數據—我們需要數據,並從中獲取答案!」那麽他會失望的。
因為採集大量數據後盲目分析,是很難獲得成功的,有些人也許已經有過類似的痛苦經驗。通常來說,第一步是「分析問題」,對於跨學科團隊合作來說,這是最有效的方式。數據分析團隊中的機械工程師、控制工程師、工藝工程師和應用工程師與數據分析師,可以採不同方式與從不同角度來看待存在的問題。當我們澄清了所有與工藝檢查有關的問題(檢查什麽?如何檢查?以什麽頻率進行檢查?),我們即已實現了第一個目標。當專家團隊認為那些重要的數據能夠被收集和保存時,意味著我們已經到達另一個里程碑。此外,數據被賦予語義,得到驗證,最好是不僅存儲了原始數據,且數據已經在數據模型中「準備好了」以供調用分析。這一點上,我們有意省略了數據量的問題。大數據場景可能會以不同的方式出現,有可能是由於需要同時進行很多不同參數的測量和收集,或由於需要存儲來自於多臺機器的數據用於比較分析,或者,可能是因為某一個問題需要記錄很長一段時間的數據(預測性維護保養是常見的例子)。此外,「大數據」一詞並不僅僅指數據量,而是指“3V”——容量、速度、多樣性。因此,在物聯網領域,即使沒有非常大數量的數據,人們也會很快發現自己處於「大數據」場景中。
圖1:大數據價值鏈
數據分析
關於這點,我們想引入「大數據價值鏈」的概念(圖1),儘管如此,如上所述我們不對數據進行量化。相反,大數據價值鏈描述的是數據分析項目逐步發揮作用的方式。
具體來說,我們以射出行業為例:在圖2 的射出分解數據(帶時間戳,且可以指派給某一次射出過程的工藝數據)中有一個異常值,也就是射出機全自動生產時,有工藝值超出了公差範圍。
- 在描述分析中,我們試圖理解發生了什麽。由於相應射出過程中的流量超出公差範圍,我們將圖2 中的幾次射出視為異常。
- 在診斷分析中,我們試圖理解為什麽會發生異常。從圖2 看,在異常值發生前的兩次射出過程之間的時間間隔要比平常長得多。與其他的流量異常事件進行比較後,顯示這是一個重複事件(異常之前的長時間間隔)。此時工藝工程師可以得出結論:兩個射出過程之間間隔的時間越長,熔體的流動性能(例如:黏度)的變化就越大。
- 在預測分析中,我們嘗試設計一個預測模型。從這個案例來看,我們檢查了兩次射出時間間隔和流量增加之間的關聯性(例如相對於前10 次射出)。我們可以從其關聯性預測出週期時間的變化對流量的影響。
- 在規範分析中,我們嘗試找到抵消這一過程變異的方法,來進行補償。我們發現,通過調整保壓切換點和保壓壓力,可在一定程度上實現補償。我們要用什麽方法來實現這些結果?這是不是人工智慧或機器學習的切入點?一般來說,機器學習有助於描述性分析,但在診斷分析中,我們更加依賴專家的知識。例如,將聚類分析法、還原分析法和簡單的專家知識建模神經網絡相結合,產生的價值非常明顯。
總的來說,我們倡導所謂的「知情機器學習」或「物理引導機器學習」,一方面,基礎數據太小時,我們需要專家知識來彌補,另一方面,與純數據驅動的建模相比,分析或算法也要考慮物理定律。因此也被稱為「理論指導的數據科學模型(TGDS)」(圖3)。我們甚至可以將這個案例進一步展開。目前,我們還沒有對應的業務模型或實施策略。假設週期時間延長與機器操作員沒有及時移除傳送帶上的產品有關,那麽第二步分析提供的信息已經可以幫助我們減少異常,從而減少損失。那就沒有必要部署算法或軟體了。當需要考慮第三階段的分析時,情况就不同了。比如,我們可以安裝一個軟體,來指示流動指數超出公差範圍的概率。第四階段的分析是最複雜的——補償算法必須直接集成在機器控制系統中。當然這是最貴的但卻也是能夠全自動減少浪費的一種方式。
圖2:圖片顯示的是流動指數(藍色為實際值)、標稱值(黑色虛線)、相應的工藝窗口(綠色虛線)和一個異常值(紅色竪線)
IT 架構的要求
要以類似上述的方式應用大數據價值鏈,必須採取以下步驟:
- 理解問題;
- 數據收集;
- 數據分析和問題建模;
- 開發解決方案;
- 實施解決方案。
我們先不考慮操作維度和解決方案安全性的問題,而將重點放在功能和所需的軟體層面上。
為了採集數據,我們要有相應機器的驅動。這些數據通常是沒有元信息的,我們必須對其進行修飾(提供語義)。由於機器種類繁多,這將是個非常耗費時間的過程。數據採集進來之後,我們要解決數據路由和存儲的問題。數據是否要保存到本地系統中?是否要在雲端備份?是否要分配至多個端點?哪裡分析數據最好?是否可以通過數據聚合來節省成本?在處理數據的過程中,必須明確初始分析(這是發現問題和開發解決方案所必須的)、利用現有算法進行週期性分析(批處理)和利用現有算法進行連續分析(流分析)之間的區別。例如,設備每天自動測量一次磨損,我們在每日運行的批處理作業中對此進行分析,以監測磨損程度。拿射出機來說,我們要對每個射出週期進行穩定性分析,而對於押出機,我們則要對測量的變量進行連續性分析——這是流分析的典型例子。一般來說,分析的頻率越高,就能夠越接近那個點,進行有效的人為介入。分析的結果可以指導我們人為介入干預控制系統,這使得分析系統和控制系統之間的界限變得模糊了。
顯然,數位化帶來的大量應用場景和機遇也需要靈活的實施架構。一般來說,數據分析/ 大數據(混合系統也具有優勢)應該優先考慮既可以「本地安裝」又可以在雲端實施的靈活架構。原則上,通過各種層來描述的架構比較常見,屬於普遍的大數據架構,比如Lambda 架構。組成這種架構的單個組件可以用於邊緣計算/ 霧區。
接口層負責數據接口以及與解决方案的自身模塊和第三方系統的所有通信。數據管道用於處理數據流。它的特點是可伸縮性和複製能力,以及由此帶來的故障安全特性。存儲層既是數據池,又是數據樞紐,即不僅存儲轉換後的數據,也存儲原始數據。
圖3:理論指導的數據科學圖4:大數據/ 分析架構的軟體層
最關鍵的是「收穫低垂的果實」
要成功實施數據分析和人工智慧領域的項目,需要成熟的理念和經驗豐富的合作夥伴。最關鍵的是要從簡單的問題開始,從而「收穫低垂的果實」。在項目實施過程中,我們要從大數據價值鏈的技術和分析層面逐步建立所需的基礎架構和能力,從而解決更複雜的問題。■
作者
uni software plus
CEOMichael Aichinger
DAIM
CEO
Johannes Kilian
TIG
head of sales and marketing
Hannes Zach