■工研院 / 湯燦泰 副理 & 李青憲 組長
前言
2022年Midjourney、ChatGPT……等GAI工具相繼問世,吸引全球上億用戶數使用,掀起生成式AI (Generative AI, GAI)熱潮,同時也帶來對經濟社會的衝擊與影響,除了廣泛應用於圖像生成、語音合成、自然語言處理等領域,推動創新和個人生產力提升之外,也越來越多企業將GAI技術融入業務流程,提高運營效率。
融合過程中,也呈現GAI技術與其他前沿技術(如物聯網)整合,創造更多創新應用場景,也促進生態系統的發展,如圖1所示;GAI相關應用蓬勃發展過程中,GAI倫理與規範也益發重要,其中針對數據隱私、倫理使用和監管需求日益重視,各國相關法規也逐步推出;相關趨勢皆顯示GAI技術在全球範圍已造成深遠影響,未來有望持續推動各行各業的數位轉型。
隨著GAI商機浮現,國際金融媒體Bloomberg預估,至2032年全球GAI市場將達到1.3兆美元,其中在硬體與基礎建設的部分,預估於2032年將達到6,417億美元;在軟體平台的部分,則預估於2032年將達到6,618億美元。
另外,根據國際研究機構Global Market Insights預測指出,2022~2032年GAI市場之複合年均成長率約29%;根據紅杉資本預估,GAI在文本與程式碼兩大領域之技術發展最為快速,預計至2030年將達到成熟應用,不論是文本或程式碼的生成品質均高於人類專家的平均值,因此本文將應用檢索增強生成(Retrieval Augmented Generation, RAG)及領域大語言模型(Large Language Model, LLM)來建構射出成型GAI知識問答系統,評估文本生成之可行性。
結合LLM與RAG機制,以即時更新GAI知識問答內容
射出成型GAI知識問答系統包含檢索增強生成(RAG)及領域大語言模型(LLM),流程如圖2所示。
流程說明
由於LLM輸入字數有限制,將公私資料內容切割成多個小區塊(chunk),並使用①Embedding model將每個區塊轉換成向量表示,被②儲存到向量資料庫vector database中以便後續查詢;當使用者③問句透過Embedding model向量化,而④問句向量語意搜尋向量資料庫vector database,⑤回傳top-k相關的資料;為了不超過LLM的輸入限制,不會將整個問答紀錄一次性輸入,而是使用者⑥上下文學習(in-context learning),將問句與top-k相似資料組合成prompt,將可更有效地進行查詢;取出最相關的內容後,結合自然語言理解和生成能力,呼叫⑦LLM API及特定領域LLM將問句和所查詢相關內容生成用戶具體的答案,最後將⑧答案回傳給使用者;至於⑨從人類反饋中強化學習(Reinforcement Learning from Human Feedback, RLHF)更新特定領域LLM模型,將人類智慧與機器高效學習能力相結合,讓模型變得更強大。
射出成型GAI知識問答應用案例
為了建構射出領域知識,將射出成型GAI知識問答系統輸入ACMT模具與成型智慧工廠雜誌5份電子資料,每份至少10篇文章,建構射出成型領域RAG,其中包含2023年度的8月刊「第38屆高分子加工國際研討會之技術回顧」、9月刊「產業輕量化與無損檢測技術之最新發展與應用」、10月刊「三大金屬粉末成型技術的現況與未來」、11月刊「從賦能到產能──『T零量產』的實踐」、12月刊「2023年之精彩技術回顧與總結」。
而射出成型GAI知識問答系統利用通用LLM結合領域知識RAG,使用者輸入「第38屆高分子加工國際研討會之技術回顧有哪些內容?」,從GAI問答系統可獲得:第38屆高分子加工技術包含12項技術,詳細內容如圖3所示,透過比對ACMT雜誌8月內容,可發現與GAI問答系統所提供結果皆相仿。
而當使用者輸入「如何優化汽車車頂機匣零件翹曲?」,從GAI問答系統可獲得:Shape Crop使用Moldex3D軟體進行模擬預測零件翹曲情況,並使用Inceptra軟體進行反轉翹曲操作進行模具補償,此法可成功將原本18mm翹曲量減少至3mm,詳細內容如圖4所示,透過比對ACMT雜誌8月內容,可發現與GAI問答系統所提供結果皆相仿,可精準提供雜誌內容給使用者。
結論
本文將應用檢索增強生成RAG及領域大語言模型LLM來建構射出成型GAI知識問答系統,驗證GAI射出成型之ACMT雜誌信息獲取效率及射出知識內容管理,此系統可快速理解ACMT雜誌內容及面對大量信息時文本摘要可縮短信息處理時間,進而可提高信息獲取效率。
通過文本摘要迅速判斷某篇文章是否符合需求,並將大量信息進行分類和整理,以利後續查找與使用,提升射出知識內容管理。因此射出成型GAI知識問答系統不僅提高信息處理效率,未來期待改變射出成型產業之用戶體驗和工作效率。