全球製造業正加速邁向智慧化轉型,其中產線檢測環節向來是能耗大戶。傳統檢測系統依賴高運算量晶片,長時間滿載運行不僅耗電可觀,更產生大量廢熱,間接增加空調與散熱成本。隨著半導體製程微縮逼近物理極限,專為產線檢測設計的專用晶片(ASIC)成為節能關鍵路徑。最新研究顯示,透過架構層級的精細調校與演算法硬體協同設計,這類晶片的能效比(每瓦運算能力)可提升達40%,整線檢測設備的整體能耗有望降低30%以上。
這項突破並非單一技術的功勞,而是從晶片設計到系統整合的系統性優化。首先,檢測晶片採用稀疏運算架構,針對產線影像中大量背景資訊進行動態跳過(skip),只對異常區域進行高精度分析,大幅減少無效運算。其次,電源管理單元引入自適應電壓調節(AVS),根據即時工作負載動態調整核心電壓,避免傳統固定電壓造成的浪費。再者,記憶體子系統導入近存運算(near-memory computing)概念,將部分預處理邏輯嵌入DRAM或SRAM周邊,降低資料搬運耗能。這些設計相互疊加,使得單顆晶片在相同檢測吞吐量下,功耗從過往的15瓦降至9瓦以下。
半導體測試業者指出,產線檢測場景對晶片要求極為嚴苛:需在毫秒級內完成高解析度影像的擷取、比對與判讀,同時必須承受工廠環境的溫度與震動。過去工程師傾向以「超規格」晶片換取效能餘裕,但這樣做往往導致能耗浪費。如今透過專用晶片能效優化,廠商可在不犧牲檢測精度的前提下,顯著縮小電源供應器與散熱模組體積,進一步降低設備總擁有成本(TCO)。
業界預估,未來兩年內支援此類優化技術的檢測晶片將大規模導入半導體封測、PCB光學檢測與食品包裝檢驗等領域。尤其是消費性電子產品對低碳足跡的要求日趨嚴格,品牌商開始將供應鏈的能源效率列為評鑑指標之一。能效優化的產線檢測晶片,將成為製造業達成ESG目標的關鍵技術支柱。
架構革新:從通用到專用的能效跳躍
傳統產線檢測系統多採用GPU或FPGA作為運算核心。雖然這些元件具備高度可程式化彈性,但對固定檢測演算法而言,許多電晶體實際上處於閒置或低利用率狀態。專用晶片則完全不同,其內部運算單元、記憶體佈局與資料路徑完全根據常見的瑕疵檢測模型(如卷積神經網路、模板匹配)進行硬體化設計。這種專用性帶來了極高的運算密度,單位面積內可同時執行更多推論任務。
晶片設計團隊通常從三方面著手:其一,針對卷積層採用量化感知訓練(quantization-aware training),將權重與激活值從浮點數降為8位元或4位元整數,運算單元面積縮減為原本的四分之一,功耗同步下降。其二,透過管線化(pipelining)設計,讓影像串流連續流經不同處理階段,減少等待週期並提升資料重複使用率。其三,引入資料壓縮引擎,在傳輸前將感測器影像壓縮至原大小的二分之一,減少晶片內外資料傳輸的位元翻轉能耗。
實際測試結果顯示,在相同製程節點(28奈米)下,專用檢測晶片的每瓦運算效能(TOPS/W)比同等級FPGA高出約5倍,比GPU高出近10倍。這意味著原本需要高階顯示卡才能達到的檢測速度,現在用一顆低功耗專用晶片即可勝任。部分晶片廠更將光學鏡頭控制、影像預處理與推論引擎整合為單晶片系統(SoC),進一步削減電路板層級能耗。
動態電壓調節:讓每瓦電力都用在刀口上
晶片功耗可分為動態功耗與靜態漏電流兩部分。在傳統設計中,晶片經常以最高額定電壓運作,以確保在最差情境下仍能符合時序要求。然而,產線檢測的負載並非恆定——當產線速度放緩或待測品通過數量減少時,實際運算需求大幅降低。若能讓晶片即時感知工作負載變化並動態調整電壓與頻率(DVFS),就能在輕載時節省大量動態功耗。
新型檢測晶片整合了專屬的電壓調節控制器,搭配晶片內建溫度與活動感測器,可在微秒等級內響應負載改變。例如,當檢測系統處於待機或僅進行簡單的輪廓掃描時,控制器自動將核心電壓從1.1V下調至0.8V,時脈頻率同步降低,動態功耗可驟降約70%。而當一批高密度瑕疵需即時分析時,電壓與頻率再迅速回升至滿載狀態。這種細膩的調控機制,讓能耗曲線緊貼實際需求,避免傳統固定電壓造成的浪費。
此外,部分先進設計更採用多電壓域(multi-voltage domain)架構,將晶片內的不同功能區塊(如影像輸入、運算陣列、輸出介面)分別供電。根據各區塊的即時活躍程度,獨立調整其電位。例如,在影像輸入量不足時,關閉部分運算陣列的電源域,僅保留必要通道。如此一來,晶片的靜態漏電也得到精確控制,整體待機功耗降至毫瓦等級。
近存運算:打破記憶體牆的節能策略
在傳統架構中,資料必須在運算單元與記憶體之間來回搬運,每一次讀取與寫入都伴隨著明顯的能量消耗。研究指出,對於典型的深度學習推論任務,記憶體存取能耗佔總能耗的60%至80%。產線檢測晶片若想極致節能,就必須從記憶體著手。近存運算(near-memory computing)將部分運算邏輯直接置於記憶體陣列旁,甚至是內嵌於記憶體內部,使得資料無需經過漫長的匯流排傳輸即可完成處理。
應用在檢測場景中,晶片在記憶體周邊設置了專門的加法樹與比較器,能夠直接在SRAM或DRAM的子陣列中執行簡單的影像濾波與特徵比對。例如,當進行壞點檢測時,不需要將整幅影像搬運到主運算陣列;記憶體附近的邏輯可以先行比對相鄰像素的差值,大幅減少資料傳輸量。這種設計不僅降低動態功耗,也縮短了資料路徑延遲,使得檢測時間進一步壓縮。
目前已有晶片廠商開發出整合64MB SRAM與128個近存運算單元的原型晶片。在執行標準的PCB焊點檢測任務時,總能耗僅為傳統方案的三成,而檢測精度並未妥協。這項技術對於高速產線尤其重要,因為資料傳輸瓶頸往往是能耗與延遲的雙重來源。未來若能進一步採用電阻式隨機存取記憶體(RRAM)等新興儲存元件,近存運算的能效優勢還有望再翻倍。
演算法硬體協同設計:讓軟體引領硬體節能
能效優化不應僅停留在硬體層面;演算法與硬體的深度協同才是關鍵。傳統作法常將演算法視為固定輸入,硬體被動遵循其運算需求。但新的設計思維強調,演算法應從開發之初就考量硬體的限制與特點,例如限制運算精度、設計更友善記憶體存取模式的網路結構。
針對產線檢測,研究團隊提出一種混合精度神經網路架構,在重要的邊緣與細節區域使用8位元浮點數運算,而在平滑背景使用4位元整數運算。晶片內的運算單元支援動態精度切換,使整體能耗較16位元全精度方案減少約55%。同時,透過模型剪枝(pruning)移除網絡中冗餘的權重連接,進一步降低所需運算量,讓較小的硬體面積即可滿足性能目標。
另一項重要策略是將檢測流程分解為粗篩與細查兩階段。第一階段以極低解析度、低功耗的快速篩選判斷是否存在異常,僅當機率超過門檻時,才啟動高解析度、高算力的細查模組。這種分級架構使晶片大部分時間處於低功耗模式,只有少數樣本需要完整檢測。搭配即時動態電壓調節與近存運算,整體能效表現達到前所未有的水準。
業界觀察,能效優化的檢測晶片正從實驗室走向量產。預計今年底就有搭載此類晶片的商用檢測設備問世,初期鎖定半導體封測與光學鏡頭檢測市場。對於追求智慧製造與綠色生產的台灣廠商而言,導入這項技術不僅是降低電費帳單的手段,更是爭取國際品牌客戶訂單的競爭優勢。
【其他文章推薦】
電動堆高機、柴油堆高機怎麼選?差異一次比較
貨櫃屋優勢特性有哪些?
零件量產就選CNC車床
消防工程交給專業來搞定
塑膠射出工廠一條龍製造服務
堆高機租賃怎麼選最划算?掌握 3 大隱形成本,每年幫公司省下萬元!