超融合雙活集群打造半導體精尖制造“定海神針”
2020 年 5 月,上海申和熱磁電子有限公司(下文簡稱“申和熱磁”)迎來了 25 周年大慶。從 2002 年進軍半導體硅片產業開始,申和熱磁在電子,尤其是各種規格的太陽能級單、多晶硅錠和單、多晶硅片的制造上突飛猛進。2019 年,申和熱磁又譜寫了一部“老兵新傳”,投資建立的杭州中欣晶圓半導體股份有限公司大硅片項目正式建成。這是一個標志性的突破,國內首家規模最大、技術最成熟、具有自主核心技術且真正可量產的半導體大硅片生產工廠起航。
穩定性壓倒一切
眾所周知,硅片等高精尖制造對材料技術、生產技術和流程,以及產品質量有極高的要求。申和熱磁主要通過引入 MES 系統(制造執行系統)對生產的每道工序進行主動管理和質量控制,以提高良品率。因此,MES 系統能否穩定運行成了硅片制造質量的重要前提和保證。
MES 系統牽一發動全局,它必須運行在高穩定、高可靠的 IT 基礎架構之上。
因為歷史的沿革,申和熱磁原先也和大多數制造企業一樣,基于“服務器虛擬化+集中式存儲”的傳統架構,支撐 MES 系統的運行。這種方式的弊端在于,存在明顯的單點故障風險,更不具備在災難中快速恢復的能力。另外,隨著業務的快速發展,原有機房在空間、制冷等方面捉襟見肘,也成為潛在的停機風險點,再加上部分服務器使用年限較長,穩定性和性能不足。
為保障 MES 系統的穩定運行,IT 基礎架構升級勢在必行。申和熱磁利用在同城異地建設新建機房的契機,與原有機房配合,重新構建了能夠支撐關鍵業務系統(包括 MES、ERP 等系統)的實時容災基礎架構,并且在新機房基礎架構的建設中,努力提高資源利用率、節省空間,以適應業務的快速擴展。對申和熱磁來說,超融合雙活集群是“一箭雙雕”的選擇。
從保證可靠性和高可用性的角度出發,申和熱磁在第一時間聯系到 SmartX,并從 2019 年 7 月開始進行了深入的需求探討和方案溝通。最終,雙方根據申和熱磁的實際需求,即需要在一個園區的 A、B 兩個廠區分別建設一個機房,并且要實現實時容災,最終決定基于業內流行的雙活集群模式對整體 IT 架構進行改造。
為業務發展裝上“永動機”
在環境準備到位后,SmartX 專業服務團隊只用一天時間便完成了基于 SMTX OS 的雙活集群部署,并在一周內完成了應用部署及相關的故障演練和驗證。
從整個部署流程來看,申和熱磁分別在 A、B 廠區的兩個機房部署了 SmartX Halo 一體機,兩個機房之間通過裸光纖進行互連,并通過 SMTX OS 超融合軟件構建跨機房的拉伸集群。借助雙活集群的功能,實現兩個機房數據的完全同步,MES 數據庫則可以通過 Oracle RAC 集群的方式部署在兩個機房之上,一旦任意一個機房出現故障,業務系統都可以透明切換到另外一個站點上恢復運行,確保了 MES 業務系統的高可用。
此方案的核心——SMTX OS 雙活集群由兩個超融合站點以及仲裁節點組成,兩個站點之間用網絡連通,并且物理距離不大于 75 公里。雙活集群中的業務數據將自動實時同步到遠端站點中,一旦發生火災或電力中斷等災難故障,業務可快速遷移到可用站點,并及時恢復運行。SMTX OS 雙活集群保證了 IT 基礎架構層面的高可用,同時配合實時應用集群 Oracle RAC,實現業務層面的高可用,“雙管齊下”全面滿足申和熱磁的應用需求。
為確保整個系統的高可用性,申和熱磁特別進行了故障演練,結果顯示,MES 系統的 RPO 為 0,RTO 接近于 0,達到了預期的容災效果。不僅如此,構建于超融合雙活集群之上的 MES 系統的運行速度提升一倍,采購成本直降 30%。同時,ERP、OA 等重要生產業務系統也可通過 V2V 模式遷移到超融合環境中,輕松完成了硬件設備的更新換代。
見證并親身參與了整個 IT 架構改造的申和熱磁信息管理部部長沈劍鋒深有感觸:“SmartX 超融合雙活集群解決方案,為我們的 MES 系統提供了高可靠支撐,有效保障了生產不停頓。”
超融合成為關鍵業務的中流砥柱
近年來,隨著國內芯片、半導體行業的蓬勃發展,申和熱磁的業務增長速度明顯加快,布局也越來越深入。但從現狀看,半導體硅片仍是我國半導體產業鏈與國際先進水平差距最大的環節之一。申和熱磁還要繼續深挖潛力,實現跨越式增長。
砥礪奮進二十五載,申和熱磁在硅片高精尖制造方面從未停下前進的腳步,對技術和質量的不懈追求更是申和熱磁勇往直前的動力。而作為助推器,IT 基礎架構也要與時俱進,為穩定、高效、高質量的生產制造保駕護航。SmartX 在超融合領域擁有獨特的產品和解決方案,特別是基于超融合的雙活集群解決方案非常適合對穩定性和可用性有嚴苛要求的企業。
越來越多成功的實踐表明,超融合架構完全有能力承載企業關鍵核心業務,成為業務穩定發展與創新的“定海神針”。