2022年7月,統(tǒng)信軟件在繼承自由開放的開源精神基礎之上,結合當前操作系統(tǒng)軟硬件產(chǎn)業(yè)鏈的現(xiàn)狀,首次提出了「分層分類」的開源技術路線。
時隔一年,統(tǒng)信軟件自研的分層分類算法取得初步成果,并已應用于統(tǒng)信UOS服務器版和統(tǒng)信UOS云原生版等多個產(chǎn)品。
「分層分類」新思路,使得大家能摒棄細節(jié),把握大局與關注核心問題,也能凝聚共識,為下一代操作系統(tǒng)的開發(fā)奠定堅實的理論與技術基礎。
第一? 統(tǒng)信UOS的分層分類方案
「分層分類」體系架構的核心思想是“垂直分層、水平分類、數(shù)據(jù)驅(qū)動、算法先行”。
在IT領域中,將軟件包的關系結構化,可以有效“加速”系統(tǒng)構建和維護。
例如,可以由軟件包的構成和位置確定其承上啟下的作用,從而判斷更換軟件包的代價,進而為業(yè)務場景和生產(chǎn)環(huán)境的平滑遷移與升級提供有力的依據(jù)。
分層方案
根據(jù)軟件包依賴關系進行層級劃分,每層定義了各自的功能范圍,并向上層提供相應的接口:
內(nèi)核層:包含操作系統(tǒng)內(nèi)核和驅(qū)動程序,向下屏蔽了硬件差異。
核心層:對操作系統(tǒng)啟動運行和使用起關鍵作用的核心軟件。
系統(tǒng)層:擴展內(nèi)核層、核心層功能服務,為客戶和應用提供數(shù)據(jù)和服務的軟件。
應用層:供客戶和應用使用的各類通用軟件(與各類應用場景有交集)。
分類方案
分三個維度,即形態(tài)、功能和場景:
形態(tài):根據(jù)軟件包中的文件及其描述信息,將其分為庫、工具和服務。
功能:主要根據(jù)軟件包的描述信息,挖掘出其中的功能。
場景:以用戶的實際使用場景為依據(jù),并根據(jù)這些場景的典型應用及其依賴關系,進行歸并。
第二? 千挑萬選的BERT模型
首次提出「分層分類」技術路線后,我們做過很多嘗試:將軟件包的依賴關系組成圖后,對圖進行切割或矢量錨點定位;使用NLP算法的BERT模型,根據(jù)軟件包依賴關系進行分割……
最終,我們選擇了BERT模型方案。
BERT模型是由Google提出的自編碼語言模型,思想是計算出每個句子中每個token與其他token的關系向量,然后對關系向量進行正則化,最終得到分類概率。
第三? 統(tǒng)信UOS的分層與分類算法
分層算法是根據(jù)軟件包的描述信息及其上下依賴關系的描述信息進行分層。
上下依賴關系分為上層依賴和下層依賴,上層依賴即其他軟件包依賴該軟件包,下層依賴即該軟件包依賴其他軟件包。
分類算法,則是根據(jù)軟件包的描述信息進行分類。
統(tǒng)信UOS服務器版汲取國內(nèi)外主流社區(qū)技術棧優(yōu)勢,融入「分層分類」的理論和實踐優(yōu)勢,深入技術底層結合國內(nèi)外設計標準與規(guī)范以及各類用戶業(yè)務應用需求,積極開展技術創(chuàng)新,全面支持國內(nèi)外主流CPU架構和處理器廠商,在各種應用環(huán)境中,滿足強安全、高穩(wěn)定、高性能、易維護以及泛兼容等要求,是一款構建信息化設施環(huán)境的基礎軟件產(chǎn)品:
強安全:
等保四級GB/T20272-2019認證
商密二級GM/T0028認證
全棧生態(tài)鏈支持國密
國際知名安全社區(qū)OpenSCAP官方首批支持的中國操作系統(tǒng)
21天推送一次補丁更新,每周進行漏洞修復推送
高穩(wěn)定:
穩(wěn)定版Linux4.19&5.10雙內(nèi)核
熱補丁升級機制
LTP7*24小時測試用例通過率超98%
長時高負荷運行,卸荷后60秒內(nèi)實現(xiàn)系統(tǒng)及各應用流暢運行
高性能:
內(nèi)存拷貝頁技術,拷貝性能提升超70%,滿并發(fā)優(yōu)化提升10%
多種自研性能優(yōu)化成果:文件讀寫性能提升4%、調(diào)度延遲減少10%、多并發(fā)鎖競爭場景性能提升5%……
相比同類產(chǎn)品,UnixBench等測試全面領先
易維護:
提供自研統(tǒng)信有易服務器遷移軟件
提供自研統(tǒng)信有幄自動化運維工具
提供面向場景的AI系統(tǒng)調(diào)優(yōu)能力
泛兼容:
歷史版本兼容性>98%,提供平滑升級方案
組件模塊化設計,為用戶最大限度解決底層依賴問題
全面通過整機適配兼容性測試(多種不同型號的整機)
統(tǒng)信軟件服務器操作系統(tǒng)與云計算產(chǎn)線總經(jīng)理孟杰表示,統(tǒng)信UOS的分層分類研究成果已廣泛應用于多產(chǎn)品、多領域,可以更好地協(xié)調(diào)產(chǎn)業(yè)/團隊分工、明確研發(fā)方向、維護關鍵軟件、共建共享共治開源新生態(tài)。未來,我們將繼續(xù)深耕技術方案和架構,助力中國開源操作系統(tǒng)角逐世界舞臺。
相關稿件