國產演算法
1. 縐戞櫘:鍥戒駭瀵嗙爜綆楁硶
1銆佸浗瀵嗙畻娉曟槸鍥藉跺瘑鐮佸矓鍒跺畾鏍囧噯鐨勪竴緋誨垪綆楁硶銆傚叾涓鍖呮嫭浜嗗圭О鍔犲瘑綆楁硶錛屾き鍦嗘洸綰塊潪瀵圭О鍔犲瘑綆楁硶錛屾潅鍑戠畻娉曘傚叿浣撳寘鎷琒MSMSMSMS4絳夛紝鍏朵腑錛歋M1錛氬圭О鍔犲瘑綆楁硶錛屽姞瀵嗗己搴︿負128浣嶏紝閲囩敤紜浠跺疄鐜般
2銆佸浗瀵嗗嵆鍥藉跺瘑鐮佸矓璁ゅ畾鐨勫浗浜у瘑鐮佺畻娉曘備富瑕佹湁SM1錛孲M2錛孲M3錛孲M4銆傚瘑閽ラ暱搴﹀拰鍒嗙粍闀垮害鍧囦負128浣嶃
3銆佸浗瀵嗙畻娉曪細鍥藉跺瘑鐮佸矓璁ゅ畾鐨勫浗浜у瘑鐮佺畻娉曪紝鍗沖晢鐢ㄥ瘑鐮併
4銆佸浗瀵嗗嵆鍥藉跺瘑鐮佸矓璁ゅ畾鐨勫浗浜у瘑鐮佺畻娉曘備緥濡傦細鍦ㄩ棬紱佸簲鐢ㄤ腑錛岄噰鐢⊿M1綆楁硶榪涜岃韓浠介壌鍒鍜屾暟鎹鍔犲瘑閫氳錛屽疄鐜板崱鐗囧悎娉曟х殑楠岃瘉錛屼繚璇佽韓浠借瘑鍒鐨勭湡瀹炴с傚畨鍏ㄦ槸鍏崇郴鍥藉躲佸煄甯備俊鎮銆佽屼笟鐢ㄦ埛銆佺櫨濮撳埄鐩婄殑鍏抽敭闂棰樸
5銆佹渶鏂扮畻娉曞備笅錛岀洰鍓嶏紝鎴戝浗鑷涓葷爺鍙戠殑甯哥敤鐨勫浗浜у瘑鐮佺畻娉曟湁浠ヤ笅鍑犵嶏細SM1綆楁硶銆
2. 什麼是sm演算法
國產密碼演算法(國密演算法)是指國家密碼局認定的國產商用密碼演算法,目前主要使用公開的SM2、SM3、SM4三類演算法,分別是非對稱演算法、哈希演算法和對稱演算法。
1.SM2演算法:SM2橢圓曲線公鑰密碼演算法是我國自主設計的公鑰密碼演算法,包括SM2-1橢圓曲線數字簽名演算法,SM2-2橢圓曲線密鑰交換協議,SM2-3橢圓曲線公鑰加密演算法,分別用於實現數字簽名密鑰協商和數據加密等功能。SM2演算法與RSA演算法不同的是,SM2演算法是基於橢圓曲線上點群離散對數難題,相對於RSA演算法,256位的SM2密碼強度已經比2048位的RSA密碼強度要高。橢圓曲線參數並沒有給出推薦的曲線,曲線參數的產生需要利用一定的演算法產生。但在實際使用中,國密局推薦使用素數域256 位橢圓曲線,其曲線方程為y^2= x^3+ax+b(其中p是大於3的一個大素數,n是基點G的階,Gx、Gy 分別是基點G的x與y值,a、b是隨圓曲線方程y^2= x^3+ax+b的系數)。
2.SM3演算法:SM3雜湊演算法是我國自主設計的密碼雜湊演算法,適用於商用密碼應用中的數字簽名和驗證消息認證碼的生成與驗證以及隨機數的生成,可滿足多種密碼應用的安全需求。為了保證雜湊演算法的安全性,其產生的雜湊值的長度不應太短,例如MD5輸出128比特雜湊值,輸出長度太短,影響其安全性SHA-1演算法的輸出長度為160比特,SM3演算法的輸出長度為256比特,因此SM3演算法的安全性要高於MD5演算法和SHA-1演算法。
3.SM4演算法:SM4分組密碼演算法是我國自主設計的分組對稱密碼演算法,用於實現數據的加密/解密運算,以保證數據和信息的機密性。要保證一個對稱密碼演算法的安全性的基本條件是其具備足夠的密鑰長度,SM4演算法與AES演算法具有相同的密鑰長度分組長度128比特,因此在安全性上高於3DES演算法。
3. 「面向新一代國產E級超級計算系統的十大應用挑戰」發布
12月8日,國家超級計算天津中心和國防 科技 大學,聯合數十家合作團隊,共同發布「面向新一代國產E級超級計算系統的十大應用挑戰」,支撐解決世界 科技 前沿、經濟主戰場、國家重大需求、人民生命 健康 領域的重大挑戰性問題。
據介紹,新一代百億億次(E級)高性能計算機的研發,是國家在新一代信息技術領域的重要部署,將有力驅動國家信息技術產業創新發展,其自主化程度遠高於其他超算平台,同時規模與性能更是大幅提升。此次十大應用挑戰的發布,其目的就是為了充分發揮新一代E級高性能計算機強大計算能力,研發適配國產超級計算系統的關鍵技術和應用軟體,構建新的國產E級超級計算應用生態。
挑戰一:磁約束聚變堆全裝置聚變模擬(人造小太陽)
可控聚變能源被認為是人類未來應對能源和環境挑戰最有效的手段之一,而在磁約束聚變裝置設計中,最重要的問題就是如何用更低的成本約束住更高密度、溫度的等離子體。
目前被廣泛認可的一個主要限制約束性能的機制是邊界和芯部產生的所謂微觀不穩定性。在先前的研究中由於多時間尺度的問題,這些不穩定性通常採用迴旋動理學或磁流體力學等簡化模型來描述,並且等離子體芯部和邊界需要分別建模。
在新一代國產E級計算機上,將可以直接採用電磁全動理學這一經典等離子體最基本的模型來直接模擬可分辨離子迴旋半徑的磁約束聚變堆全裝置等離子體,並且不用區分邊界與芯部。藉助幾何演算法,使系統長期演化模擬結果的可靠性可以得到保證,更准確而自洽地再現其內部所發生的不穩定性過程,尋求提升磁約束聚變裝置約束性能的機制。
此外,全裝置等離子體動理學模擬還能得到對裝置尺度的等離子體演化更加保真的模型,更好地指導未來磁約束聚變堆等離子體的設計,將為可控聚變研究和聚變能源開發提供強力支撐。
挑戰二:全尺寸航空航天飛行器超百億網格計算流體力學模擬
近年來的臨近空間飛行器復雜流動問題數值研究對認識高空高速下的流動機理起到了重要作用。臨近空間飛行器飛行包絡覆蓋連續流域、滑移流域和過渡流域,存在復雜的氣動力熱、稀薄非平衡效應、大動壓下的多體分離、化學反應、等離子體等跨流域非定常多場耦合現象。
上一代超級計算機在計算能力和架構設計上無法進行滿足精度和效率要求的臨近空間飛行器跨流域非定常多場耦合模擬,而新一代國產E級超級計算機在理論上有望突破計算瓶頸,從而實現超百億網格高精度全尺寸這一模擬。
臨近空間飛行器跨流域非定常多場耦合模擬研究一方面可以幫助我們全面認識飛行器在高空高速飛行狀態下的復雜耦合流動現象,並辨識流動機制及其對飛行器的影響,另一方面可以拓展新一代超級計算機上的數值風洞構建能力,為航天各類運載飛行器和航空國產大飛機等設計提供載體,使其更好地服務於我國戰略發展和建設。
挑戰三:數字細胞超億級原子體系動力學模擬
在解讀生命奧秘特別是細胞生物機理方面,全原子分子動力學模擬的虛擬實驗作用日益凸顯。
細胞內充斥了各種各樣的生物大分子和小分子,始終處於一種動態的擁擠環境中,而擁擠環境對生物分子的擴散、聚集、構象變化和化學反應都會有顯著影響。因此,在細胞尺度上對生物體系進行全原子分子動力學模擬將是認知生命過程的重要手段,但是目前的計算機很難提供足夠的算力來實現。
國產新一代的E級超級計算機理論上可以實現超億級甚至十億級原子數字細胞的分子動力學模擬,使得未來細胞水平上的精準模擬成為可能。對細胞進行全原子分子動力學模擬,將使我們可以在虛擬實驗中對整個細胞及其內外的生物大分子的微觀動態過程進行高時空分辨的觀察,幫助我們全面深刻地去認識新冠病毒等如何侵入細胞、細胞如何進行物質信息交換等生命科學重大挑戰性問題。
通過數字模擬獲得的知識,也將對未來的新葯研發、生命 健康 保障起到奠基性的作用。
挑戰四:對流尺度次公里級精細化數值天氣預報
對於尺度較小、發展劇烈的強對流天氣系統,往往難以預報,且容易造成破壞性災害,對於大城市的運行管理帶來很大的威脅。
隨著天氣系統時空尺度的縮小,大氣的混沌屬性越發明顯,預報的不確定性加劇,這為精細化天氣預報帶來了很大的挑戰,目前基於探測技術的預警時效性和對系統演變的預測往往不足。
基於新一代國產E級超級計算機的強大計算能力,綜合超高解析度模擬、集合預報、快速循環等技術,提前0-6小時預報強對流天氣的觸發、演變、消亡,為單個對流系統提供連續、概率性的預測,改進強對流引發的局地強降水、冰雹、突發大風、龍卷的時空落區預報准確性。
挑戰五:百億級高效高通量虛擬葯物篩選
先導結構的發現和優化作為新葯發現階段的研究核心,往往需要花費數年時間以及高達數億美元的資金,是葯物研發的關鍵技術瓶頸。因此如何生成新分子及優化分子的關鍵屬性(如生物活性、成葯性、安全性和選擇性等)是影響葯物分子設計成敗的兩個關鍵問題。
據估計,目前可利用的化學空間大小范圍約為10^23至10^60,即便是某些成熟資料庫的小分子數量也達到十億級別。如何在如此巨大的化學空間內如何進行分子的智能生成、結構的快速演化搜索和性質預測是葯物篩選所面臨的巨大挑戰。
目前,葯物篩選通常可以利用分子對接等相對粗略的方法,在之前的超級計算機上已經可以實現對十億級別的小分子進行快速的初篩,再利用更為精確的自由能擾動計算等方法進行更為准確的評價分析。
新一代E級超級計算機提供的強大算力能夠支撐百億級別葯物小分子的快速篩選,輔以更先進的演算法,可以實現虛擬葯物篩選效能幾十乃至上百倍的提升;同時高效的葯物篩選,還可以與中葯有效組分發現結合,推動中葯研發的現代化。
挑戰六:面向通用人工智慧的超大規模預訓練模型
深度神經網路是新一代人工智慧的領航區,並且已經成功應用於計算機視覺和自然語言處理等領域,取得了突出成效。
隨著應用場景的豐富和發展,傳統基於有標注數據集的領域模型訓練和應用範式越來越無法適用人工智慧應用的開發和普及。基於無標注數據的自監督學習技術和綜合能力好、通用能力強的大規模預訓練模型的出現,將數據驅動的深度學習技術和通用人工智慧推向新的發展階段。
近年來,計算機和人工智慧領域的專家和企業已經在利用現有高性能計算機上完成了 1.75 萬億參數的多模態預訓練模型開發,而國產新一代 E 級超級計算機使得支撐參數規模更大、通用性更強的模型(十萬億甚至百萬億以上)的訓練和應用成為可能。
大規模預訓練模型的研發部署,一方面,將推動類人機器人加快落地;另一方面,有通用模型做基礎,將大幅降低細分領域數據向智能化模型轉化的難度,有效推動人工智慧應用基礎設施的構建,提升工業現代化、數字經濟發展、智能 社會 數字化治理能力。
挑戰七:FAST超大規模觀測數據的高解析度巡天圖像處理
中性氫巡天是 「中國天眼」(FAST射電望遠鏡)的重要科學目標之一,通過探測可觀測宇宙范圍內中性氫的分布情況,為宇宙起源與演化、暗物質與暗能量等前沿科學領域的研究提供支撐。
受視場所限,望遠鏡每次觀測只能覆蓋有限天區,中性氫巡天觀測持續時間可達數年,所積累的觀測數據需拼接融合才能獲得完整的高解析度巡天圖像。在中性氫巡天數據處理流程中,網格化(Gridding)是計算量最大且I/O最為密集的環節,是制約中性氫巡天數據處理與成果產出效率的瓶頸。
新一代E級超級計算機的數據處理能力配合高性能網格化演算法,能夠應對PB量級的中性氫巡天觀測數據,從而為國之重器「中國天眼」能夠「早出成果、多出成果,出大成果、出好成果」提供強大助力,促生天文學基礎與前沿領域的重大發現。
挑戰八:全球尺度地震全波形反演
地震全波形反演是當前解析度最高的成像方法,是研究地球內部結構和動力學演化過程的強有力工具,還可為礦產資源和油氣勘查提供關鍵支撐。
在過去十年裡,地震科學領域專家已經在上一代超級計算機上實現了區域尺度的低頻帶彈性波全波形反演研究。
國產新一代的E級超級計算機將可以實現全球尺度的、包括地震波衰減特徵在內的高頻帶粘彈性地震波場傳播模擬和波形成像研究。全球尺度高頻帶粘彈性地震波形反演一方面可以獲得地球內部高精度成像結果,加深我們對板塊構造、俯沖帶和造山帶形成和演化的認識,另一方面可以提供地球內部各圈層(中下地殼、岩石圈、軟流圈等)物質和能量交換的地震學證據,為研究地球深部成礦作用和火山/地震活動提供依據,幫助人類更全面的認知地質演化,理解類地行星的形成發展。
挑戰九:全腦千億神經元動力學模擬
近年來的神經科學研究獲取了大量的大腦結構和活動的數據,以此來理解大腦的工作機制。對於大腦的高級功能,如運動控制和思考等功能的解析和再現,迫切需要建立起人類全腦規模的模擬神經網路平台。
人類的大腦有860億神經元,在過去的十年裡,計算神經科學領域的專家在上一代的超級計算機上已經進行了人腦百分之一大小規模的腦迴路模擬。而新一代的E級超級計算機在理論可以實現包括大腦皮層、小腦和基底神經節在內的全腦神經迴路的模擬。
人類全腦迴路的模擬和研究,一方面在可以幫助我們理解大腦的思考等高級功能,開發類腦人工智慧演算法。另一方面,帕金森症,亨廷頓舞蹈症等大腦疾病的發病機理也將能夠得到進一步的分析和驗證。此外,使用模擬腦模型構建基於脈沖神經網路的神經模態機器人,能夠提升現有機器人系統的感知與決策水平。
挑戰十:完全解析度的全球次中尺度海洋數值模擬
氣候變化是全球可持續發展所面臨的重大挑戰,也是科學界面臨的最具挑戰性的科學問題之一,海洋則是控制氣候系統季節內、季節、年際、年代際變率的重要分量。
近年來,隨著海洋觀測的飛速發展,海洋中尺度、次中尺度過程的許多機理被不斷揭示,海洋多尺度相互作用的特徵更加清晰,對海洋環流數值模擬也提出了更高的要求,解析度中尺度、次中尺度過程及其與大氣的相互作用成為重要的研究方向。
在過去的10年期間,全球的科學家在此方向作出了不懈努力,將全球的海洋模擬提高到部分解析度次中尺度渦(2km)的解析度,而我國的科學家也自主開發了全球3-5km的海洋模式,基本可以完全分辨開闊大洋的中尺度過程。新一代的E級超級計算機可以實現完全解析度次中尺度過程的模擬,幫助科學家全面理解海洋內部多尺度相互作用過程,以及海洋能量串級過程,並進一步提高對海洋環流以及整個氣候系統的模擬能力。
編輯/范輝
4. 網路和信息系統必須使用國產密碼是什麼意思
國產密碼簡稱國密是指國家密碼局認定的國產商用密碼演算法,在金融領域目前主要使用公開的SM2、SM3、SM4三類演算法,分別是非對稱演算法、哈希演算法、對稱演算法。密碼技術是金融信息安全的核心技術,在銀行卡領域應用國產密碼演算法,有利於提升銀行卡產業信息安全的自主可控能力。《中國銀聯銀行卡聯網聯合技術規范》是銀行卡跨行交易的基礎性規范,其支持國產密碼演算法,將為銀行實施跨行交易系統改造提供基礎性指導和支持。《中國銀聯IC卡技術規范》是在《中國金融集成電路(IC)卡規范》金融行業標准下為支持銀行發行金融IC卡的銀聯企業標准。中國銀聯兩項技術規范,在兼容最新國際通用技術標準的基礎上支持國產密碼,豐富了安全演算法體系,為提升銀行卡產業安全自主可控水平打下基礎,促進信息安全及金融服務相關產業的發展。
5. 鍥戒駭SSD涓繪帶鍘傚晢濡備綍閫氳繃4K LDPC綆楁硶鎻愬崌QLC闂瀛樺垮懡錛
QLC闂瀛樺彲闈犳ф彁鍗囩殑鍏抽敭錛氬浗浜SSD涓繪帶鍘傚晢鐨4K LDPC綆楁硶鍥藉唴涓繪帶宸ㄥご鑱旇姼縐戞妧榪戞棩瀹e竷錛屼粬浠鎴愬姛鐮斿彂鍑4K LDPC綆楁硶錛岃繖涓紿佺牬鎬ф垚鏋滃湪鍥藉唴SSD涓繪帶鑺鐗囬嗗煙鍏鋒湁閲岀▼紕戞剰涔夛紝鏄捐憲鎻愬崌浜哘LC闂瀛樼殑鍙闈犳у拰浣跨敤瀵垮懡銆
QLC闂瀛樻浘鍥犲彲闈犳ч棶棰樺囧彈璐ㄧ枒錛屽叾鎬ц兘騫墮潪浠呬粎鍙楅檺浜庨棯瀛樻湰韜錛涓繪帶鑺鐗囩殑綰犻敊綆楁硶錛岀壒鍒鏄疞DPC鎶鏈錛屽筍SD鐨勭ǔ瀹氭ц搗鐫鍐沖畾鎬т綔鐢銆傜浉杈冧簬浼犵粺鐨凚CH綆楁硶錛孡DPC鏇村厛榪涳紝浣嗕篃甯︽潵鍔熻楁縺澧炲拰鏁版嵁甯﹀藉崰鐢ㄧ殑闂棰橈紝褰卞搷鐢ㄦ埛浣撻獙銆
鑱旇姼縐戞妧鐨勫壋鏂板湪浜庯紝浠栦滑宸蹭粠2K LDPC榪囨浮鍒4K LDPC錛屽疄鐜頒簡絎涓変唬Agile ECC 3闂瀛樹俊鍙峰勭悊鎶鏈銆傜浉杈冧簬2K錛4K LDPC鐨勭籂閿欐ц兘鏄捐憲澧炲己錛鍦ㄥ悓絳夎鐮佺巼涓嬶紝4K LDPC鐨勭籂閿欏け璐ユ傜巼闄嶄綆涓や釜鏁伴噺綰э紝浣垮緱闂瀛樺垮懡鏄捐憲寤墮暱銆傞氳繃4K LDPC鐨勮蔣瑙g爜鑳藉姏錛屽嵆浣垮湪鏈鎮跺姡鏉′歡涓嬶紝涔熻兘淇濊瘉鏁版嵁鍙闈犳э紝寤墮暱SSD浣跨敤瀵垮懡銆
鑰屼笖錛4K LDPC綆楁硶涓嶄粎鍦ㄨ蔣瑙g爜涓婅〃鐜板嚭鑹詫紝紜瑙g爜鑳藉姏鐨勬彁鍗囦篃闄嶄綆浜嗚繘鍏ヨ蔣瑙g爜鐨勬傜巼錛屾樉钁楁敼鍠勪簡鐢ㄦ埛鐨勫疄闄呬嬌鐢ㄤ綋楠屻傚敖綆4K LDPC鐨勭數璺瀹炵幇闅懼害澧炲姞錛屼絾鑱旇姼縐戞妧鍑鍊熷厛榪涚殑鎶鏈錛屾垚鍔熶紭鍖栦簡鍔熻楀拰鎴愭湰錛岀『淇濅簡楂樻ц兘涓庝綆鍔熻楃殑瀹岀編緇撳悎銆
鎬葷粨鏉ヨ達紝鑱旇姼縐戞妧鐨4K LDPC綆楁硶鍦ㄦ彁鍗嘠LC闂瀛樺彲闈犳х殑鍚屾椂錛屽吋欏句簡鎬ц兘鍜屽姛鑰楋紝涓虹敤鎴鋒彁渚涗簡鍗撹秺鐨凷SD浣撻獙錛屽牚縐癚LC闂瀛樼殑鈥滅畫鍛界炲櫒鈥濄
6. 國產語音識別演算法取得了重大突破嗎
據報道,近日中國人工智慧產業發展聯盟組建成立,聯盟將快速推動人工智慧技術在生產製造、健康醫療、生活服務、城市治理等場景的應用,據了解目前國產語音識別演算法已經取得了重大突破。
數據顯示,2016年中國數據總量佔全球數據總量的14%。據預測,到2020年,中國的數據總量將佔全球數據總量的20%,屆時中國將成為世界第一數據資源大國和全球的數據中心,此外,許多傳統行業的數據積累在規范程度和流轉效率上還遠未達到可充分發揮人工智慧技術潛能的程度。
中國的大技術公司通過它們專有的平台收集數據,但中國在創建數據友好的生態系統方面落後於美國,缺少統一的標准和跨平台的共享。從世界有關國家看,開放政府數據有助於私營部門的創新,但中國公共部門開放的數據相對較少。
希望中國人工智慧技術可以早日實現彎道超車!