国产算法
1. 绉戞櫘:锲戒骇瀵嗙爜绠楁硶
1銆佸浗瀵嗙畻娉曟槸锲藉跺瘑镰佸眬鍒跺畾镙囧嗳镄勪竴绯诲垪绠楁硶銆傚叾涓鍖呮嫭浜嗗圭О锷犲瘑绠楁硶锛屾き鍦嗘洸绾块潪瀵圭О锷犲瘑绠楁硶锛屾潅鍑戠畻娉曘傚叿浣揿寘𨰾琒MSMSMSMS4绛夛纴鍏朵腑锛歋M1锛氩圭О锷犲瘑绠楁硶锛屽姞瀵嗗己搴︿负128浣嶏纴閲囩敤纭浠跺疄鐜般
2銆佸浗瀵嗗嵆锲藉跺瘑镰佸眬璁ゅ畾镄勫浗浜у瘑镰佺畻娉曘备富瑕佹湁SM1锛孲M2锛孲M3锛孲M4銆傚瘑阍ラ暱搴﹀拰鍒嗙粍闀垮害鍧囦负128浣嶃
3銆佸浗瀵嗙畻娉曪细锲藉跺瘑镰佸眬璁ゅ畾镄勫浗浜у瘑镰佺畻娉曪纴鍗冲晢鐢ㄥ瘑镰併
4銆佸浗瀵嗗嵆锲藉跺瘑镰佸眬璁ゅ畾镄勫浗浜у瘑镰佺畻娉曘备緥濡傦细鍦ㄩ棬绂佸簲鐢ㄤ腑锛岄噰鐢⊿M1绠楁硶杩涜岃韩浠介壌鍒鍜屾暟鎹锷犲瘑阃氲锛屽疄鐜板崱鐗囧悎娉曟х殑楠岃瘉锛屼缭璇佽韩浠借瘑鍒镄勭湡瀹炴с傚畨鍏ㄦ槸鍏崇郴锲藉躲佸煄甯备俊鎭銆佽屼笟鐢ㄦ埛銆佺栌濮揿埄鐩婄殑鍏抽敭闂棰樸
5銆佹渶鏂扮畻娉曞备笅锛岀洰鍓嶏纴鎴戝浗镊涓荤爷鍙戠殑甯哥敤镄勫浗浜у瘑镰佺畻娉曟湁浠ヤ笅鍑犵嶏细SM1绠楁硶銆
2. 什么是sm算法
国产密码算法(国密算法)是指国家密码局认定的国产商用密码算法,目前主要使用公开的SM2、SM3、SM4三类算法,分别是非对称算法、哈希算法和对称算法。
1.SM2算法:SM2椭圆曲线公钥密码算法是我国自主设计的公钥密码算法,包括SM2-1椭圆曲线数字签名算法,SM2-2椭圆曲线密钥交换协议,SM2-3椭圆曲线公钥加密算法,分别用于实现数字签名密钥协商和数据加密等功能。SM2算法与RSA算法不同的是,SM2算法是基于椭圆曲线上点群离散对数难题,相对于RSA算法,256位的SM2密码强度已经比2048位的RSA密码强度要高。椭圆曲线参数并没有给出推荐的曲线,曲线参数的产生需要利用一定的算法产生。但在实际使用中,国密局推荐使用素数域256 位椭圆曲线,其曲线方程为y^2= x^3+ax+b(其中p是大于3的一个大素数,n是基点G的阶,Gx、Gy 分别是基点G的x与y值,a、b是随圆曲线方程y^2= x^3+ax+b的系数)。
2.SM3算法:SM3杂凑算法是我国自主设计的密码杂凑算法,适用于商用密码应用中的数字签名和验证消息认证码的生成与验证以及随机数的生成,可满足多种密码应用的安全需求。为了保证杂凑算法的安全性,其产生的杂凑值的长度不应太短,例如MD5输出128比特杂凑值,输出长度太短,影响其安全性SHA-1算法的输出长度为160比特,SM3算法的输出长度为256比特,因此SM3算法的安全性要高于MD5算法和SHA-1算法。
3.SM4算法:SM4分组密码算法是我国自主设计的分组对称密码算法,用于实现数据的加密/解密运算,以保证数据和信息的机密性。要保证一个对称密码算法的安全性的基本条件是其具备足够的密钥长度,SM4算法与AES算法具有相同的密钥长度分组长度128比特,因此在安全性上高于3DES算法。
3. “面向新一代国产E级超级计算系统的十大应用挑战”发布
12月8日,国家超级计算天津中心和国防 科技 大学,联合数十家合作团队,共同发布“面向新一代国产E级超级计算系统的十大应用挑战”,支撑解决世界 科技 前沿、经济主战场、国家重大需求、人民生命 健康 领域的重大挑战性问题。
据介绍,新一代百亿亿次(E级)高性能计算机的研发,是国家在新一代信息技术领域的重要部署,将有力驱动国家信息技术产业创新发展,其自主化程度远高于其他超算平台,同时规模与性能更是大幅提升。此次十大应用挑战的发布,其目的就是为了充分发挥新一代E级高性能计算机强大计算能力,研发适配国产超级计算系统的关键技术和应用软件,构建新的国产E级超级计算应用生态。
挑战一:磁约束聚变堆全装置聚变模拟(人造小太阳)
可控聚变能源被认为是人类未来应对能源和环境挑战最有效的手段之一,而在磁约束聚变装置设计中,最重要的问题就是如何用更低的成本约束住更高密度、温度的等离子体。
目前被广泛认可的一个主要限制约束性能的机制是边界和芯部产生的所谓微观不稳定性。在先前的研究中由于多时间尺度的问题,这些不稳定性通常采用回旋动理学或磁流体力学等简化模型来描述,并且等离子体芯部和边界需要分别建模。
在新一代国产E级计算机上,将可以直接采用电磁全动理学这一经典等离子体最基本的模型来直接模拟可分辨离子回旋半径的磁约束聚变堆全装置等离子体,并且不用区分边界与芯部。借助几何算法,使系统长期演化模拟结果的可靠性可以得到保证,更准确而自洽地再现其内部所发生的不稳定性过程,寻求提升磁约束聚变装置约束性能的机制。
此外,全装置等离子体动理学模拟还能得到对装置尺度的等离子体演化更加保真的模型,更好地指导未来磁约束聚变堆等离子体的设计,将为可控聚变研究和聚变能源开发提供强力支撑。
挑战二:全尺寸航空航天飞行器超百亿网格计算流体力学模拟
近年来的临近空间飞行器复杂流动问题数值研究对认识高空高速下的流动机理起到了重要作用。临近空间飞行器飞行包络覆盖连续流域、滑移流域和过渡流域,存在复杂的气动力热、稀薄非平衡效应、大动压下的多体分离、化学反应、等离子体等跨流域非定常多场耦合现象。
上一代超级计算机在计算能力和架构设计上无法进行满足精度和效率要求的临近空间飞行器跨流域非定常多场耦合模拟,而新一代国产E级超级计算机在理论上有望突破计算瓶颈,从而实现超百亿网格高精度全尺寸这一模拟。
临近空间飞行器跨流域非定常多场耦合模拟研究一方面可以帮助我们全面认识飞行器在高空高速飞行状态下的复杂耦合流动现象,并辨识流动机制及其对飞行器的影响,另一方面可以拓展新一代超级计算机上的数值风洞构建能力,为航天各类运载飞行器和航空国产大飞机等设计提供载体,使其更好地服务于我国战略发展和建设。
挑战三:数字细胞超亿级原子体系动力学模拟
在解读生命奥秘特别是细胞生物机理方面,全原子分子动力学模拟的虚拟实验作用日益凸显。
细胞内充斥了各种各样的生物大分子和小分子,始终处于一种动态的拥挤环境中,而拥挤环境对生物分子的扩散、聚集、构象变化和化学反应都会有显着影响。因此,在细胞尺度上对生物体系进行全原子分子动力学模拟将是认知生命过程的重要手段,但是目前的计算机很难提供足够的算力来实现。
国产新一代的E级超级计算机理论上可以实现超亿级甚至十亿级原子数字细胞的分子动力学模拟,使得未来细胞水平上的精准模拟成为可能。对细胞进行全原子分子动力学模拟,将使我们可以在虚拟实验中对整个细胞及其内外的生物大分子的微观动态过程进行高时空分辨的观察,帮助我们全面深刻地去认识新冠病毒等如何侵入细胞、细胞如何进行物质信息交换等生命科学重大挑战性问题。
通过数字模拟获得的知识,也将对未来的新药研发、生命 健康 保障起到奠基性的作用。
挑战四:对流尺度次公里级精细化数值天气预报
对于尺度较小、发展剧烈的强对流天气系统,往往难以预报,且容易造成破坏性灾害,对于大城市的运行管理带来很大的威胁。
随着天气系统时空尺度的缩小,大气的混沌属性越发明显,预报的不确定性加剧,这为精细化天气预报带来了很大的挑战,目前基于探测技术的预警时效性和对系统演变的预测往往不足。
基于新一代国产E级超级计算机的强大计算能力,综合超高分辨率模拟、集合预报、快速循环等技术,提前0-6小时预报强对流天气的触发、演变、消亡,为单个对流系统提供连续、概率性的预测,改进强对流引发的局地强降水、冰雹、突发大风、龙卷的时空落区预报准确性。
挑战五:百亿级高效高通量虚拟药物筛选
先导结构的发现和优化作为新药发现阶段的研究核心,往往需要花费数年时间以及高达数亿美元的资金,是药物研发的关键技术瓶颈。因此如何生成新分子及优化分子的关键属性(如生物活性、成药性、安全性和选择性等)是影响药物分子设计成败的两个关键问题。
据估计,目前可利用的化学空间大小范围约为10^23至10^60,即便是某些成熟数据库的小分子数量也达到十亿级别。如何在如此巨大的化学空间内如何进行分子的智能生成、结构的快速演化搜索和性质预测是药物筛选所面临的巨大挑战。
目前,药物筛选通常可以利用分子对接等相对粗略的方法,在之前的超级计算机上已经可以实现对十亿级别的小分子进行快速的初筛,再利用更为精确的自由能扰动计算等方法进行更为准确的评价分析。
新一代E级超级计算机提供的强大算力能够支撑百亿级别药物小分子的快速筛选,辅以更先进的算法,可以实现虚拟药物筛选效能几十乃至上百倍的提升;同时高效的药物筛选,还可以与中药有效组分发现结合,推动中药研发的现代化。
挑战六:面向通用人工智能的超大规模预训练模型
深度神经网络是新一代人工智能的领航区,并且已经成功应用于计算机视觉和自然语言处理等领域,取得了突出成效。
随着应用场景的丰富和发展,传统基于有标注数据集的领域模型训练和应用范式越来越无法适用人工智能应用的开发和普及。基于无标注数据的自监督学习技术和综合能力好、通用能力强的大规模预训练模型的出现,将数据驱动的深度学习技术和通用人工智能推向新的发展阶段。
近年来,计算机和人工智能领域的专家和企业已经在利用现有高性能计算机上完成了 1.75 万亿参数的多模态预训练模型开发,而国产新一代 E 级超级计算机使得支撑参数规模更大、通用性更强的模型(十万亿甚至百万亿以上)的训练和应用成为可能。
大规模预训练模型的研发部署,一方面,将推动类人机器人加快落地;另一方面,有通用模型做基础,将大幅降低细分领域数据向智能化模型转化的难度,有效推动人工智能应用基础设施的构建,提升工业现代化、数字经济发展、智能 社会 数字化治理能力。
挑战七:FAST超大规模观测数据的高分辨率巡天图像处理
中性氢巡天是 “中国天眼”(FAST射电望远镜)的重要科学目标之一,通过探测可观测宇宙范围内中性氢的分布情况,为宇宙起源与演化、暗物质与暗能量等前沿科学领域的研究提供支撑。
受视场所限,望远镜每次观测只能覆盖有限天区,中性氢巡天观测持续时间可达数年,所积累的观测数据需拼接融合才能获得完整的高分辨率巡天图像。在中性氢巡天数据处理流程中,网格化(Gridding)是计算量最大且I/O最为密集的环节,是制约中性氢巡天数据处理与成果产出效率的瓶颈。
新一代E级超级计算机的数据处理能力配合高性能网格化算法,能够应对PB量级的中性氢巡天观测数据,从而为国之重器“中国天眼”能够“早出成果、多出成果,出大成果、出好成果”提供强大助力,促生天文学基础与前沿领域的重大发现。
挑战八:全球尺度地震全波形反演
地震全波形反演是当前分辨率最高的成像方法,是研究地球内部结构和动力学演化过程的强有力工具,还可为矿产资源和油气勘查提供关键支撑。
在过去十年里,地震科学领域专家已经在上一代超级计算机上实现了区域尺度的低频带弹性波全波形反演研究。
国产新一代的E级超级计算机将可以实现全球尺度的、包括地震波衰减特征在内的高频带粘弹性地震波场传播模拟和波形成像研究。全球尺度高频带粘弹性地震波形反演一方面可以获得地球内部高精度成像结果,加深我们对板块构造、俯冲带和造山带形成和演化的认识,另一方面可以提供地球内部各圈层(中下地壳、岩石圈、软流圈等)物质和能量交换的地震学证据,为研究地球深部成矿作用和火山/地震活动提供依据,帮助人类更全面的认知地质演化,理解类地行星的形成发展。
挑战九:全脑千亿神经元动力学仿真
近年来的神经科学研究获取了大量的大脑结构和活动的数据,以此来理解大脑的工作机制。对于大脑的高级功能,如运动控制和思考等功能的解析和再现,迫切需要建立起人类全脑规模的仿真神经网络平台。
人类的大脑有860亿神经元,在过去的十年里,计算神经科学领域的专家在上一代的超级计算机上已经进行了人脑百分之一大小规模的脑回路仿真。而新一代的E级超级计算机在理论可以实现包括大脑皮层、小脑和基底神经节在内的全脑神经回路的模拟。
人类全脑回路的仿真和研究,一方面在可以帮助我们理解大脑的思考等高级功能,开发类脑人工智能算法。另一方面,帕金森症,亨廷顿舞蹈症等大脑疾病的发病机理也将能够得到进一步的分析和验证。此外,使用仿真脑模型构建基于脉冲神经网络的神经模态机器人,能够提升现有机器人系统的感知与决策水平。
挑战十:完全分辨率的全球次中尺度海洋数值模拟
气候变化是全球可持续发展所面临的重大挑战,也是科学界面临的最具挑战性的科学问题之一,海洋则是控制气候系统季节内、季节、年际、年代际变率的重要分量。
近年来,随着海洋观测的飞速发展,海洋中尺度、次中尺度过程的许多机理被不断揭示,海洋多尺度相互作用的特征更加清晰,对海洋环流数值模拟也提出了更高的要求,分辨率中尺度、次中尺度过程及其与大气的相互作用成为重要的研究方向。
在过去的10年期间,全球的科学家在此方向作出了不懈努力,将全球的海洋模拟提高到部分分辨率次中尺度涡(2km)的分辨率,而我国的科学家也自主开发了全球3-5km的海洋模式,基本可以完全分辨开阔大洋的中尺度过程。新一代的E级超级计算机可以实现完全分辨率次中尺度过程的模拟,帮助科学家全面理解海洋内部多尺度相互作用过程,以及海洋能量串级过程,并进一步提高对海洋环流以及整个气候系统的模拟能力。
编辑/范辉
4. 网络和信息系统必须使用国产密码是什么意思
国产密码简称国密是指国家密码局认定的国产商用密码算法,在金融领域目前主要使用公开的SM2、SM3、SM4三类算法,分别是非对称算法、哈希算法、对称算法。密码技术是金融信息安全的核心技术,在银行卡领域应用国产密码算法,有利于提升银行卡产业信息安全的自主可控能力。《中国银联银行卡联网联合技术规范》是银行卡跨行交易的基础性规范,其支持国产密码算法,将为银行实施跨行交易系统改造提供基础性指导和支持。《中国银联IC卡技术规范》是在《中国金融集成电路(IC)卡规范》金融行业标准下为支持银行发行金融IC卡的银联企业标准。中国银联两项技术规范,在兼容最新国际通用技术标准的基础上支持国产密码,丰富了安全算法体系,为提升银行卡产业安全自主可控水平打下基础,促进信息安全及金融服务相关产业的发展。
5. 锲戒骇SSD涓绘带铡傚晢濡备綍阃氲繃4K LDPC绠楁硶鎻愬崌QLC闂瀛桦垮懡锛
QLC闂瀛桦彲闱犳ф彁鍗囩殑鍏抽敭锛氩浗浜SSD涓绘带铡傚晢镄4K LDPC绠楁硶锲藉唴涓绘带宸ㄥご镵旇姼绉戞妧杩戞棩瀹e竷锛屼粬浠鎴愬姛镰斿彂鍑4K LDPC绠楁硶锛岃繖涓绐佺牬镐ф垚鏋滃湪锲藉唴SSD涓绘带鑺鐗囬嗗烟鍏锋湁閲岀▼纰戞剰涔夛纴鏄捐宪鎻愬崌浜哘LC闂瀛樼殑鍙闱犳у拰浣跨敤瀵垮懡銆
QLC闂瀛樻浘锲犲彲闱犳ч梾棰桦囧弹璐ㄧ枒锛屽叾镐ц兘骞堕潪浠呬粎鍙楅檺浜庨棯瀛樻湰韬锛涓绘带鑺鐗囩殑绾犻敊绠楁硶锛岀壒鍒鏄疞DPC鎶链锛屽笋SD镄勭ǔ瀹氭ц捣镌鍐冲畾镐т綔鐢銆傜浉杈冧簬浼犵粺镄凚CH绠楁硶锛孡DPC镟村厛杩涳纴浣嗕篃甯︽潵锷熻楁縺澧炲拰鏁版嵁甯﹀藉崰鐢ㄧ殑闂棰桡纴褰卞搷鐢ㄦ埛浣挞獙銆
镵旇姼绉戞妧镄勫垱鏂板湪浜庯纴浠栦滑宸蹭粠2K LDPC杩囨浮鍒4K LDPC锛屽疄鐜颁简绗涓変唬Agile ECC 3闂瀛树俊鍙峰勭悊鎶链銆傜浉杈冧簬2K锛4K LDPC镄勭籂阌欐ц兘鏄捐宪澧炲己锛鍦ㄥ悓绛夎镰佺巼涓嬶纴4K LDPC镄勭籂阌椤け璐ユ傜巼闄崭绠涓や釜鏁伴噺绾э纴浣垮缑闂瀛桦垮懡鏄捐宪寤堕暱銆傞氲繃4K LDPC镄勮蒋瑙g爜鑳藉姏锛屽嵆浣垮湪链鎭跺姡𨱒′欢涓嬶纴涔熻兘淇濊瘉鏁版嵁鍙闱犳э纴寤堕暱SSD浣跨敤瀵垮懡銆
钥屼笖锛4K LDPC绠楁硶涓崭粎鍦ㄨ蒋瑙g爜涓婅〃鐜板嚭镩诧纴纭瑙g爜鑳藉姏镄勬彁鍗囦篃闄崭绠浜呜繘鍏ヨ蒋瑙g爜镄勬傜巼锛屾樉镢楁敼锽勪简鐢ㄦ埛镄勫疄闄呬娇鐢ㄤ綋楠屻傚敖绠4K LDPC镄勭数璺瀹炵幇闅惧害澧炲姞锛屼絾镵旇姼绉戞妧鍑鍊熷厛杩涚殑鎶链锛屾垚锷熶紭鍖栦简锷熻楀拰鎴愭湰锛岀‘淇濅简楂樻ц兘涓庝绠锷熻楃殑瀹岀编缁揿悎銆
镐荤粨𨱒ヨ达纴镵旇姼绉戞妧镄4K LDPC绠楁硶鍦ㄦ彁鍗嘠LC闂瀛桦彲闱犳х殑钖屾椂锛屽吋椤句简镐ц兘鍜屽姛钥楋纴涓虹敤鎴锋彁渚涗简鍗撹秺镄凷SD浣挞獙锛屽牚绉癚LC闂瀛樼殑钬灭画锻界炲櫒钬濄
6. 国产语音识别算法取得了重大突破吗
据报道,近日中国人工智能产业发展联盟组建成立,联盟将快速推动人工智能技术在生产制造、健康医疗、生活服务、城市治理等场景的应用,据了解目前国产语音识别算法已经取得了重大突破。
数据显示,2016年中国数据总量占全球数据总量的14%。据预测,到2020年,中国的数据总量将占全球数据总量的20%,届时中国将成为世界第一数据资源大国和全球的数据中心,此外,许多传统行业的数据积累在规范程度和流转效率上还远未达到可充分发挥人工智能技术潜能的程度。
中国的大技术公司通过它们专有的平台收集数据,但中国在创建数据友好的生态系统方面落后于美国,缺少统一的标准和跨平台的共享。从世界有关国家看,开放政府数据有助于私营部门的创新,但中国公共部门开放的数据相对较少。
希望中国人工智能技术可以早日实现弯道超车!