当前位置:首页 » 操作系统 » msa算法

msa算法

发布时间: 2023-05-30 01:19:09

㈠ 影响数据质量的是什么

数据质量管理的分析影响数据质量的因素
影响数据质量的因素主要来源于四方面:信息因素行燃、技术因素、流程因素和管理因素。信息因素:产生这部分数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质(如:数据源规格不统一)得不到保证和变化频度不恰当等。技术因素:主要是指由于具体数据处理的各技术环节的异常造成的数据质量问题。数据质量问题的产生环节主要包括数据创建、数据获取、数据传输、数据装载、数据使用、数据维护等方面的内容。流程因素:是指由于系统作业流程和人工操作流程设置不当造成的滚悔数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程和稽核流程等各环节。管理因素:是指由于人员素质及管理机制方面的原因造成的数据质量问题。如人员培训、人员管理、培训或者奖惩措施不当导致的管理缺失或者管理缺陷。
影响会计数据质量的主要因数是什么
影响会计数据质量的主要因数有三方面即管理人员、财会制度和财务人员。管理人员指管理人员指令的清晰性或模糊情度,制度包括制度的完善、执行情况,财务人员主要是会计人员的对工作的认知情度,道德操守,责任心等。
什么是数据的质量
?? 测量系统分析(MSA) 什么是测量系统 * 测量系统:用来对被测特性赋值的操作、程序、量具、设备、 软件及操作人员的 *** 人 设备 材料 测量过程 数据 方法 环境 输入 输出 * 测量系统应具备的特性 1 ) 处于统计控制状态,即只存在变差档备虚的普通原因; 2 ) 测量系统的变异性小于过程变异性; 3 ) 测量系统的变异性小于技术规范界限; 4 ) 测量精度应高于过程变异性和技术规范宽度的 1/10 ; 5 ) 当被测项目变化时,测量系统统计特性的最大变差小于过 程变差和规范宽度较小者; * 数据的类型 ——计量型数据 ——计数型数据 * 如何评定数据质量 ——测量结果与“真”值的差越小越好 ——数据质量是用多次测量的统计结果进 行评定 * 计量型数据的质量 ——均值与真值(基准值)之差 ——方差大小 * 计数型数据的质量 ——对产品特性产生错误分级的概率 测量系统评定的两个阶段 * 第一阶段(使用前) ——确定统计特性是否满足需要 ——确定环境因素是否有影响 * 第二阶段(使用过程) ——确定是否持续的具备恰当的统计特性 测量系统特性及变差类型和定义 类型 定义 图示 分辨力 测量系统检出并 如实指出被测定 特性微小变化的 能力 评价均值质量 偏倚 观测平均值与基 准值的差 基准值 偏倚 稳定性 在某种持续时间 内测量同一基准 或零件单一特性 结果的总变差 稳定性 时间 2 时间 1 线性 量具的预期工作 范围内偏倚的变 化 观察平均值 有偏倚 无偏倚 基准值 评价变差 质量 重复性 同一评价人,多次 测量同一特性的 观测值变差 再现性 不同评价人,测量 同一特性观测平 均值的变差 B C A 再现性 测量系统的分辨力 * 建议的可视分辨率 ≤ 6 σ /10 σ——过程的标准差(不是公差宽度的 1/10 ) * 分辨率不足对控制图的影响 测量系统的稳定性 * 两种稳定性 ——一般概念:随着时间变化系统偏倚的总变 差。 ——统计稳定性概念:测量系统只存在普通原 因变差而没有特殊原因变差。 * 利用控制图评价测量系统稳定性。 ——保持基准件或标准样件。 ——极差图(标准差图)出现失控时,说明存 在不稳定的重复性。 ——均值图出现失控时,说明偏倚不稳定。 评价测量系统的三个基本问题 * 是否有足够的分辨力 * 是否统计稳定 * 统计特性用于过程控制和分析是否可接受。 盲测法 * 在实际测量环境下,在操作者事先不知正在对 该测量系统进行评定的条件下,获得测量结果。 向传统观念挑战 * 长期存在的把测量误差只作为公差范围百分 率来报告的传统,是不能面临未来持续改进的 市场挑战。 国际标准 国家标准 地方标准 公司标准 检测设 备制造厂 测量结果 * 追溯性:通过应用连接标准等级体系的适当标 标准的传递 国际实验室 国家实验室 国家认可的 校准机构 企业的校准 实验室 生产现场 准程序,使单个测量结果与国家标准或国家接 受的测量系统相联系。
在数据采集的过程中,影响数据质量的因素有哪些
在产品的逆向设计中,产品三维数据的获取方法基本上可分为两大类,即接触式与非接触式,由于这两种方式各有优缺点,而且它们的结合可以实现伏势互补,克服测量中的种种困难,因而世界各国的逆向设备生产商纷纷研制具有接触式与非接触式两种扫描功能的逆向设备。

三座标测量机是一种接触式测量设备,它具有精度高、重复性好等优点,其缺点是速度慢、效率低。非接触式方法利用某种与物体表面发生相互作用的物理现象来获取其三维信息,如光、电磁等。非接触式方法具有测量过程非接触、测量迅速等优点,其缺点是对所测量物体材料要求严格,如采用激光测量时,所测量物体材料要求不能透光,表面不能太光亮,而且对直壁和徒坡数据的采集往住存在一定误差。

逆向工程中数据采集与处理

逆向工程中的测量数据量大,扫描的数据点可达数十万,而且扫描的数据点具有离散性。为了有效地利用这些测量数据进行CAD建模,必须对数据云进行必要的处理。

1.数据采集

数据采集的过程为:机床初始化—根据要扫描的物体设置扫描基准(包括Z平面、座标轴、基准点等)—设置并进行2D轮廓扫描(此步可根据实际情况进行选择)—根据2D轮廓或座标区域进行3D曲面扫描设置(包括扫描方向及步距、3D空间极值、允许的最小误差及弦向误差、探头半径、扫描速度等)—进行数据采集。

2.数据处理

数据处理的目的是为了获得正确的数据信息,生成相应格式的数据文件(如igs, dxf, vda, UG格式、Cimatron格式、Pro-E格式等)并与UGII, Surface, Pro-E, Catia等着名工程软件进行数据交换,以便用它们进行3D模型重构。在Renishaw公司的Tracecut23软件中提供了多种数据处理方法,这些方法包括数据调整、复制、数据光顺、噪声去除、数据镜像、阴阳转换、生成真实表面、CAD数据输出等。数据处理中要避免造成形状变形、精度降低、数据点不足等问题,一般要进行以下几方面的工作:

(1)补偿点的产生对于接触式扫描,由于从扫描仪获得的测量数据并不真正代表接触点的座标,而反映的是探头的中心或顶部的值,因此,要对这些数据进行补偿,转换为被测物体表面的座标值。对于产生补偿点,首先需要计算出标准点,而由于没有表面的数学表达公式,不能使用通常的方法计算出标准点。目前已开发出特殊的算法,能够在所规定的公差范围之内,获得近似的标准值。

(2)噪声点删除逆向工程测量过程中,受扫描测量方式、测量物体材料的种类、设备的精度等因素的影响,极易造成测量数据误差点的产生,对这类误差点,习惯上称为噪声点。在数据处理的第一步先要利用系统所提供的噪声点去除功能,选择合适的去噪精度去除多余的误差点,保证测量数据的准确性。

(3)数据点精化在CAD系统中,需要对逆向工程中获得的扫描数据点进行曲线构造、曲线光顺处理、曲面重构、曲面光滑处理、曲面拼接、三维建模等工作。在进行这些操作之前,要根据所测量物体的各部分的形伏特点设置适当的截面终距离和相邻两数据点的距离,利用系统中的CAD数据输出功能输出适当格式的数据文件,再利用CAD软件对数据点进行删除和拼接,这样可保证所测物体曲率较大处有较少的数据点,曲率较小处和复杂处具有较多的数据点。

数据采集方法及技巧

在实物测量中,会遇到各种复杂的形状,为保证所测量数据的准确性和所测量形状的完整性,采用的测量方法和测量工装是数据采集的关键。

1.翻模测量法

汽缸是汽油机的核心部件,它的......>>
影响数据库质量的是
1 人为因素

由于编目人员的粗心,在录入的过程中所造成的数据的缺损、错误等,是影响机读书目数据库建设质量的直接因素,常见的有:

(1)文字录入错误:在着录过程中,文字录入错误是导致漏检、误检的重要原因。文字录入错误最常见的是检索点录入错误,如主题词、分类号、题名、责任者项等录入错误。

(2)数字、字母、标识符号录入不规范:在各检索项中,对出现的标点、符号、数字及外文字母等应依原题照录,但在录入时应使用全角还是半角比较含糊,常常不统一。由于输入时可能出现差异,检索时就会因题名中的大小写、空格等不规范而造成漏检、误检。(3)着录内容不准确:表现在着录方式的不一致及着录字段的残缺,有的编目人员为了追求编目的速度而忽略了书目数据的质量,省略了一些必备字段的着录,或者着录得非常粗浅,从而使书目数据库建设质量得不到保证,影响用户检索。

3.2 文献着录因素

在文献着录中,文献分析是一项专业性和技术性较强的脑力劳动,其质量的好坏直接影响着书目数据库的规范化、标准化。编目人员在对文献进行编目时,分析着录字段理解差异较大,在对版本与版次,或者对多卷书、丛书着录的不一致,表现在:

(1)对200字段中@a正题名子字段的选取时,对影响句子结构的标点符号不能盲目照录,应加以分析判断,如:世界伟人—— *** ,在这种情况下,破折号后面的内容是破折号前面内容的同位语,应视为题名的整体,应照录,不能着录在@e子字段中;再如:嬗变——中国富豪的第一桶金,在这种情况下,破折号后面的内容是前面内容的解释及需要进一步的表述,破折号后面的内容应着录到副题名中。题名中含有这类意义的其他符号还很多,在着录中应值得注意,要针对这类符号在句子中所起的作用而分别处理。

(2)205字段的着录。此字段一般错误不多,但在着录中文译着图书时,个别编目员容易把原着的版本说明着录在205字段,这是错误的。译自原书的第几版,不应着录在205字段,应着录在305字段。

(3)225字段指示符“l”的规定:“0”与检索点形式不同,“l”等于无检索点形式,“2”等于与检索点形式相同。指示符“2”规定空格。倘若4字段着录丛编检索点与225字段丛编描述形式相同时,225字段指示符“1”应为“2”。

(4)其他:如综合着录多卷书时,应增加517字段做检索字段。像“教材”“教程”类多卷书出版量又比较大时,没有集中的必要,可着录在附注项中。
众数也是描述数据什么的量,不受什么的影响
三者都是反映数据集中趋势的统计量。平均数属于数值平均数,受极端数值影响,中位数和众数属于位置平均数,不受极端数值影响。
什么是传输介质,影响其网络数据通信质量的因素有哪些
传输介质就是在通信过程中传输信息的载体,如光纤、同轴电缆、自由空间等

通信三要素:发射信号(信号源)、传输(介质)、接收(接收机),从这些方面可以找到很多原因,比如说上网业务中传输介质,用光纤传输明显质量比一般电缆传输就快;同条件下有线比无线快等这些都是由于介质损耗、容量引起的
什么是地理信息系统的数据质量?具体包括哪些内容? 15分
-关于数据质量

质量:是一个用来表征人造物品的优越性或者证明其所具有技术含量的多少或

者表示其艺术性高低的常用术语。

近年来由于一下原因,关注数据质量:

1, 增加私营部门的数据生产 。

2,进一步利用地理信息作为决策支持工具。

3,日益依赖二手数据来源。

—空间数据质量的概念:

1,误差:反映了数据与真值或者大家公认的真值之间的关系。

2,数据的准确度:被定义为结果计算值或估计值或公认值之间的接近程度。

3,数据的精密度(仪器本身):是指在数量上能够辨别的程度,指数据的有效位

数,表示测量值本身的离散程度。分辨率影响到一个数据库础某个具体应用的适用

程度。

4,不确定性:是关于空间过程和特征,不能被准确确定的程度。

㈡ 基因家族扩张与收缩分析及物种进化树构建(上)

首先,选取不同物种的Protein数据集:Arabidopsis_thaliana.fa;Citrus_grandis.fa;Dimocarpus_longan.fa;Durio_zibethinus.fa;Prunus_persica.fa; Vitis_vinifera.fa;Citrus_clementina.fa;Citrus_sinensis.fa;Diospyros_oleifera.fa;Malus_domestica.fa;Oryza_sativa.fa;Pyrus_communis.fa
然后进行数据处理,去冗余,只保留最长转录本,去除可变剪切:
python3 removeRendantProteins.py -i input.fa -o output.fa
removeRendantProteins.py

将处理好的数据置于一个文件夹中“Dataset”

OrthoFinder这个软件,之前有一篇文章已经介绍过了,这里就不在赘述,这个软件安装十分友好,枣悄春直接conda安装即可;
nohup orthofinder -f Dataset -M msa -S diamond -T iqtree -t 24 -a 24 2> orthofinder.log &
orthofinder参数详情:
-t 并行序列搜索线程数(默认= 16)
-a 并行分析线程数(默认值运友= 1)
-M 基因树推断方法。可选:dendroblast和msa(默认= dendroblast)
-S 序列搜索程序(默认= blast)选项:blast,mmseqs,,blast_gz,diamond(推荐使用diamond,比对速度很给力)
-A 多序列联配方式,需要添加参数-M msa时才有效;(默认= mafft)可选择:muscle,mafft
-T 建树方法,需要添加参数-M msa时才有效,(默认 = fasttree)可选:iqtree,raxml-ng,fasttree,raxml
-s <文件> 可指定特定的根物种树
-I 设定MCL的通胀参数(默认 = 1.5)
-x Info用于以othoXML格式输出结果
-p <dir>将临时pickle文件写入到<dir>
-l 只执行单向序列搜索
-n 名称以附加到结果目凳耐录
-h 打印帮助文本
如果只需要查找直系同源基因,只需接“-f” 参数即可;此步也可建树,采用默认的建树方法fasttree,为无根树。
nohup orthofinder -f Dataset &
如果添加-M msa -T iqtree设定制定参数,可按照设定的参数使用最大似然法构建有根的物种进化树,构建的树为STAG树。
nohup orthofinder -f Dataset -M msa -S diamond -T iqtree -t 24 -a 24 2> orthofinder.log &

关于构建系统进化树,有很多种做法,常见的有利用物种全部的蛋白序列,构建STAG物种树;也有使用单拷贝直系同源基因构建的物种进化树,关于这一点,OrthoFinder查找同源基因,可以输出直系单拷贝同源基因的序列结果,后续也可使用其他构树软件及算法进行进化树构建。关于建树方法,则有距离矩阵法、最大简约法、最大似然法以及贝叶斯;当然目前主流采用的基本为最大似然法和贝叶斯,其中贝叶斯算法计算量巨大,耗时最久,其构建的树也认为最为“逼真”,但文章中使用较多的还是最大似然法,其耗时也需蛮久。

OrthoFinder输出的结果会在OrthoFinder文件夹下面的以日期命名的文件夹中,如:~/OrthoFinder/Results_May08

其中,我们可以用Orthogroups.GeneCount.tsv来作为CAFE的输入文件,分析基因家族的扩张与收缩;使用SpeciesTree_rooted.txt作为推断的物种树,并使用r8s,从中提取超度量树(ultrametric tree)即时间树;

python cafetutorial_prep_r8s.py -i SpeciesTree_rooted.txt -o r8s_ctl_file.txt -s 6650255 -p 'Oryza_sativa,Arabidopsis_thaliana' -c '152'
参数:
-i path_tree_file: path to .txt file containing tree in NEWICK format
-s n_sites: number of sites in alignment that was used to infer species tree
-p list_of_spp_tuples: list of tuples (each tuple being two species IDs whose mrca's age we are constraining; e.g., [('ENSG00','ENSPTR'),('ENSFCA','ENSECA')]
-c list_of_spp_cal_points: list of flats, one for each tuple in list_of_spp_tuples (e.g., [6.4,80])
-s 即用于推断物种树的比对序列碱基数目;
-p 已知物种树中的一对物种;
-c 已知一对物种的分化年限:
可在 timetree 网站查询:为152 mya

conda install cafe

cafetutorial_clade_and_size_filter.py

vim cafetutorial_run.sh

tree即为r8s提取的超度量树;

python cafetutorial_report_analysis.py -i reports/report_run.cafe -o reports/summary_run
summary_run_node.txt:统计每个节点中扩张,收缩的基因家族数目;
summary_run_fams.txt:具体发生变化的基因家族

python3 /home/Tools/CAFE_fig/CAFE_fig.py resultfile.cafe -pb 0.05 -pf 0.05 --mp test/ -g svg --count_all_expansions
输出svg格式的文件,可导入AI编辑美化;

CAFE_fig运行报错:(mole 'ete3' has no attribute 'TreeStyle')
报错解决:
vim /home/Tools/CAFE_fig/CAFE_fig.py

程序还在运行,后续贴出结果图。

OrthoFinder
timetree
http://www.chenlianfu.com/?tag=genomecomparison
https://www.jianshu.com/p/146093c91e2b
r8s
【OrthoFinder】
Emms, D.M., Kelly, S. OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy. Genome Biol 16, 157 (2015) ( https://doi.org/10.1186/s13059-015-0721-2 )
Emms, D.M., Kelly, S. OrthoFinder: phylogenetic orthology inference for comparative genomics. Genome Biol 20, 238 (2019) https://doi.org/10.1186/s13059-019-1832-y )
【CAFE v.4.2.1】
Han, M. V., Thomas, G. W. C., Lugo-Martinez, J., and Hahn, M. W. Estimating gene gain and loss rates in the presence of error in genome assembly and annotation using CAFE 3. Molecular Biology and Evolution 30, 8 (2013)
【iqtree v. 1.6.12】
Lam-Tung Nguyen, Heiko A. Schmidt, Arndt von Haeseler, and Bui Quang Minh (2015) IQ-TREE: A fast and effective stochastic algorithm for estimating maximum likelihood phylogenies. Mol Biol Evol, 32:268-274. https://doi.org/10.1093/molbev/msu300
【modelFinder】
Subha Kalyaanamoorthy, Bui Quang Minh, Thomas KF Wong, Arndt von Haeseler, and Lars S Jermiin (2017) ModelFinder: Fast model selection for accurate phylogenetic estimates. Nature Methods, 14:587–589. https://doi.org/10.1038/nmeth.4285
【R8s v. 1.81】
Sanderson M J. R8s: inferring absolute rates of molecular evolution and divergence times in the absence of a molecular clock. Bioinformatics, 2003, 19(2): 301-302.
【STAG tree】
Emms D.M. & Kelly S. STAG: Species Tree Inference from All Genes (2018), bioRxiv https://doi.org/10.1101/267914

直系同源低拷贝核基因(orthologous low- nuclear genes, LCN):在进化过程中,新基因通常来自事先存在的基因,新基因的功能从先前基因的功能进化而来。新基因的原材料来自基因组区域的重复,这种重复可包括一个或多个基因。作为物种形成的伴随事件而被重复,并继续保持相同功能的基因,称为直系同源基因(orthologous)。新的基因功能可由在单个物种的基因组中发生的重复引起的。在一个基因组内部的重复导致旁系同源基因(paralogous gene)。
最大似然法(maximum likelihood method):使用概率模型,寻找能够以较高概率产生观察数据的系统发生树。
外群的选择:大多数的种系发生重建方法会产生无根树,但是观察树的拓扑结构无法识别树根应在哪一分支上。实际上,对于要证实哪一个分类单元的分支先于其他的分类单元,树根必须确定。在无根树中设定一个根,最简单的方法是在数据集中增加一个外群(outgroup)。外群是一种分类操作单元,且有外部信息表明外群在所有分类群之前就已分化。研究演化历史,一般选择比目标序列具有较早进化历史的序列作为外类群。
Bootstrap support: bootstrap是统计学上一种非参数统计方法,通过有放回的随机抽样,构建分类回归树。Jackknife与bootstrap类似,只是每次抽样时会去除几个样本,像小刀一样切去一部分。所谓bootstrap法就是从整个序列的碱基(氨基酸)中任意选取一半,剩下的一半序列随机补齐组成一个新的序列。这样,一个序列就可以变成许多序列,一个序列组也就可以变成许多个序列组。根据某种算法(距离矩阵法、最大简约法、最大似然法),每个多序列组都可以生成一个进化树。将生成的许多进化树进行比较,按照多数规则(majority-rule)就会得到一个最“逼真”的进化树。

㈢ 交通配流里面的MSA方法是一种FW算法吗

不是,二者思想不同。

㈣ 模拟退火法<sup>[1,]</sup>

模拟退火算法最早在1953年由 Metropolis等人提出。在地球物理中的最早应用是Rothman在1983年利用模拟退火算法处理地震资料的剩余静校正。模拟退火法也是类似于蒙特卡洛法的随机搜索方法。但是在产生模型的过程中引入一些规则,能有效地加快搜索速度,有时又称这类方法为启发式蒙特卡洛法。

模拟退火法概念源于统计物理学,是模拟固体熔化状态逐渐缓慢冷却最终达到能量最小的结晶状态的物理过程。对于一个熔化的金属,当处于某个温度的热平衡状态时,它的每一个分子都有它可能所处的状态,有些分子可能能量高一些,有些分子可能能量低一些,分子处于何种状态的概率由分子所具有的能量决定。设分子所有可能的能级总数为n(微观粒子的能量都是量子化的,不连续的),则分子处于某种状态的概率满足玻尔兹曼概率分布:

地球物理反演教程

其中:Ei为第i个分子的能量;K为玻尔兹曼常数;T为绝对温度;n为分子所有可能的能级总数,分母称为配分因子;pi为第i个分子处于能量Ei的概率。

如果把地球物理反演的模型向量看作分子,把目标函数看作分子的能量,把目标函数的极小值看成分子冷却结晶的最小能量,反演问题(最优化问题)可以模拟式(8.11)金属退火的过程,通过缓慢地减小温度进行反演,使目标函数(能量)逐渐达到极小值,这时所对应的模型(分子状态)就是反演结果。

为了改善于蒙特卡洛法的随机搜索方法,1953年 Metropolis等人在产生模型的过程中引入Metropolis接受准则,模型产生并不是完全随机,而是以前一个模型为基础随机产生。对能量减小的模型完全接受,对能量增加的模型按一定的概率接受,这样能有效地加快搜索速度,同时又有可能跳出局部极小值。具体如下:

设原来模型向量为mi,新的模型为mi+1(在mi基础上随机修改产生),各自的能量(目标函数)为E(mi)和E(mi+1)。如果E(mi+1)<E(mi),则目标函数在减小,新模型可以接受。如果E(mi+1)>E(mi),则目标函数在增加,按照一定概率来确定是否接受新的模型。具体规则见式(8.12):

E(mi+1)<E(mi) 完全接受mi+1为新模型

地球物理反演教程

式(8.12)就是Metropolis接受准则。它使得反演过程可以接受使目标函数增加的模型,因此也就使得模拟退火法有可能跳出局部极小,收敛于全局极小值点。由于玻尔兹曼常数K只是起到尺度因子的作用,在实际计算中K可取为1来简化公式。从式(8.12)可以看出,当温度较低时,pi+1/pi较小,因此接受使能量增加的新模型的可能性较小。而一般温度较低时,目标函数较小,模型比较靠近真实模型,这时基本上只接受使目标函数减小的模型,使模型尽快收敛于极小值点。

在模拟退火反演中,要求温度T随着迭代次数的增加而缓慢降温。常用的温度函数有两种。

(1)指数下降型:

Tk=T0·exp(-ck1/N) (8.13)

式中:k为迭代次数;c为衰减因子;N为模型参数的个数;T0为初始温度。上式也可以改写为

地球物理反演教程

通常选择0.7≤α≤1。在实际应用中可采用0.5或1代替式(8.14)的1/N。图8.4(a)为指数降温曲线。采用参数为:T0=200℃,α=0.99,1/N=0.9。

(2)双曲线下降型:

T=T0αk (8.15)

式中:T0为初始温度;k为迭代次数;α为衰减因子,通常取0.99。初始温度T0不能取得太高,否则增加计算时间浪费机时;T0也不能太低,否则模型选取不能遍及整个模型空间,只是在初始模型附近选取,不能进行全局寻优。所以T0的确定只有通过实验计算得到。图8.4(b)为双曲线降温曲线。采用参数为:T0=200℃,α=0.99。从图8.4可以看出通过对不同温度曲线和相关参数进行选择,可以控制温度下降的方式和速度。

图8.4 模拟退火法降温曲线

模拟退火法主要有三种:

(1)MSA算法(Metropolis Simulated Annealing);

(2)HBSA算法(Heat Bath Simulated Annealing);

(3)VFSA算法(Very Fast Simulated Annealing)。

图8.5 模拟退火MSA算法程序流程图

前面介绍的利用 Metropolis接受准则的算法就是经典的模拟退火法。图8.5为模拟退火 MSA算法的程序流程图。从中可以看出 MSA算法有一套模型修改准则,依次改变模型参数,每次改变都是在原来模型基础上改变一个参数,因此容易保持已有搜索成果,持续不断地向目标函数最小值点接近,因此搜索效率比蒙特卡洛法高。此外,MSA算法允许接受使目标函数增加的模型,这样又易于跳出局部极小,达到全局极小。但 MSA算法在任何温度下和蒙特卡洛法一样都是在模型全空间进行搜索,不能根据当前温度和模型减小搜索空间,此外由于模型的修改全凭运气,所以不可能像前面介绍的最小二乘法那样目标函数基本上持续减小,而是呈不规则振荡在宏观上逐渐减小,因此效率较低。

HBSA算法与 MSA算法的不同之处是在模型的修改上。也是首先随机选择一个初始M维模型向量m0(它具有M个参数);然后限制各个模型参数可能的取值范围,对取值离散化。假设每个模型参数都有N个可能的值,首先固定模型第2个参数m0(2)直到第M个参数m0(M)保持不变,只修改第1个参数m0(1);计算m0(1)的所有取值时的目标函数,然后按式(8.16)计算“概率”,它就是式(8.11)配分因子取1的公式。即

地球物理反演教程

选择“概率”最大的为模型第1个参数的修改值。照此依次对所有模型参数进行修改完成依次迭代计算。在每次迭代计算中保持温度不变。随着迭代次数增加,温度降低,最终达到稳定状态,获得最小能量解。这种方法的计算由于要计算某个参数的所有可能值,所以计算量也是很大的。

1989年Ingber提出了VFSA算法,由于速度较快,最为常用。它使得模拟退火法从理论走向了实际应用。VFSA算法在流程上与传统的模拟退火法相同,但是在模型修改、接受概率以及降温曲线上有所改进。

(1)模型修改:常规模拟退火法采用高斯随机分布修改模型,在任何温度下都是在模型全空间进行搜索。而Ingber提出采用依赖于温度的似cauchy分布产生新的模型。即

地球物理反演教程

yi=Tsgn(u-0.5)[(1+1/T|2u-1|-1](8.18)

其中:mi为当前模型第i个参数,m'i为修改后的模型参数;u为[0,1]的随机数;[Ai,Bi]为mi和m'i的取值范围;sgn( )为符号函数。

采用以上方式能在高温下进行大范围的搜索,低温时在当前模型附近搜索,而且由于似cauchy分布具有平坦的“尾巴”,使其易于迅速跳出局部极值。这一改进大大加快了模拟退火法的收敛速度。

(2)接收概率:当E(mi+1)>E(mi)时,VFSA算法采用如下概率接受公式:

地球物理反演教程

上式当h→1时变为式(8.12)。h通过实验获得。

(3)降温曲线(退火计划):Ingber在1989年采用式(8.13)得出指数降温曲线。从图8.4可知,温度下降较快。

总之,VFSA算法在模型修改、接受概率以及降温曲线上的改进使得模拟退火算法收敛速度大大加快。后人在此基础上还有很多的改进,读者可以参考相关文献。

模拟退火法的优点:由于不需要计算偏导数矩阵,不需要解线性方程组(当然正演计算的除外),结构简单,易于编程;此外,由于它搜索范围大,能接受较差模型,因此易于达到全局极小。缺点:随机搜索,计算量巨大,往往要计算成百上千次正演,这与前面的最小二乘法十几次的正演计算相比反演时间太长,因此一般应用在一维反演之中,在二维、三维等高维反演中应用较少。

㈤ 比特率是什么意思

数字信道传送数字信号的速率称为数据传输速率或比特率.
比特率这个词有多种翻译,比如码率等,表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最少的单位,要么是0,要么是1。比特率与音视频压缩的关系简单的说就是比特率越高音视频的质量就越好,但编码后的文件就越大;如果比特率越少则情况刚好翻转。
例如:以500Kbps来编码音视频。
其中
bps是
比特1K=
1010=1024
b就是比特(bit)
s就是秒(second)
p就是每(per)
所以,以500kbps来编码表示经过编尺察码后的音视频数据每秒钟需要用500K的比特来表示
在基者困镇带传输系统中用比特率表示传输的信息码率.比特率Rb是指单位时间
内传输的二元比特数,单位是b/s.例如计算机串口的传输码率最高到115200b/s.
符号率或波特率Rs是指单位时间内传输的调制符号数,即指三元及三元以
上的多元数字码流的信息传输速率,单位是baud/s.
在M进制调制中,比特率Rb和波特率Rs之间的关系为:
Rb=Rslog2M
采样率是指采样样本与总样本数之比,采样数率是单位时间采样数。如果是仪器中,采样速率为40MSa/s,说明每秒采样数量为40M个,但是不能使用40MHz表示。
把模拟音频转成数字音频的过程,就称作采样,简单地说就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。44KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形。原则上采样率越高,声音的质量越好。
参首粗考原文:http://bk..com/view/56355.htm

热点内容
scratch少儿编程课程 发布:2025-04-16 17:11:44 浏览:639
荣耀x10从哪里设置密码 发布:2025-04-16 17:11:43 浏览:368
java从入门到精通视频 发布:2025-04-16 17:11:43 浏览:84
php微信接口教程 发布:2025-04-16 17:07:30 浏览:310
android实现阴影 发布:2025-04-16 16:50:08 浏览:793
粉笔直播课缓存 发布:2025-04-16 16:31:21 浏览:344
机顶盒都有什么配置 发布:2025-04-16 16:24:37 浏览:213
编写手游反编译都需要学习什么 发布:2025-04-16 16:19:36 浏览:812
proteus编译文件位置 发布:2025-04-16 16:18:44 浏览:366
土压缩的本质 发布:2025-04-16 16:13:21 浏览:592