布朗退火算法
① 交通量预测用什么方法
交通量预测用的方法有:遗传算法、神经网络、支持向量机、灰色理论等。
1、遗传算法
遗传算法是一种灵感源于达尔文自然进化理论的启发式搜索算法。遗传算法中包含初始化、个体评价(计算适应度函数)、选择运算、交叉运算和变异运算。
2、神经网络
神经网络是利用其算法特点来模拟人脑思维的第二种方式,它是一个非线性动力学系统,其特点就是信息分布式存储和并行协同处理。简单点讲就是利用该算法来模拟人类大脑来进行推理和验证的。
3、支持向量机
支持向量机算法作为机器学习领域的经典算法,从被提出开始提出后快速发展,在很多场景和领域都取得了非常好的效果,同时兼有数度快,支持数据量级大(相对经典机器学习算法)等特点使其在工程实践中的得到了广泛的应用。
4、灰色理论
灰色预测通过鉴别系统因素之间的发展趋势的相异程度,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程,从而预测事物未来的发展趋势。
(1)布朗退火算法扩展阅读
交通量预测的调整方法:
1、调基法
调基法主要通过调整与预测交通量关系最大的GDP和弹性系数,从而修正特征年交通增长率,达到降低交通量预测的不确定性带来的BOT项目投资风险。
2、通道控制法
基于公路运输通道特性明显的特点,重点收集拟建公路运输通道内的各主要公路历年观测交通量,对通道交通量进行整合、推算、预测。在此基础上,确定通道内各主要公路的功能定位、交通量分担权重,进而可以求得拟建公路的未来年交通量。
② 谁知道指纹和DNA怎样鉴别
指纹是人类手指末端指腹上由凹凸的皮肤所形成的纹路。指纹能使手在接触物件时增加摩擦力,从而更容易发力及抓紧物件。是人类进化过程式中自然形成的。 指纹由遗传影响,由于每个人的遗传基因均不同,所以指纹也不同。然而,指纹的形成虽然主要受到遗传影响,但也有环境因素,当胎儿在母体内发育三至四个月时,指纹就已经形成,但儿童在成长期间指纹会略有改变,直到青春期14岁左右时才会定型。在皮肤发育过程中,虽然表皮、真皮,以及基质层都在共同成长,但柔软的皮下组织长得比相对坚硬的表皮快,因此会对表皮产生源源不断的上顶压力,迫使长得较慢的表皮向内层组织收缩塌陷,逐渐变弯打皱,以减轻皮下组织施加给它的压力。如此一来,一方面使劲向上攻,一方面被迫往下撤,导致表皮长得曲曲弯弯,坑洼不平,形成纹路。这种变弯打皱的过程随着内层组织产生的上层压力的变化而波动起伏,形成凹凸不平的脊纹或皱褶,直到发育过程中止,最终定型为至死不变的指纹。 指纹有3种基本类型——环型、弓型和螺旋型。是皮下组织对指肚表皮顶压方向的不同造就了这不同的类型。研究表明,如果某人指头肚高而圆,其指纹的纹路将是螺旋型。现在,科学家已能够通过模型再现那些较为常见的指纹,也能重复不太复杂的罕见指纹的形成过程。 目前尚未发现有不同的人拥有相同的指纹,所以每个人的指纹也是独一无二。由于指纹是每个人独有的标记,近几百年来,罪犯在犯案现场留下的指纹,均成为警方追捕疑犯的重要线索。现今鉴别指纹方法已经电脑化,使鉴别程序更快更准。 DNA的科普知识: 1 DNA指纹图的建立及发展 近百年来的研究认为,任何遗传分析都是以遗传标志为基础的,而任何一个遗传标志的价值又在于其变异 性(即多态性)的大小。有关遗传多态性的研究对促进人类学、遗传学、免疫学以及法医学的发展, 以及对阐明某些疾病的发病机理乃至协助诊断等方面都起了十分重要的作用。但以往的研究都是利用各种外部表现型、生理缺陷型、同工酶、多态蛋白等作为遗传标志,用间接分析来推论相应的遗传基因。 70年代末,限制性内切酶和重组体DNA技术的出现以及分子生物学的飞速发展,使人们对遗传标志的研究转向DNA分子本身。由于各种遗传信息都蕴藏在DNA分子上,生物个体间的差异在本质上是DNA分子的差异,因此DNA被认为是最可靠的遗传标志。某些DNA序列的差异可通过限制性酶切片段长度的改变来反映,此即限制性片段长度多态性(restriction fragment length polymorphisms,RFLP),其产生是由于点突变、DNA重排、插入或缺失引起的〔1〕。随着对RFLP研究的深入,人们发现了基因组中最有变异性的一类序列——高变异DNA序列,使DNA遗传标志的发展和应用得到了一次飞跃。 1980年,Wyman和White描述了第一个多等位性的具有高度多态性的人类DNA标志。不久,在胰岛素基因(Insulingene)的5′端区域、致癌基因(C-Haras I Oncogene)的3′端分别发现了相同的高度可变的标志(hypervariable marker)。在α-球蛋白(α-globin)基因群周围还发现了其它三个标志〔2〕。1982年,Bell等〔3〕证实:这些高度多态性区域串联着重复的短序列单位,重复单位数目的差异导致了这种高度的可变性,由于这些结构特征,人们称这些区域为小卫星(minisatellite)或高度可变区域(hypervariable)或可变数目的串联重复(variable number of tandem repeats)。 1985年,Jeffreys 等〔4〕用肌红蛋白基因第一内含子中的串联重复序列(重复单位含33bp)作探针,从人的基因文库中筛选出8个含有串联重复序列(小卫星)的重组克隆。序列分析表明,这8个小卫星重复单位的长度和序列不完全相同,但都有相同的核心序列(core sequence)即GGCCAGGA/GGG。他们先后用两个多核心小卫星(poly coreminisate -llite)33.6和33.15探针进行southern杂交,在低严谨条件下杂交得到了包含10多条带的杂交图谱,不同个体杂交图谱上带的位置就象人的指纹一样千差万别,Jeffrey称之为DNA指纹(DNA fingerprint)〔5〕,又名遗传指纹(genetic fingerprint)。 RFLP DNA指纹分析技术由于方法繁杂、周期长、实验条件高等缺陷而无法大范围推广。1990年,Williams等〔6〕首次报道了AP-PCR技术,Welsh和McCelland〔7〕亦独立地进行了这方面的工作,从而使DNA指纹技术应用更加广泛。AP-PCR技术是采用随意设计的1个或2个引物,对模板DNA进行PCR扩增,一般先是在低严格条件,即在高Mg2+浓度(大于传统PCR Mg2+浓度1.5mmol/L)、较低退火温度(36℃~50℃)下进行1~6个循环的PCR扩增,随后在严格条件下进行PCR扩增,产物经2%琼脂糖凝胶电泳或6%变性聚丙烯酰胺凝胶电泳分离,可得到DNA指纹图谱。其基本原理是:在低严格复性条件下,引物与模板DNA非完全互补序列形成错配,错配引物在DNA聚合酶作用下沿模板链延伸,合成新链,当在一定距离内模板DNA另一单链也发生引物错配时,即可对两错配引物间的DNA进行扩增。但是此种错配并非随机发生,引物和模板间,特别是在引物3′端必须存在一定的互补序列,即可产生不同的扩增片段或组合,通过DNA指纹图谱,可得到配对DNA样品中的差异片段,用于克隆、测序、染色体定位和基因片段的生物学功能研究。 我国杨建厂等〔8〕利用PCR的原理成功地建立了一种全新的DNA指纹检测技术,称之为随机引物PCR人DNA指纹检测技术(arbitrarily primed PCR human DNA fingerprinting,APHDP),此外还开发出处理DNA指纹数据应用软件,应用于个人识别、遗传素质与疾病的相关特征研究等。 DNA指纹的识别 ________________________________________ 1984年英国莱斯特大学的遗传学家Jefferys及其合作者首次将分离的人源小卫星DNA用作基因探针,同人体核DNA的酶切片段杂交,获得了由多个位点上的等位基因组成的长度不等的杂交带图纹,这种图纹极少有两个人完全相同,故称为"DNA指纹",意思是它同人的指纹一样是每个人所特有的。DNA指纹的图像在X光胶片中呈一系列条纹,很像商品上的条形码。DNA指纹图谱,开创了检测DNA多态性(生物的不同个体或不同种群在DNA结构上存在着差异)的多种多样的手段,如RFLP(限制性内切酶酶切片段长度多态性)分析、串联重复序列分析、RAPD(随机扩增多态性DNA)分析等等。各种分析方法均以DNA的多态性为基础,产生具有高度个体特异性的DNA指纹图谱,由于DNA指纹图谱具有高度的变异性和稳定的遗传性,且仍按简单的孟德尔方式遗传,成为目前最具吸引力的遗传标记。 DNA指纹具有下述特点:1.高度的特异性:研究表明,两个随机个体具有相同DNA图形的概率仅3×10-11;如果同时用两种探针进行比较,两个个体完全相同的概率小于5×10-19。全世界人口约50亿,即5×109。因此,除非是同卵双生子女,否则几乎不可能有两个人的DNA指纹的图形完全相同。2.稳定的遗传性:DNA是人的遗传物质,其特征是由父母遗传的。分析发现,DNA指纹图谱中几乎每一条带纹都能在其双亲之一的图谱中找到,这种带纹符合经典的孟德尔遗传规律,即双方的特征平均传递50%给子代。3.体细胞稳定性:即同一个人的不同组织如血液、肌肉、毛发、精液等产生的DNA指纹图形完全一致。 1985年Jefferys博士首先将DNA指纹技术应用于法医鉴定。1989年该技术获美国国会批准作为正式法庭物证手段。我国警方利用DNA指纹技术已侦破了数千例疑难案件。DNA指纹技术具有许多传统法医检查方法不具备的优点,如它从四年前的精斑、血迹样品中,仍能提取出DNA来作分析;如果用线粒体DNA检查,时间还将延长。此外千年古尸的鉴定,在俄国革命时期被处决沙皇尼古拉的遗骸,以及最近在前南地区的一次意外事故中机毁人亡的已故美国商务部长布朗及其随行人员的遗骸鉴定,都采用了DNA指纹技术。 此外,它在人类医学中被用于个体鉴别、确定亲缘关系、医学诊断及寻找与疾病连锁的遗传标记;在动物进化学中可用于探明动物种群的起源及进化过程;在物种分类中,可用于区分不同物种,也有区分同一物种不同品系的潜力。在作物的基因定位及育种上也有非常广泛的应用。 DNA指纹图谱法的基本操作:从生物样品中提取DNA(DNA一般都有部分的降解),可运用PCR技术扩增出高可变位点(如VNTR系统,串联重复的小卫星DNA等)或者完整的基因组DNA,然后将扩增出的DNA酶切成DNA片断,经琼脂糖凝胶电泳,按分子量大小分离后,转移至尼龙滤膜上,然后将已标记的小卫星DNA探针与膜上具有互补碱基序列的DNA片段杂交,用放射自显影便可获得DNA指纹图谱。 琼脂糖凝胶电泳是分离,鉴定和纯化DNA片段的常规方法。利用低浓度的荧光嵌入染料-溴化乙锭进行染色,可确定DNA在凝胶中的位置。如有必要,还可以从凝胶中 回收DNA条带,用于各种克隆操作。琼脂糖凝胶的分辨能力要比聚丙烯酰胺凝胶低,但其分离范围较广。用各种浓度的琼脂糖凝胶可以分离长度为200bp至近50kbp的DNA。长度100kb或更大的DNA,可以通过电场方向呈周期性变化的脉冲电场凝胶电泳进行分离。 在基因工程的常规操作中,琼脂糖凝胶电泳应用最为广泛。它通常采用水平电泳装置,在强度和方向恒定的电场下进行电泳。DNA分子在凝胶缓冲液(一般为碱性)中带负电荷,在电场中由负极向正极迁移。DNA分子迁移的速率受分子大小,构象。电场强度和方向,碱基组成,温度和嵌入染料等因素的影响。 2 DNA指纹技术所用的探针 自DNA指纹技术建立以来,这一技术迅速在动植物的进化关系、亲缘关系分析以及法医学方面得到广泛应用。也正是由于DNA指纹技术在核酸分析中显示出了强大的生命力,因而许多学者围绕此技术所用的探针作了大量的工作,除Jeffrey等〔5〕的探针外,用人工化学合成或从生物组织中提取后再扩增的办法生产出了一批高水平的探针。迄今,在DNA指纹技术中所用的探针大概有probe33.15、33.6〔5〕、bacteriophage MB〔9〕、pig repetitire clone p83、PGB 725、poly(GT) containing 18.1、(GTG)5/(CAC)5〔10,11〕、(CAC/TA)4及(GT)12等。同时,在探针的标志上也有了很大的发展,根据它们的结构可大致分为小卫星探针和简单重复序列探针,简单重复序列包括微卫星探针(microsatellite probe)和寡聚核苷酸探针。小卫星探针的核心序列为33bp,常定位在人常染色体前的末端(proterminal)区域,微卫星探针则在10~20bp之间,而寡聚核苷酸探针在10bp以下,普遍散布在人类整条染色体上,或者在基因间区域或者位于内含子内。 1988年,我国伍新尧等〔12〕根据DNA指纹是人基因组中重复序列的RFLP的原理和人与鼠的髓鞘碱性蛋白(MBP)基因cDNA同源序列性高于90%的事实,选用鼠MBP cDNA3′端的一段序列(非表达区高度重序列,与人基因组中该类重复序列几乎完全同源),长度为0.81kb的片段作探针,检测用HaeⅢ酶解的人DNA限制性片段(RF),在人群中可分出22条谱带,受检 的30例无血缘关系的个体之间没有两个人的谱带是完全相同的,显示这一方法的高度个体特异性,这是国内首次用自已的力量找到DNA指纹的探针。 3 DNA指纹的应用3.1 法医学方面 同以往的血型测定法相比,DNA指纹技术在法医学领域上具有无可比拟的优越性。已成为鉴定犯罪、亲子鉴定和确定个体间亲缘关系的工具〔5,13〕。随后,国内学者李伯龄〔14〕、姜先华〔15〕、伍新尧等〔12〕也先后对此项技术进行了研究,并应用于实际案件的鉴定中,解决了过去无法解决的疑难案例,如微量血痕、部分腐败的碎尸块的个人认定等。 3.2 在动植物科学中的应用 3.2.1 生物种群学研究 利用DNA指纹图可以估算连锁不平衡,比较等位基因的频率,还能估计不同个体之间的重组率,在种群学研究上有助于建立某一个体在种群中的地位和关系,特别是对真菌的种群研究,有很多真菌可以通过有性和无性的方式繁殖,但是何时以何种方式繁殖,程度如何,并不清楚,而利用DNA指纹图就能区分以有性和无性方式产生的后代,并能确定某一区域真菌的自然分布〔1,16〕。 3.2.2 测定物种之间的遗传距离、物种分类鉴定 Jeffreys等〔5〕认为在一个群体的不同成员间拷贝数的串联重复序列(VNTR)由于多态性程度高,在遗传分析中尤其适合作为多态性标志,简单重复的不稳定性可导致VNTR长度的迅速变化,根据家族中或育种群体中VNTR的分离重组频率,可以测定出遗传距离,可用统计学公式确定个体间的亲缘关系:D=2Nab/(Na+Nb),,D值越大,亲缘关系越近,遗传距离就越小;D值越小,亲缘关系越远,遗传距离就越大。为此,运用DNA指纹技术可检测不同物种、同种及同种不同个体的亲缘关系,用于物种分类鉴定,也可用于杂交后代亲本决定,杂交后代群体分开,检测近等基因系(或同类系)种的多态性,并对检测基因进行定位。Welsh等〔7〕对布氏疏螺旋体菌株的DNA指纹进行分析,发现这种lyme病的病原菌实际上是由三个不同的种群组成。罗超权等〔12〕运用AP-PCR鉴定弓形虫虫株,在国内开创了运用DNA指纹技术作生物分类的先例。 3.3 在流行病学方面的运用 由于DNA指纹具有以下几个特点:①能反映基因组的变异性;②具有高度的变异性;③具有简单的稳定的遗传性;④DNA指纹谱具有体细胞稳定性。所以,它同一般的流行病学方法相比较而言,具有无比的优越性,使其成为流行病调查的一种有效工具。Jan DA等〔17〕,Denise Chevrel-Dellagi等〔18〕运用IS6110序列作探针对结核病分支杆菌株进行DNA指纹分析,调查国际间结核病的种型、分析流行情况,改进了控制结核病的方法。而ZhenHua Yang等〔19〕从67个病人中分离出结核病分支杆菌株进行DNA指纹分析,发现分离到PTBN12型时易查明流行环节,从而为快速进行疾病控制提供了一个有力证据。在我国,童笑梅等〔20〕采用随机扩增多态DNA指纹图技术对医院内感染的14例新生儿进行病原流行病学分析,发现患儿体内携带的与医务人员鼻中携带的华纳葡萄球菌菌株的DNA指纹图完全一致,从而证明此次感染的病原菌为华纳葡萄球菌,传染源是携带病菌的医务人员。郭永建等〔21〕在6个月内对121名产科新生儿中的30名检出的31株铜绿假单胞菌进行RAPD指纹图谱分析和血清学分型,结果表明,铜绿假单胞菌在产科新生儿中暴发流行,0∶6/R∶1型为暴发流行性菌株,对医院感染病原菌分型、精确确定传染源、阻断传播途径、控制和预防医院感染具有重要的指导意义。 3.4 疾病诊断及治疗 鉴于DNA指纹所具有的上述特点,故DNA指纹广泛应用于一些疾病的诊断及治疗。Morral〔22〕等发现CF基因9号外显子侧翼含有一小卫星区,且此等位基因2.6带常与△F508连锁,相伴率为50.6%、41.6%,△F508是最主要的致病突变,可疑患者电泳图只要发现2.6等位基因,就可对此病进行初步诊断。现已在Wilson病、外周神经纤维瘤、成人多束肾、多巴性肌紧张、Frecbreich共济失调、Kallmunm综合征性连锁、视网膜病等基因内或旁侧发现有高度的小卫星区域,从而可进行基因诊断。Okamoto R〔23〕用DNA指纹法预测慢性粒cell性白血病骨髓移植术后复发,取得了成功。 3.5 肿瘤的研究 肿瘤是多因素、多阶段的变化过程,病因复杂、变化多样,但归根到底还是在DNA的变化上。一般说来,癌组织、转移灶与正常组织或外周血细胞DNA指纹有差别,常见的是某条带或几条带的缺失,某一条或某几条带密度降低,或者癌组织中出现新的带。Thein等〔24〕用33.6和33.15为探针研究患者DNA指纹谱变化,发现胃肠肿瘤患者癌组织DNA指纹谱全有改变,并认为体细胞突 变还有种属特异性。刘霜等〔25〕应用RAPD(随机扩增多态性DNA)分析技术对6例肝癌患者的癌组织与非癌组织进行分析,发现所有肝癌组织基因组DNA的RAPD指纹图谱均存在差异,其中3例配对肝癌基因组中均存在一相同的0.9Kb的随机扩增片段。杨建厂等〔8〕用APHDFF技术对28例确诊为鼻咽癌病人血DNA指纹图的检测,发现有3条DNA片段出现的频率明显低于健康人群。王黛等〔26〕用LE11.8、MYO和Mb探针,经Southern杂交法检测12例儿童急性粒cell白血病患者的外周血或骨髓细胞的基因重排,结果发现初始或复发与完全缓解时的DNA指纹图相比,谱带有增加或减少,从而认为急性粒细胞白血病患儿的白血病细胞存在基因重排。 参考资料:http://..com/question/13180448.html
③ 智能算法的算法分类
模拟退火算法的依据是固体物质退火过程和组合优化问题之间的相似性。物质在加热的时候,粒子间的布朗运动增强,到达一定强度后,固体物质转化为液态,这个时候再进行退火,粒子热运动减弱,并逐渐趋于有序,最后达到稳定。
模拟退火的解不再像局部搜索那样最后的结果依赖初始点。它引入了一个接受概率p。如果新的点(设为pn)的目标函数f(pn)更好,则p=1,表示选取新点;否则,接受概率p是当前点(设为pc)的目标函数f(pc),新点的目标函数f(pn)以及另一个控制参数“温度”T的函数。也就是说,模拟退火没有像局部搜索那样每次都贪婪地寻找比现在好的点,目标函数差一点的点也有可能接受进来。随着算法的执行,系统温度T逐渐降低,最后终止于某个低温,在该温度下,系统不再接受变化。
模拟退火的典型特征是除了接受目标函数的改进外,还接受一个衰减极限,当T较大时,接受较大的衰减,当T逐渐变小时,接受较小的衰减,当T为0时,就不再接受衰减。这一特征意味着模拟退火与局部搜索相反,它能避开局部极小,并且还保持了局部搜索的通用性和简单性。
在物理上,先加热,让分子间互相碰撞,变成无序状态,内能加大,然后降温,最后的分子次序反而会更有序,内能比没有加热前更小。就像那只兔子,它喝醉后,对比较近的山峰视而不见,迷迷糊糊地跳一大圈子,反而更有可能找到珠峰。
值得注意的是,当T为0时,模拟退火就成为局部搜索的一个特例。
模拟退火的伪码表达:
procere simulated annealing
begin
t:=0;
initialize temperature T
select a current string vc at random;
evaluate vc;
repeat
repeat
select a new string vn in the neighborhood of vc; (1)
if f(vc)<f(vn)
then vc:=vn;
else if random [0,1] <exp ((f (vn)-f (vc))/T) (2)
then vc:=vn;
until (termination-condition) (3)
T:=g(T,t); (4)
T:=t+1;
until (stop-criterion) (5)
end;
上面的程序中,关键的是(1)新状态产生函数,(2)新状态接受函数,(3)抽样稳定准则,(4)退温函数,(5)退火结束准则(简称三函数两准则)是直接影响优化结果的主要环节。虽然实验结果证明初始值对于最后的结果没有影响,但是初温越高,得到高质量解的概率越大。所以,应该尽量选取比较高的初温。
上面关键环节的选取策略:
(1)状态产生函数:候选解由当前解的邻域函数决定,可以取互换,插入,逆序等操作产生,然后根据概率分布方式选取新的解,概率可以取均匀分布、正态分布、高斯分布、柯西分布等。
(2)状态接受函数:这个环节最关键,但是,实验表明,何种接受函数对于最后结果影响不大。所以,一般选取min [1, exp ((f (vn)-f (vc))/T)]。
(3)抽样稳定准则:一般常用的有:检验目标函数的均值是否稳定;连续若干步的目标值变化较小;规定一定的步数;
(4)退温函数:如果要求温度必须按照一定的比率下降,SA算法可以采用,但是温度下降很慢;快速SA中,一般采用 。目前,经常用的是 ,是一个不断变化的值。
(5)退火结束准则:一般有:设置终止温度;设置迭代次数;搜索到的最优值连续多次保持不变;检验系统熵是否稳定。
为了保证有比较优的解,算法往往采取慢降温、多抽样、以及把“终止温度”设的比较低等方式,导致算法运行时间比较长,这也是模拟退火的最大缺点。人喝醉了酒办起事来都不利索,何况兔子? “物竞天择,适者生存”,是进化论的基本思想。遗传算法就是模拟自然界想做的事。遗传算法可以很好地用于优化问题,若把它看作对自然过程高度理想化的模拟,更能显出它本身的优雅——虽然生存竞争是残酷的。
遗传算法以一种群体中的所有个体为对象,并利用随机化技术指导对一个被编码的参数空间进行高效搜索。其中,选择、交叉和变异构成了遗传算法的遗传操作;参数编码、初始群体的设定、适应度函数的设计、遗传操作设计、控制参数设定五个要素组成了遗传算法的核心内容。作为一种新的全局优化搜索算法,遗传算法以其简单通用、健壮性强、适于并行处理以及高效、实用等显着特点,在各个领域得到了广泛应用,取得了良好效果,并逐渐成为重要的智能算法之一。
遗传算法的伪码:
procere genetic algorithm
begin
initialize a group and evaluate the fitness value ; (1)
while not convergent (2)
begin
select; (3)
if random[0,1]<pc then
crossover; (4)
if random (0,1)<pm then
mutation; (5)
end;
end
上述程序中有五个重要的环节:
(1)编码和初始群体的生成:GA在进行搜索之前先将解空间的解数据表示成遗传空间的基因型串结构数据,这些串结构数据的不同组合便构成了不同的点。然后随机产生N个初始串结构数据,每个串结构数据称为一个个体, N个体构成了一个群体。GA以这N个串结构数据作为初始点开始迭代。
比如,旅行商问题中,可以把商人走过的路径进行编码,也可以对整个图矩阵进行编码。编码方式依赖于问题怎样描述比较好解决。初始群体也应该选取适当,如果选取的过小则杂交优势不明显,算法性能很差(数量上占了优势的老鼠进化能力比老虎强),群体选取太大则计算量太大。
(2)检查算法收敛准则是否满足,控制算法是否结束。可以采用判断与最优解的适配度或者定一个迭代次数来达到。
(3)适应性值评估检测和选择:适应性函数表明个体或解的优劣性,在程序的开始也应该评价适应性,以便和以后的做比较。不同的问题,适应性函数的定义方式也不同。根据适应性的好坏,进行选择。选择的目的是为了从当前群体中选出优良的个体,使它们有机会作为父代为下一代繁殖子孙。遗传算法通过选择过程体现这一思想,进行选择的原则是适应性强的个体为下一代贡献一个或多个后代的概率大。选择实现了达尔文的适者生存原则。
(4)杂交:按照杂交概率(pc)进行杂交。杂交操作是遗传算法中最主要的遗传操作。通过杂交操作可以得到新一代个体,新个体组合了其父辈个体的特性。杂交体现了信息交换的思想。
可以选定一个点对染色体串进行互换,插入,逆序等杂交,也可以随机选取几个点杂交。杂交概率如果太大,种群更新快,但是高适应性的个体很容易被淹没,概率小了搜索会停滞。
(5)变异:按照变异概率(pm)进行变异。变异首先在群体中随机选择一个个体,对于选中的个体以一定的概率随机地改变串结构数据中某个串的值。同生物界一样,GA中变异发生的概率很低。变异为新个体的产生提供了机会。
变异可以防止有效基因的缺损造成的进化停滞。比较低的变异概率就已经可以让基因不断变更,太大了会陷入随机搜索。想一下,生物界每一代都和上一代差距很大,会是怎样的可怕情形。
就像自然界的变异适和任何物种一样,对变量进行了编码的遗传算法没有考虑函数本身是否可导,是否连续等性质,所以适用性很强;并且,它开始就对一个种群进行操作,隐含了并行性,也容易找到“全局最优解”。 为了找到“全局最优解”,就不应该执着于某一个特定的区域。局部搜索的缺点就是太贪婪地对某一个局部区域以及其邻域搜索,导致一叶障目,不见泰山。禁忌搜索就是对于找到的一部分局部最优解,有意识地避开它(但不是完全隔绝),从而获得更多的搜索区间。兔子们找到了泰山,它们之中的一只就会留守在这里,其他的再去别的地方寻找。就这样,一大圈后,把找到的几个山峰一比较,珠穆朗玛峰脱颖而出。
当兔子们再寻找的时候,一般地会有意识地避开泰山,因为他们知道,这里已经找过,并且有一只兔子在那里看着了。这就是禁忌搜索中“禁忌表(tabu list)”的含义。那只留在泰山的兔子一般不会就安家在那里了,它会在一定时间后重新回到找最高峰的大军,因为这个时候已经有了许多新的消息,泰山毕竟也有一个不错的高度,需要重新考虑,这个归队时间,在禁忌搜索里面叫做“禁忌长度(tabu length)”;如果在搜索的过程中,留守泰山的兔子还没有归队,但是找到的地方全是华北平原等比较低的地方,兔子们就不得不再次考虑选中泰山,也就是说,当一个有兔子留守的地方优越性太突出,超过了“best to far”的状态,就可以不顾及有没有兔子留守,都把这个地方考虑进来,这就叫“特赦准则(aspiration criterion)”。这三个概念是禁忌搜索和一般搜索准则最不同的地方,算法的优化也关键在这里。
伪码表达:
procere tabu search;
begin
initialize a string vc at random,clear up the tabu list;
cur:=vc;
repeat
select a new string vn in the neighborhood of vc;
if va>best_to_far then {va is a string in the tabu list}
begin
cur:=va;
let va take place of the oldest string in the tabu list;
best_to_far:=va;
end else
begin
cur:=vn;
let vn take place of the oldest string in the tabu list;
end;
until (termination-condition);
end;
以上程序中有关键的几点:
(1)禁忌对象:可以选取当前的值(cur)作为禁忌对象放进tabu list,也可以把和当然值在同一“等高线”上的都放进tabu list。
(2)为了降低计算量,禁忌长度和禁忌表的集合不宜太大,但是禁忌长度太小容易循环搜索,禁忌表太小容易陷入“局部极优解”。
(3)上述程序段中对best_to_far的操作是直接赋值为最优的“解禁候选解”,但是有时候会出现没有大于best_to_far的,候选解也全部被禁的“死锁”状态,这个时候,就应该对候选解中最佳的进行解禁,以能够继续下去。
(4)终止准则:和模拟退火,遗传算法差不多,常用的有:给定一个迭代步数;设定与估计的最优解的距离小于某个范围时,就终止搜索;当与最优解的距离连续若干步保持不变时,终止搜索;
禁忌搜索是对人类思维过程本身的一种模拟,它通过对一些局部最优解的禁忌(也可以说是记忆)达到接纳一部分较差解,从而跳出局部搜索的目的。 人工神经网络(Artificial Neural Network,ANN)
神经网络从名字就知道是对人脑的模拟。它的神经元结构,它的构成与作用方式都是在模仿人脑,但是也仅仅是粗糙的模仿,远没有达到完美的地步。和冯·诺依曼机不同,神经网络计算非数字,非精确,高度并行,并且有自学习功能。
生命科学中,神经细胞一般称作神经元,它是整个神经结构的最基本单位。每个神经细胞就像一条胳膊,其中像手掌的地方含有细胞核,称作细胞体,像手指的称作树突,是信息的输入通路,像手臂的称作轴突,是信息的输出通路;神经元之间错综复杂地连在一起,互相之间传递信号,而传递的信号可以导致神经元电位的变化,一旦电位高出一定值,就会引起神经元的激发,此神经元就会通过轴突传出电信号。
而如果要用计算机模仿生物神经,就需要人工的神经网络有三个要素:(1)形式定义人工神经元;(2)给出人工神经元的连接方式,或者说给出网络结构;(3)给出人工神经元之间信号强度的定义。
历史上第一个人工神经网络模型称作M-P模型,非常简单:
其中,表示神经元i在t时刻的状态,为1表示激发态,为0表示抑制态;是神经元i和j之间的连接强度;表示神经元i的阈值,超过这个值神经元才能激发。
这个模型是最简单的神经元模型。但是功能已经非常强大:此模型的发明人McCulloch和Pitts已经证明,不考虑速度和实现的复杂性,它可以完成当前数字计算机的任何工作。
以上这个M-P模型仅仅是一层的网络,如果从对一个平面进行分割的方面来考虑的话,M-P网络只能把一个平面分成个半平面,却不能够选取特定的一部分。而解决的办法就是“多层前向网路”。
为了让这种网络有合适的权值,必须给网络一定的激励,让它自己学习,调整。一种方法称作“向后传播算法(Back Propagation,BP)”,其基本思想是考察最后输出解和理想解的差异,调整权值,并把这种调整从输出层开始向后推演,经过中间层,达到输入层。
可见,神经网络是通过学习来达到解决问题的目的,学习没有改变单个神经元的结构和工作方式,单个神经元的特性和要解决的问题之间也没有直接联系,这里学习的作用是根据神经元之间激励与抑制的关系,改变它们的作用强度。学习样本中的任何样品的信息都包含在网络的每个权值之中。
BP算法中有考察输出解和理想解差异的过程,假设差距为w,则调整权值的目的就是为了使得w最小化。这就又包含了前文所说的“最小值”问题。一般的BP算法采用的是局部搜索,比如最速下降法,牛顿法等,当然如果想要得到全局最优解,可以采用模拟退火,遗传算法等。当前向网络采用模拟退火算法作为学习方法的时候,一般成为“波尔兹曼网络”,属于随机性神经网络。
在学习BP算法学习的过程中,需要已经有一部分确定的值作为理想输出,这就好像中学生在学习的时候,有老师的监督。如果没有了监督,人工神经网络该怎么学习?
就像没有了宏观调控,自由的市场引入了竞争一样,有一种学习方法称作“无监督有竞争的学习”。在输入神经元i的若干个神经元之间开展竞争,竞争之后,只有一个神经元为1,其他均为0,而对于失败的神经元,调整使得向对竞争有利的方向移动,则最终也可能在一次竞争中胜利;
人工神经网络还有反馈网络如Hopfield网络,它的神经元的信号传递方向是双向的,并且引入一个能量函数,通过神经元之间不断地相互影响,能量函数值不断下降,最后能给出一个能量比较低的解。这个思想和模拟退火差不多。
人工神经网络应用到算法上时,其正确率和速度与软件的实现联系不大,关键的是它自身的不断学习。这种思想已经和冯·诺依曼模型很不一样。 粒子群优化算法(PSO)是一种进化计算技术(evolutionary computation),1995 年由Eberhart 博士和kennedy 博士提出,源于对鸟群捕食的行为研究 。该算法最初是受到飞鸟集群活动的规律性启发,进而利用群体智能建立的一个简化模型。粒子群算法在对动物集群活动行为观察基础上,利用群体中的个体对信息的共享使整个群体的运动在问题求解空间中产生从无序到有序的演化过程,从而获得最优解。
PSO同遗传算法类似,是一种基于迭代的优化算法。系统初始化为一组随机解,通过迭代搜寻最优值。但是它没有遗传算法用的交叉(crossover)以及变异(mutation),而是粒子在解空间追随最优的粒子进行搜索。同遗传算法比较,PSO的优势在于简单容易实现并且没有许多参数需要调整。目前已广泛应用于函数优化,神经网络训练,模糊系统控制以及其他遗传算法的应用领域。
PSO模拟鸟群的捕食行为。设想这样一个场景:一群鸟在随机搜索食物。在这个区域里只有一块食物。所有的鸟都不知道食物在那里。但是他们知道当前的位置离食物还有多远。那么找到食物的最优策略是什么呢。最简单有效的就是搜寻目前离食物最近的鸟的周围区域。
PSO从这种模型中得到启示并用于解决优化问题。PSO中,每个优化问题的解都是搜索空间中的一只鸟。我们称之为“粒子”。所有的粒子都有一个由被优化的函数决定的适应值(fitness value),每个粒子还有一个速度决定他们飞翔的方向和距离。然后粒子们就追随当前的最优粒子在解空间中搜索。
PSO 初始化为一群随机粒子(随机解)。然后通过迭代找到最优解。在每一次迭代中,粒子通过跟踪两个极值来更新自己。第一个就是粒子本身所找到的最优解,这个解叫做个体极值pBest。另一个极值是整个种群目前找到的最优解,这个极值是全局极值gBest。另外也可以不用整个种群而只是用其中一部分作为粒子的邻居,那么在所有邻居中的极值就是局部极值。 模拟退火,遗传算法,禁忌搜索,神经网络在解决全局最优解的问题上有着独到的优点,并且,它们有一个共同的特点:都是模拟了自然过程。模拟退火思路源于物理学中固体物质的退火过程,遗传算法借鉴了自然界优胜劣汰的进化思想,禁忌搜索模拟了人类有记忆过程的智力过程,神经网络更是直接模拟了人脑。
它们之间的联系也非常紧密,比如模拟退火和遗传算法为神经网络提供更优良的学习算法提供了思路。把它们有机地综合在一起,取长补短,性能将更加优良。
这几种智能算法有别于一般的按照图灵机进行精确计算的程序,尤其是人工神经网络,是对计算机模型的一种新的诠释,跳出了冯·诺依曼机的圈子,按照这种思想来设计的计算机有着广阔的发展前景
④ 如何建立自己的算法交易
在股票市场中交易过两、三年的人,几乎都有一套自己的交易方法。
虽然你有方法但如果还没有形成交易系统,那也先别着急去勉强建立,因交易系统是自然形成的.并不可人为刻意能建起来的。就好比计划经济与市场经济不断的适应市场的变化,时间长了,如果你还能在市场中生存.交易系统自然形成。而如果过早的固定自己的交易行为使之系统化,固定不变,在没有充分的了解市场的前提下,面临的只能是品尝失败。
一套自己的交易系统,不是一劳永益的盖世绝招,而是你对市场每一个细微之处都能深入了解---达到很细微.并且很全面。要总结经验,形成框架,这个框架就是你对市场的初步认识,它决定着你的行为,也就是你的交易。随着研究的深入,逐渐系统化,而这个框架至关重要,决定你今后的发展方向,不要去计划什么,在你眼前只有一个目标,深入分析市场,不断实践总结,周而复始,直到有一天你的交易系统就会自然成型。
曾有一个用波浪理论的高手和我交流,他说其经常能够预测到价格波动的高低点,并且因此而获利。但总体上的交易成绩并不是很理想。
在我的大多数朋友开始向我学习的时候,几乎都有一些实战经验,事实上,很多人的成绩相当不错。但是在交易的系统性方面,却有明显的欠缺。
如果你想长期稳定的获利,那么整体的交易应该是一个过程,而绝不是简简单单的一次预测或者一次全仓买入。其间至少包括:
另一方面,大多数投机者相信有一个通向市场的魔术:一个指标,一个形态,或者一个机械的交易系统,他们还肯定一小部分人正在使用着-------我在网上还见过售价24万元的一个公式,据说可百战百胜--------他们努力的想揭开这个魔术的秘密,从此而获利。
正确答案是:有,且答案就在你自己身上。
我可明确的告诉你:成功交易的一个秘密就是找到一套适合你的交易系统。这交易系统是非机械的,适合你自己个性的,有完善的交易思想、细致的市场分析和整体操作方案的。
交易系统,或说系统的交易方法,才是你长期稳定获利的正确方法。