dijkstrapython
A. python写的dijkstra看不懂,求指导
请问题主的问题是在语言上还是在算法上?
如果是语言上的问题,请列出具体的代码片段,说明具体的疑惑之处。
如果是算法问题,建议题主先学习一下dijkstra算法。学习算法最好的方法不是看程序实现,必须先自己弄懂原理,然后自己动手实现一次。
B. 学习python必备的8本书,你看过几本-简书
1.Python Cookbook
如果你在编写Python3程序时需要帮助,或者想更新老的Python2代码,这本书正是你所需要的。这本书包含了大量使用Python3.3编写并测试过的实用编程技巧。对于那些关注现代工具和惯用技巧的有经验的Python程序员来说,这本书无可替代。
此书是硅谷创业之父PaulGraham的文集,主要介绍黑客即优秀程序员的爱好和动机,讨论黑客成长、黑客对世界的贡献以及编程语言和黑客工作方法等所有对计算机时代感兴趣的人的一些话题。书中的内容不但有助于了解计算机编程的本质、互联网行业的规则,还会帮助读者了解我们所在的时代,迫使读者独立思考。本书适合所有程序员和互联网创业者,也适合一切对计算机行业感兴趣的读者。
C. dijkstra in python
这个不知道是不是你要的那个
http://blog.chinaunix.net/u1/54441/showart_1335190.html
在CSDN中C的
D. 关于Python 的经典入门书籍有哪些
1.《Python编程:从入门到实践》
这本书算是比较全面系统的入门Python教程。基本的概念解释得算是比较不错的,我们知道,对于零基础学习编程的人来说,基础的概念是最关键也是最重要的一部分,谁能把基本的概念讲得通俗易懂,那么谁也就自然受欢迎了。
2.《像计算机科学家一样思考Python》
本书更多的是想培养读者以计算机科学家一样的思维方式来理解Python语言编程。贯穿全书的主体是如何思考、设计、开发的方法。从基本的编程概念开始,一步步引导读者了解Python语言,再逐渐掌握函数、递归、数据结构和面向对象设计等高阶概念。
3.《Python编程:从入门到实践》
2016年出版的书,基于 Python3.5 同时也兼顾 Python2.7 ,书中涵盖的内容是比较精简的,没有艰深晦涩的概念,每个小结都附带练习题,它可以帮助你更快的上手编写程序,解决实际编程问题,上到有编程基础的程序员,下到10岁少年,想入门Python并达到可以开发实际项目的水平,这本书都是个不错的选择。
4.《Python核心编程第三版(中文版)》
该书向读者介绍了这种语言的核心内容,并展示了Python语言可以完成哪些任务。其主要内容包括:语法和编程风格、Python语言的对象、Web程序设计、执行环境等。该书条理清晰、通俗易懂,是学习Python语言的最好教材及参考手册。所附光盘包括Python语言最新的三个版本及书中示例代码。
5.《Python算法教程》
Python算法教程用Python语言来讲解算法的分析和设计。本书主要关注经典的算法,但同时会为读者理解基本算法问题和解决问题打下很好的基础。全书共11章。分别介绍了树、图、计数问题、归纳递归、遍历、分解合并、贪心算法、复杂依赖、Dijkstra算法、匹配切割问题以及困难问题及其稀释等内容。本书在每一章结束的时候均有练习题和参考资料,这为读者的自我检查以及进一步学习提供了较多的便利。在全书的结尾,给出了练习题的提示,方便读者进行查漏补缺。
E. Python中networkx中shortest_path使用的是哪一种最短路径方法
不全是。依据传入的参数决定调用哪种算法。
看源码:至少涉及了dijkstra、广度优先/深度优先算法。
ifsourceisNone:
iftargetisNone:
##Findpathsbetweenallpairs.
ifweightisNone:
paths=nx.all_pairs_shortest_path(G)
else:
paths=nx.all_pairs_dijkstra_path(G,weight=weight)
else:
##Findpathsfromallnodesco-accessibletothetarget.
directed=G.is_directed()
ifdirected:
G.reverse(=False)
ifweightisNone:
paths=nx.single_source_shortest_path(G,target)
else:
paths=nx.single_source_dijkstra_path(G,target,weight=weight)
#.
fortargetinpaths:
paths[target]=list(reversed(paths[target]))
ifdirected:
G.reverse(=False)
else:
iftargetisNone:
##.
ifweightisNone:
paths=nx.single_source_shortest_path(G,source)
else:
paths=nx.single_source_dijkstra_path(G,source,weight=weight)
else:
##Findshortestsource-targetpath.
ifweightisNone:
paths=nx.bidirectional_shortest_path(G,source,target)
else:
paths=nx.dijkstra_path(G,source,target,weight)
F. 程序员9个不良编程习惯
我们曾经都做过这样的事情:当妈妈不注意的时候,偷偷地吃糖果零食,然后导致有了蛀牙。同样的,我们都违背过一些编程的基本规则,并且都会坚定地表示这种行为是不可取的。但我们就是偷偷爱着这些不良的编程习惯。
我们对所谓的编程规则嗤之以鼻,输出的代码也很糟糕——但我们依然活着。编程上帝没有下闪电劈死我们,我们的电脑也没有爆炸。事实上,只要我们能编译和发布代码,客户似乎就很满意了。
这是因为糟糕的编程不像安装电路或者摸老虎屁股那样有直接的危害性。大多数时间里它也是可以工作的。规则通常是作为一种指导或格式上的建议,并没有硬性规定一定要遵守,也不会导致代码马上死掉。当然,你的代码可能会被人耻笑,甚至可能大家公开嘲笑你,不过,这种挑战惯例的行为可以让人增加一点颠覆传统的快感,哪怕是在不经意间。
为了让问题变得更加复杂,有时候违反规则反而更好。(一般人我不告诉他!)出来的代码会更干净,甚至可能会更快和更简单。规则通常显得太过于宽泛,有技巧的程序员可以通过打破这些规则来提高代码。不要告诉你的老板,这对你的编码生涯会很有意义。
下面这9个编码习惯,虽然在编程规则中是被驳斥的,但我们很多人就是会不由自主地使用它们。
编程习惯No.1:使用goto
关于禁止使用goto可以追溯到许多结构化编程工具还未面世的时代。如果程序员想要创建一个循环或跳到另一段程序中,那么他们需要输入goto后再跟一个行号。过了几年之后,编译器团队让程序员使用字符串标签取代行号。这在当时被认为是一个热门的新功能。
有的人认为这会导致“意大利面条式代码”。代码会变得不可读,并且很难理解代码的执行路径。线程混乱,缠缠绵绵到天涯。Edsger
Dijkstra就三令五申地表示应该禁止这个命令,他有一份诙谐的手稿,题目为《Goto语句害人不浅》。
但绝对的分支是没有问题的。这就让人纠结了。通常,巧妙的break语句和return
语句可提供一个非常干净的关于代码在那个时候执行什么的声明。有时候,添加goto
到case语句会比更恰当的多级嵌套的if-then-else语句块更易于理解。
也有反例。在苹果的SSL堆栈中的“goto
fail”安全漏洞就是最好的例子之一。但是,如果我们能够仔细避免case语句和循环的一些尴尬问题,那么我们就可以嵌入良好的绝对转移,使阅读代码的人更容易明白这是怎么回事。我们可以插入break和return
语句,让每一个人感觉更清洁和更愉快——可能得除了goto的敌视者。
编程习惯No.2:成功避开文档
我的一个朋友有一个非常精明的老板,这位老板虽然从来没有写过任何代码,但却秉持着每一个功能都必须包含在文档中的理念。哪个程序员不提供注释,那么他就会受到惩罚。所以,我的朋友在他的编辑器中联入了一个有点像人工智能的玩意儿,于是乎,他的每一个功能就都有几行“文档”了。因为这位精明的老板还不够聪明到能理解这些注释其实啥意思也没有,所以我的朋友逃过一劫。他的代码常常被作为正式文档。我想,他应该快要升职了!
许多函数方法,甚至一些类或多或少都能自文档化。冠以insertReservation或cancelReservation或deleteAll
等名称的函数并不需要多此一举来解释它们的作用。为函数取一个正确的名字往往就足够了。事实上,这比写一段长长的注释要好,因为函数名可以出现在代码中的其他地方。而文档只能默默地呆在某个角落。自文档化的函数名可以改进它们出现的每个文件。
在有些情况下,写文档甚至会导致情况变糟。例如,当代码瞬息万变,团队像疯了似的重构的时候,文档会产生分歧。代码是这样写的,但文档解释的还是四五个版本以前的情况。这类“过时”的文档通常位于代码顶部,有的人会在这里对代码应该发生什么作一个美好总结。因此,尽管重构团队已经仔细修改了相关的注释,但还是会遗漏文件顶部的这段“美好总结”。
当代码和文本出现分歧的时候,注释就变得毫无价值,甚至会产生误导。在这样的情况下,良好的自文档化的代码显然胜出了。
编程习惯No.3:一行写太多代码
老板突然发神经地给团队发了一封讨厌的邮件:为了执行非常严格的风格规定,我们大家都必须重写我们的代码。最神奇的要求是:每个行为或步骤或子句必须各自成行。你不能使用点语法连续调用函数。在一个分支语句中,你不能有两个及以上返回布尔值的子句。如果要定义变量,那么另起一行。如果你正在做一个复杂的计算,那么不要使用括号。每个片段也自成一行。
他认为他的这个法令将能使调试变得更加容易。就像你单步调试代码一样,调试器会一个动作一个动作地前进。这样就不会卡在某一行。而且更容易执行。
但是这样一来,键盘上的回车键烦不胜烦,因为我需要不断地插入行。而且我敢肯定,老板因此还可以到处吹嘘他的团队能写多少行代码。
唉,有时在同一行中声明一堆变量反而更容易;有时把所有的布尔子句放在一起反而更简单——一切都能变得更加紧凑。那也意味着,我们可以在屏幕上看到更多的逻辑而无需滚动鼠标。更易于阅读就意味着理解起来更快。这才是简单的精粹。
编程习惯No.4:不声明类型
那些热爱类型化语言的人认为,如果为每个变量添加明确的数据类型声明,就可以写出更好的、没有错误的代码。花一点时间来拼写类型,能帮助编译器在代码开始运行之前标志愚蠢的错误。可能会让人觉得痛苦,但很有帮助。这是编程中停止bug的一种有备无患的方法。
但是时代变了。许多较新的编译器完全可以智能地通过查看代码来推断类型。它们会向后和向前浏览代码,直到可以肯定这个变量是string
还是int,抑或其他。如果这些被查看的类型不成队列,那么错误标志就会点亮。因此再也不需要我们输入变量的类型了。
这意味着我们现在可以在代码中省略掉一些最简单的声明。代码更清洁,而且阅读代码的人也猜得出for循环中命名为i的变量表示一个整数型。
编程习惯No.5:摇摆不定的代码
有的程序员在代码上特别优柔寡断,犹豫不决。先是一开始将值存储为字符串,然后又解析成整数。接着又转换回字符串。这是非常低效的,你甚至可以感觉到CPU在咆哮这种浪费负载的行为。聪明的程序员之所以能快速地编码,是因为他们事先会设计架构,以尽量减少转换。他们的代码能更快地运行是因为他们有一个良好的规划。
但是,不管你信不信,这种摇摆不定的代码有时候也是有意义的。比如说,你有一个非常棒的库,在它专有的黑盒子里能做无数智能的事情。如果库需要字符串的数据,那么你就给它字符串,即使你刚将这个数据转换成为整数型。
当然,你可以重写所有的代码,以尽量减少转换,但是这需要时间。而且,有时候让代码稍微多花点额外时间来运行也未尝不可,因为重写代码需要耗费我们更多的时间。有时,背负这样的技术债务比一开始就正确构建的成本要更低。
有的时候,库不是专有的代码,但那些你以前全部自己写的代码是你独有的。有的时候,再次转换数据比重写库中的所有代码要快得多。所以,就让它这样吧,就让代码摇摆吧。
编程习惯No.6:编写你自己的数据结构
有一个标准规则是,程序员在完成数据结构课程的第二年,不应该写用于存储数据的代码。基本上我们需要的所有的数据结构,已经有人写好了,而且其代码已历经多年的测试和再测试。它和语言捆绑在一起,而且常常是免费的。你的代码只能造就bug。
但有时你会发现数据结构库有点慢。有时它们会迫使我们使用标准的,但于我们的代码却是错误的结构。有时库会把我们推向在使用结构之前重新配置数据的地步。有时库会包含一些所谓有备无患的保护功能,如线程锁,但其实我们的代码并不需要。
如果遇到这种情况,那么就应该着手写我们自己的数据结构。这或许能让你做得更快,做得更多。而且代码会变得更清洁,因为我们不会包括那些多余的用于格式化数据来完成一些功能的代码。
编程习惯No.7:在中间打破循环
有一个规则制定小组宣称,每个循环都应该有一个“常量”,也就是说当这个逻辑语句为true的时候,循环一直执行。当常量一定不会是true的时候,循环才会结束。这是考虑复杂循环的好方法,但它会导致愚蠢的禁令——例如禁止我们在循环中间使用return
和break语句。这一条也包含在禁止goto语句的规则中。
这个理论是好的,但它通常会导致更复杂的代码。请看下面这个简单的案例,遍历数组,将找到的元素传递给test函数,并将该元素返回:
while(i
...
if(test(a[i])thenreturna[i];
...
}
“循环常量”爱好者会要求我们增加一个布尔变量,命名为notFound,然后这样使用:
while((notFound)&&(i
...
if(test(a[i]))thennotFound=false;
...
}
如果这个布尔值能够合理地命名,那么这就是一段很棒的自文档化的代码,更易于大家理解。但这也增加了复杂性。这意味着你需要分配另一个局部变量,并堵塞寄存器,因为编译器也许还不能足够智能到解决这个问题。
有时候,一个goto语句或一个跳转会更干净利索。
编程习惯No.8:使用短变量名(i和x和and也是有意义的)
EdgarAllan
Poe这位诗人和小说家曾经说过,在一个故事中的每一个词都应该是有内涵的。编码规则也强调如此。变量名应该说明这个变量的所作所为。那些使用驼峰式大小写的方法来写变量名,以表达关于变量细节的Java程序员深以为然,于是一个又一个疯狂长度的变量名出炉了。有些程序员写的变量名,会组合五六个甚至更多的词语。
但有的时候,使用单个字母作为变量名反而会更方便。有时在循环迭代中只使用i或j会更简单。有时使用字母a代表array
,l代表list会更便捷,即使是字母l和数字1看上去很难辨别。
正如这篇文章前面鼓励的是自文档化的代码,而非长长的注释。在上述情况下,单个字母的变量名也是自文档化的。字母i
是通用的迭代器。只要是程序员立刻就会懂。
编程习惯No.9:重新定义运算符和函数
一些最有趣的编程语言允许你去做一些特别诡异的事情,例如重新定义元素的值,就如同常量一般。例如Python,你可以输入TRUE=FALSE(在Version2.7及之前的版本)。这并不会产生某种逻辑崩溃,或导致宇宙终结——仅仅只是互换了TRUE和FALSE的含义。你也可以在C预处理器和一些其他语言中玩玩类似于这样的危险游戏。还有一些语言允许你重新定义运算符,如加号。
当然这是延伸了,不过有一个观点是,在一个大的代码块内,当重新定义一个或多个所谓的常量时,速度会更快。有时老板会要求代码做一些截然不同的事情。当然,你可以修改代码的每个事件,或者,你可以重新定义。这让你看上去像一个天才。不必重写一个庞大的库,只需翻转一下,就可以做相反的事情了。
这9个习惯就都在这儿了。千万不要轻易尝试,不管它看上去有多牛掰。太危险了——真的,这是实话。
G. 自然语言处理(NLP)的基础难点:分词算法
自然语言处理(NLP,Natural Language Processing)是人工智能领域中的一个重要方向,主要研究人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理的底层任务由易到难大致可以分为词法分析、句法分析和语义分析。分词是词法分析(还包括词性标注和命名实体识别)中最基本的任务,也是众多NLP算法中必不可少的第一步,其切分准确与否往往与整体结果息息相关。
金融领域分词的难点
分词既简单又复杂。简单是因为分词的算法研究已经很成熟了,大部分的算法(如HMM分词、CRF分词)准确率都可以达到95%以上;复杂则是因为剩下的5%很难有突破,主要可以归结于三点:
▲粒度,即切分时的最小单位,不同应用对粒度的要求不一样,比如“融资融券”可以是一个词也可以是两个词
▲歧义,比如“恒生”一词,既可指恒生公司,又可指恒生指数
▲未登录词,即未出现在算法使用的词典中的词,比如不常见的专业金融术语,以及各种上市公司的名称
在金融领域中,分词也具有上述三个难点,并且在未登录词方面的难点更为突出,这是因为金融类词汇本来就多,再加上一些专有名词不仅有全称还有简称,这就进一步增大了难度。
在实际应用中,以上难点时常会造成分词效果欠佳,进而影响之后的任务。尤其是在一些金融业务中,有许多需要与用户交互的场景,某些用户会用口语化的词汇描述业务,如果分词错误会影响用户意图的解析,这对分词的准确性提出了更高的要求。因此在进行NLP上层应用开发时,需要对分词算法有一定的了解,从而在效果优化时有能力对分词器进行调整。接下来,我们介绍几种常用的分词算法及其应用在金融中的优劣。
几种常见的分词算法
分词算法根据其核心思想主要分为两种:
第一种是基于字典的分词,先把句子按照字典切分成词,再寻找词的最佳组合方式,包括最大匹配分词算法、最短路径分词算法、基于N-Gram model的分词算法等;
第二种是基于字的分词,即由字构词,先把句子分成一个个字,再将字组合成词,寻找最优的切分策略,同时也可以转化成序列标注问题,包括生成式模型分词算法、判别式模型分词算法、神经网络分词算法等。
最大匹配分词寻找最优组合的方式是将匹配到的最长词组合在一起,主要的思路是先将词典构造成一棵Trie树(也称为字典树),Trie树由词的公共前缀构成节点,降低了存储空间的同时可以提升查找效率。
最大匹配分词将句子与Trie树进行匹配,在匹配到根结点时由下一个字重新开始进行查找。比如正向(从左至右)匹配“他说的确实在理”,得出的结果为“他/说/的确/实在/理”。如果进行反向最大匹配,则为“他/说/的/确实/在理”。
这种方式虽然可以在O(n)时间对句子进行分词,但是只单向匹配太过绝对,尤其是金融这种词汇较丰富的场景,会出现例如“交易费/用”、“报价单/位”等情况,所以除非某些词的优先级很高,否则要尽量避免使用此算法。
最短路径分词算法首先将一句话中的所有词匹配出来,构成词图(有向无环图DAG),之后寻找从起始点到终点的最短路径作为最佳组合方式,例:
我们认为图中每个词的权重都是相等的,因此每条边的权重都为1。
在求解DAG图的最短路径问题时,总是要利用到一种性质:即两点之间的最短路径也包含了路径上其他顶点间的最短路径。比如S->A->B->E为S到E到最短路径,那S->A->B一定是S到B到最短路径,否则会存在一点C使得d(S->C->B)<d(S->A->B),那S到E的最短路径也会变为S->C->B->E,这就与假设矛盾了。利用上述的最优子结构性质,可以利用贪心算法或动态规划两种求解算法:
(1)基于Dijkstra算法求解最短路径,该算法适用于所有带权有向图,求解源节点到其他所有节点的最短路径,并可以求得全局最优解;
(2)N-最短路径分词算法,该方法是对Dijkstra算法的扩展,在每一步保存最短的N条路径,并记录这些路径上当前节点的前驱,在最后求得最优解时回溯得到最短路径。这种方法的准确率优于Dijkstra算法,但在时间和空间复杂度上都更大。
相较于最大匹配分词算法,最短路径分词算法更加灵活,可以更好地把词典中的词组合起来,能更好地解决有歧义的场景。比如上述“他说的确实在理”这句话,用最短路径算法的计算结果为“他/说/的/确实/在理”,避免了正向最大匹配的错误。但是对于词典中未存在的词基本没有识别能力,无法解决金融领域分词中的“未登录词”难点。
N-Gram(又称N元语法模型)是基于一个假设:第n个词出现与前n-1个词相关,而与其他任何词不相关。在此种假设下,可以简化词的条件概率,进而求解整个句子出现的概率。
现实中,常用词的出现频率或者概率肯定比罕见词要大。因此,可以将求解词图最短路径的问题转化为求解最大概率路径的问题,即分词结果为“最有可能的词的组合“。
计算词出现的概率,仅有词典是不够的,还需要充足的语料,所以分词任务已经从单纯的“算法”上升到了“建模”,即利用统计学方法结合大数据挖掘,对“语言”(句子出现的概率)进行建模。
我们将基于N-gram模型所统计出的概率分布应用到词图中,可以得到词的概率图。对该词图用最短路径分词算法求解最大概率的路径,即可得到分词结果。
相较于前两种分词算法,基于N-Gram model的分词算法对词频进行了统计建模,在切分有歧义的时候力求得到全局最优值,比如在切分方案“证券/自营/业务”和“证券/自/营业/务”中,统计出“证券/自营/业务”出现的概率更大,因此结果有更高的准确率。但也依然无法解决金融场景中未登录词的问题。
生成式模型主要有隐马尔可夫模型(HMM,Hidden Markov Model)、朴素贝叶斯分类等。HMM是常用的分词模型,基于Python的jieba分词器和基于Java的HanLP分词器都使用了HMM。
HMM模型认为在解决序列标注问题时存在两种序列,一种是观测序列,即人们显性观察到的句子,另一种是隐状态序列,即观测序列的标签。假设观测序列为X,隐状态序列是Y,则因果关系为Y->X。因此要得到标注结果Y,必须对X的概率、Y的概率、P(X|Y)进行计算,即建立P(X,Y)的概率分布模型。
HMM算法可以在一定程度上解决未登录词的问题,但生成式模型的准确率往往没有接下来要谈到的判别式模型高。
判别式模型主要有感知机、支持向量机(SVM,Support Vector Machine)、条件随机场(CRF,Conditional Random Field)、最大熵模型等,其中感知机模型和CRF模型是常用的分词模型。
(1)平均感知机分词算法
感知机是一种简单的二分类线性模型,通过构造超平面,将特征空间(输入空间)中的样本分为正负两类。通过组合,感知机也可以处理多分类问题。但由于每次迭代都会更新模型的所有权重,被误分类的样本会造成很大影响,因此采用平均的方法,在处理完一部分样本后对更新的权重进行平均。
(2)CRF分词算法
CRF可以看作一个无向图模型,假设给定的标注序列为Y,观测序列为X,CRF对条件概率P(Y|X)进行定义,而不是对联合概率建模。
平均感知机算法虽然速度快,但仍不够准确。适合一些对速度要求高、对准确性要求相对不那么高的场景。CRF分词算法可以说是目前最常用的分词、词性标注和实体识别算法,它对未登陆词也有很好的识别能力,是目前在速度、准确率以及未登录词识别上综合表现最突出的算法,也是我们目前所采用的解决方案,但速度会比感知机慢一些。
在NLP中,最常用的神经网络为循环神经网络(RNN,Recurrent Neural Network),它在处理变长输入和序列输入问题中有着巨大的优势。LSTM(Long Short-Term Memory,长短期记忆网络)为RNN变种的一种,在一定程度上解决了RNN在训练过程中梯度消失和梯度爆炸的问题。
目前对于序列标注任务,业内公认效果最好的模型是BiLSTM+CRF。相比于上述其它模型,双向循环神经网络BiLSTM,可以更好地编码当前字等上下文信息,并在最终增加CRF层,核心是用Viterbi算法进行解码,以得到全局最优解,避免B,S,E这种不可能的标记结果的出现,提高准确率。
神经网络分词虽然能在准确率、未登录词识别上有更好的表现,但RNN无法并行计算,在速度上没有优势,所以该算法通常在算法研究、句子精确解析等对速度要求不高的场景下使用。
分词作为NLP底层任务之一,既简单又重要,很多时候上层算法的错误都是由分词结果导致的。因此,对于底层实现的算法工程师,不仅需要深入理解分词算法,更需要懂得如何高效地实现和调试。
而对于上层应用的算法工程师,在实际分词时,需要根据业务场景有选择地应用上述算法,比如在搜索引擎对大规模网页进行内容解析时,对分词对速度要求大于精度,而在智能问答中由于句子较短,对分词的精度要求大于速度。
H. 求助Python大神!
这是图论中经典的求最短路径问题,已经有很多基础算法和实现。你可以直接搜
Dijkstra算法与Floyd算法,python实现也有很多,很容易搜到。
I. 如何使用QGIS里面的python编程求最优路线
题主:
你的问题描述不是很详尽。
比如,你所说的最短路径,是直线还是沿道路的最短路径。如果是后者这个稍微麻烦些,并需要补充路网数据。如是直线距离最短,那么,你所需求的是以最短路径走访完所有农户(以居委会为起点),还是每户至居委会的距离最短(两点间直线距离)。还有就是GIS文件的属性表和你的EXCEL表格的关系...
所以,如你题中所说,建议你现在做的有以下几件事:
①明确要目标到底是什么,就如上面所说的一样;
②对于每一户(包括居委会),你还需获取其坐标(X/Y),这个在GIS软件中易获取;
③将excel数据连接至属性表中。
最后,你这个项目要解决的问题有Dijkstra、Floyd、A*等算法可用。但是具体用哪一种还需根据问题进行优选...
希望对你有所帮助!!!