python遍历文件目录

发布时间: 2023-06-15 12:04:04

import os
import os.path
rootdir = “d:\data” # 指明被遍历的文件夹

for parent,dirnames,filenames in os.walk(rootdir): #三个参数：分别返回1.父目录 2.所有文件夹名字（不含路径） 3.所有文件名字
for dirname in dirnames: #输出文件夹信息
print "parent is:" + parent
print "dirname is" + dirname

for filename in filenames: #输出文件信息
print "parent is": + parent
print "filename is:" + filename
print "the full name of the file is:" + os.path.join(parent,filename) #输出文件路径信息

#windows下为：d:\data\query_text\EL_00154

② python怎么用递归遍历多层目录树

#coding=utf-8
search_id = '69d0'
search_list = [{'id':'0337', 'name':'de', 'parent_id':'None'},
{'id':'2ddf', 'name':'se', 'parent_id':'None'},
{'id':'3010', 'name':'12', 'parent_id':'69d0'},
{'id':'3119', 'name':'121', 'parent_id':'3010'},
{'id':'3229', 'name':'1211', 'parent_id':'3119'},
{'id':'3d37', 'name':'14', 'parent_id':'69d0'},
{'id':'58c8', 'name':'11', 'parent_id':'69d0'},
{'id':'63b9', 'name':'a','parent_id':'None'},
{'id':'954c', 'name':'n', 'parent_id':'63b9'},
{'id':'69d0', 'name':'1', 'parent_id':'954c'},
{'id':'d2f9', 'name':'13', 'parent_id':'69d0'},
{'id':'defb', 'name':'test', 'parent_id':'None'}]
search_ids = []
#例如如果search_id = '69d0' search_ids=[3010,3d37,58c8,d2f9,3119,3229]

def search_pid(pid,id_list,id_results):
for id in id_list:
if id['id'] not in id_results:
if id['parent_id'] in pid:
id_results.append(id['id'])
pid.append(id['id'])
search_pid(pid,id_list,id_results)

search_pid([search_id],search_list,search_ids)
print search_ids

③ Python中如何遍历指定目录下的所有文件

例如：在C:\TDDOWNLOAD目录下有a.txt、b.txt两个文件，另有\sub1子文件夹，C:\TDDOWNLOAD\sub1下又有c.txt、d.txt两个文件。
1.
os.walk
os.walk()返回一个三元素的tuple：当前路径、子文件夹名称、文件列表。>>>
import
os>>>
def
fun(
path
):...
for
root,
dirs,
files
in
os.walk(
path
):...
for
fn
in
files:...
print
root,
fn...
>>>
fun(
r'C:\TDDOWNLOAD'
)C:\TDDOWNLOAD
a.txtC:\TDDOWNLOAD
b.txtC:\TDDOWNLOAD\sub1
c.txtC:\TDDOWNLOAD\sub1
d.txt>>>
2.
glob.glob
glob.glob()只接受一个参数，这个参数既代有路径，又代有匹配模式，返回值为一个列表。注意，glob.glob()无法直接穿透子文件夹，需要自己处理：>>>
def
fun(
path
):...
for
fn
in
glob.glob(
path
+
os.sep
+
'*'
):
#
'*'代表匹配所有文件...
if
os.path.isdir(
fn
):
#
如果结果为文件夹...
fun(
fn
)
#
递归...
else:...
print
fn...
>>>
fun(
r'C:\TDDOWNLOAD'
)C:\TDDOWNLOAD\a.txtC:\TDDOWNLOAD\b.txtC:\TDDOWNLOAD\sub1\c.txtC:\TDDOWNLOAD\sub1\d.txt>>>
'*'为匹配模式，代表匹配所有文件，只有这样才能将子文件夹查出来，以便递归深入，探查下一层的文件。

④ python遍历目录就是这么简单

有时我们有列出目录下都有哪些文件和子目录的需求，这种情况是有现成命令可用的，比如windows下的dir命令，linux下的ls命令都可以，那我们用python代码怎么实现呢？

我们利用python丰富的库很容易就能实现一个简易版本，下面我们就用4种方法来实现它。

一、使用os.popen

os.popen工作原理是新建一个子进程，然后用这个子进程执行命令，父进程与子进程间通过管道进行通信。

根据调用popen时的传参，我们可以通过管道读取子进程的输出也可以向子进程写数据，默认是读取子进程的输出。

从以上描述可以看出popen是非常通用的，不是只能用于我们这个例子哦。

那我们开始用它实现我们的需求吧，代码如下：

哈哈，是不是很简单，这种方式虽然能达到目的但其实并不是我们想要的，我们本来就是要实现ls的，结果调用了ls，所以严格意义上来说我们并没有实现ls，那让我们继续往下看其它方法吧，嘿嘿。

二、使用glob.glob

glob可以根据你使用的通配符对文件进行匹配，利用这个特性我们可以列出当前目录下都有哪些文件和子目录，如下代码：

三、使用os.listdir

os.listdir同样可以列出某个目录下都有哪些文件和子目录，如下代码：

四、使用os.walk

os.walk在遍历目录方面非常强大，它不但可以遍历你需要的目录，也可以递归遍历子目录且递归的深度可以用代码控制，下面让我们分别看下怎么遍历整个目录树以及怎么控制深度吧。

os.walk默认是遍历整个目录树的，如下代码就会递归打印出当前目录下所有文件：

那我们怎么控制遍历的深度，比如只遍历n层呢？其实很简单，只需要定义一个深度变量，然后到达n后跳出循环即可，如下代码就只遍历1层：

至此我们已经写完4种方法了，如果你还有其他方法，欢迎评论交流。

⑤ 如何用python遍历文件夹下的所有excel文件

大数据处理经常要用到一堆表格，然后需要把数据导入一个list中进行各种算法分析，简单讲一下自己的做法：

1.如何读取excel文件

网上的版本很多，在xlrd模块基础上，找到一些源码：

[python]view plain

importxdrlib,sys
importxlrd
defopen_excel(file="C:/Users/flyminer/Desktop/新建MicrosoftExcel工作表.xlsx"):
data=xlrd.open_workbook(file)
returndata
#根据索引获取Excel表格中的数据参数:file：Excel文件路径colnameindex：表头列名所在行的所以，by_index：表的索引
defexcel_table_byindex(file="C:/Users/flyminer/Desktop/新建MicrosoftExcel工作表.xlsx",colnameindex=0,by_index=0):
data=open_excel(file)
table=data.sheets()[by_index]
nrows=table.nrows#行数
ncols=table.ncols#列数
colnames=table.row_values(colnameindex)#某一行数据
list=[]
forrownuminrange(1,nrows):
row=table.row_values(rownum)
ifrow:
app={}
foriinrange(len(colnames)):
app[colnames[i]]=row[i]
list.append(app)
returnlist
#根据名称获取Excel表格中的数据参数:file：Excel文件路径colnameindex：表头列名所在行的所以，by_name：Sheet1名称
defexcel_table_byname(file="C:/Users/flyminer/Desktop/新建MicrosoftExcel工作表.xlsx",colnameindex=0,by_name=u'Sheet1'):
data=open_excel(file)
table=data.sheet_by_name(by_name)
nrows=table.nrows#行数
colnames=table.row_values(colnameindex)#某一行数据
list=[]
forrownuminrange(1,nrows):
row=table.row_values(rownum)
ifrow:
app={}
foriinrange(len(colnames)):
app[colnames[i]]=row[i]
list.append(app)
returnlist
defmain():
tables=excel_table_byindex()
forrowintables:
print(row)
tables=excel_table_byname()
forrowintables:
print(row)
if__name__=="__main__":
main()
最后一句是重点，所以这里也给代码人点个赞！

最后一句让代码里的函数都可以被复用，简单地说：假设文件名是a，在程序中import a以后，就可以用a.excel_table_byname()和a.excel_table_byindex()这两个超级好用的函数了。

2.然后是遍历文件夹取得excel文件以及路径：，原创代码如下：

[python]view plain

importos
importxlrd
importtest_wy
xpath="E:/唐伟捷/电力/电力系统总文件夹/舟山电力"
xtype="xlsx"
typedata=[]
name=[]
raw_data=[]
file_path=[]
defcollect_xls(list_collect,type1):
#取得列表中所有的type文件
foreach_elementinlist_collect:
ifisinstance(each_element,list):
collect_xls(each_element,type1)
elifeach_element.endswith(type1):
typedata.insert(0,each_element)
returntypedata
#读取所有文件夹中的xls文件
defread_xls(path,type2):
#遍历路径文件夹
forfileinos.walk(path):
foreach_listinfile[2]:
file_path=file[0]+"/"+each_list
#os.walk()函数返回三个参数：路径，子文件夹，路径下的文件，利用字符串拼接file[0]和file[2]得到文件的路径
name.insert(0,file_path)
all_xls=collect_xls(name,type2)
#遍历所有type文件路径并读取数据
forevey_nameinall_xls:
xls_data=xlrd.open_workbook(evey_name)
foreach_sheetinxls_data.sheets():
sheet_data=test_wy.excel_table_byname(evey_name,0,each_sheet.name)
#请参考读取excel文件的代码
raw_data.insert(0,sheet_data)
print(each_sheet.name,":Datahasbeendone.")
returnraw_data
a=read_xls(xpath,xtype)
print("Victory")
欢迎各种不一样的想法~~

⑥ Python其实很简单第十六章目录管理

为实现“按名存取”，必须建立文件名与辅存空间中物理地址的对应关系，体现这种对应关系的数据结构称为文件目录。文件目录表目至少要包含文件名、文件的类型、文件的长度、访问权限、建立时间、访问时间和文件存储地址等内容。通过前面一章的介绍，我们已经知道在文件信息中已经包含了文件名、文件类型访问权限等信息，而存储地址的信息则包含在目录信息中。

16.1路径

路径通常用一个字符串来表示，可以按照路径信息定位到一个目录或文件。如：“C:UsersAdministratorPictures1.jpg”这个信息可以非常方便的找到这个图片文件，“C:UsersAdministratorPictures”这个信息可以帮助我们找到更多的图片文件。

这里所说的“路径”和上网时碰到的“地址”含义比较相似，互联网就相当于将个人电脑可以访问的范围扩大了，互联网中的地址也是对应某一个存储空间的路径，按照地址可以访问互联网上的信息，就如同按照路径可以找到计算机中的文件一样。

在Python中，可以导入 os模块 来进行目录操作。

1、获取当前工作目录getcwd()函数

例：

import os

print(os.getcwd())

运行结果：

这个路径是当前Python IDLE所在的地址。

2、获取文件的绝对路径abspath()函数

abspath()函数是os模块的子模块path提供的一个函数。用法举例如下：

import os

print(os.path.abspath(r'test.txt'))

运行结果：

C: est.txt

16.2 目录操作类函数

1、判断目录是否存在exists()函数

exists()函数是os模块的子模块path中的函数。使用方法举例如下：

import os

print(os.path.exists(r'C:UsersAdministratorPictures1.jpeg'))

输出结果：

True

2、创建目录mkdir()函数和makedirs()函数

mkdir()函数和makedirs()函数都是由os模块提供的，下面举例说明用法和区别。

例1：

import os

path='d:test'

if not os.path.exists(path):

os.makedirs(path)

print('该文件目录创建成功！')

如果目录d: est已存在，则不再创建；若不存在，则创建。

例2：

import os

path='d:testtest1test11'

if not os.path.exists(path):

os.makedirs(path)

print('该文件目录创建成功！')

虽然目录d: est已存在，但可以在其下继续创建子目录。上面的代码可以成功地创建d: est est1 est11目录。

mkdir()函数和makedirs()函数用法基本一样，不同之处在于mkdir()函数只能能创建一级目录。

3、删除目录函数rmdir()函数

rmdir()函数是由os模块提供的。

例如：通过上面的例子已经建立了d: est est1 est11目录，现在去删除子目录test11（此子目录为空目录），代码如下：

import os

os.rmdir('d:testtest1test11')

如果要删除的目录非空（其下还包含有文件或文件夹），则不能删除，并且出现Windows文件操作错误的提示（Python是调用操作系统命令完成文件和目录操作的）。譬如d: est目录下含有有子目录，则不能对其进行如下删除操作。

import os

os.rmdir('d:test')

此时，会出现如下错误提示：

Traceback (most recent call last):

File "C:/Users/zym/AppData/Local/Programs/Python/Python39/4.py", line 10, in

os.rmdir('d:test')

OSError: [WinError 145] 目录不是空的。: 'd:test'

4、删除非空目录函数rmtree()函数

rmtree()函数是由Python内置的标准模块shutil提供的，可以删除目录及目录下的文件和子目录。如删除d: est目录及其下的子目录和文件，可用如下代码：

import shutil

shutil.rmtree('d:test')

5、遍历目录walk()函数

walk()函数是由os模块提供的。

语法格式：

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

其中，top是所要遍历的目录的地址；topdown为可选参数，为 True时自上而下遍历目录，为False时自下而上遍历目录，默认值为True；onerror为可选参数，用于指定异常处理方式，默认为忽略；followlinks为可选参数，如果为 True，则会遍历目录下的快捷方式(linux 下是软连接 symbolic link )实际所指的目录(默认关闭)，如果为 False，则优先遍历 top 的子目录。

该函数的返回值为一个三元组(root,dirs,files)。root 所指的是当前正在遍历的这个文件夹的本身的地址；dirs 是一个 list ，内容是该文件夹中所有的目录的名字(不包括子目录)；files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)。

例：遍历d: est目录及其子目录下的所有子目录和文件：

import os

path='d:test'

tups=os.walk(path) # 函数walk()的返回值为三元组

for root,dirs,files in tups: # 遍历这个三元组

for name in dirs: #遍历存放目录值的元组

print('dir：',os.path.join(root,name))

for name in files: #遍历存放文件名值的元组

print('file：',os.path.join(root,name))

运行结果如下：

dir： d: est est1

dir： d: est est1 est11

dir： d: est est1新建文件夹

file： d: est est1新建文本文档.txt

file： d: est est1 est11新建文本文档.txt

⑦ python或者bat怎么遍历文件夹下所有文件和文件夹然后修改后缀

先遍历所有文件：

fromosimportwalk

f=[]
for(dirpath,dirnames,filenames)inwalk(mypath):
f.extend(filenames)
break

⑧ 求教python怎么遍历指定文件

监控目录 -- 分两个部分: 1. 扫描目录文件, 保持当前状态数据; 2. 状态数据的比较



importos
importfnmatch


defgetfileinfo(filename):
(mode,ino,dev,nlink,
uid,gid,size,atime,mtime,ctime)=os.stat(filename)
returndict(
modifytime=mtime,
createtime=ctime,
size=size,
)


classDirectoryMonitor(object):

def__init__(self,path,fnexp="*.*"):
self.path=path
self.fnexp=fnexp
self.files={}
self.scan()

defscan(self):
currentfiles={}
forpath,dirs,filesinos.walk(self.path):
forfinfnmatch.filter(files,self.fnexp):
fullname=os.path.join(path,f)
currentfiles[fullname]=getfileinfo(fullname)
lastfiles=self.files
self.files=currentfiles
returnself.check(lastfiles,currentfiles)

@staticmethod
defcheck(lastfiles,currfiles):
monitor={}
newer={}
forfinset(currfiles)-set(lastfiles):
newer[f]=currfiles[f]
ifnewer:
monitor["newer"]=newer
deleted={}
forfinset(lastfiles)-set(currfiles):
deleted[f]=lastfiles[f]
ifdeleted:
monitor["deleted"]=deleted
changed={}
forfinset(lastfiles)&set(currfiles):
iflastfiles[f]!=currfiles[f]:
changed[f]=currfiles[f]
ifchanged:
monitor["changed"]=changed
returnmonitor


deftester():
importtime
dm=DirectoryMonitor(r"/home/tim/data","*.txt")
time.sleep(20)
m=dm.scan()
ifm:
printm


if__name__=="__main__":
tester()

⑨ python如何遍历当前目录下所有文件,并输出后缀不为 py的文件名称

#coding=utf-8
'''
Created on 2014-11-14

@author: Neo
'''
import os

def GetFileList(dir, fileList):
newDir = dir
if os.path.isfile(dir):
fileList.append(dir.decode('gbk'))
elif os.path.isdir(dir):
for s in os.listdir(dir):
#如果需要忽略某些文件夹，使用以下代码
#if s == "xxx":
#continue
newDir=os.path.join(dir,s)
GetFileList(newDir, fileList)
return fileList

list = GetFileList('D:\\workspace\\PyDemo\\fas', [])
for e in list:
print e

阅读全文

热点内容

锐志哪个配置性价比最高发布：2025-02-12 17:38:43 浏览：917

智能推送算法发布：2025-02-12 17:38:41 浏览：834

拍照上传器发布：2025-02-12 17:34:29 浏览：651

androidweb框架发布：2025-02-12 17:32:45 浏览：75

安卓编程贺卡发布：2025-02-12 17:32:44 浏览：838

php获取数据库的字段发布：2025-02-12 17:29:02 浏览：766

服务器地址消失发布：2025-02-12 17:23:36 浏览：951

后台执行php脚本发布：2025-02-12 17:21:45 浏览：471

spring编程式事务发布：2025-02-12 17:16:55 浏览：398

nginx禁止ip访问发布：2025-02-12 17:15:14 浏览：273

python遍历文件目录

与python遍历文件目录相关的资讯