pythonxlrdwindows
一、可使用的第三方庫
python中處理excel表格,常用的庫有xlrd(讀excel)表、xlwt(寫excel)表、openpyxl(可讀寫excel表)等。xlrd讀數據較大的excel表時效率高於openpyxl,所以我在寫腳本時就採用了xlrd和xlwt這兩個庫。介紹及下載地址為:http://www.python-excel.org/ 這些庫文件都沒有提供修改現有excel表格內容的功能。一般只能將原excel中的內容讀出、做完處理後,再寫入一個新的excel文件。
二、常見問題
使用python處理excel表格時,發現兩個個比較難纏的問題:unicode編碼和excel中記錄的時間。
因為python的默認字元編碼都為unicode,所以列印從excel中讀出的中文或讀取中文名的excel表或sheet時,程序提示錯誤UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)。這是由於在windows中,中文使用了gb2312編碼方式,python將其當作unicode和ascii來解碼都不正確才報出的錯誤。使用VAR.encode('gb2312')即可解決列印中文的問題。(很奇怪,有的時候雖然能列印出結果,但顯示的不是中文,而是一堆編碼。)若要從中文文件名的excel表中讀取數據,可在文件名前加『u』表示將該中文文件名採用unicode編碼。
有excel中,時間和日期都使用浮點數表示。可看到,當『2013年3月20日』所在單元格使用『常規』格式表示後,內容變為『41353』;當其單元格格式改變為日期後,內容又變為了『2013年3月20日』。而使用xlrd讀出excel中的日期和時間後,得到是的一個浮點數。所以當向excel中寫入的日期和時間為一個浮點數也不要緊,只需將表格的表示方式改為日期和時間,即可得到正常的表示方式。excel中,用浮點數1表示1899年12月31日。
三、常用函數
以下主要介紹xlrd、xlwt、datetime中與日期相關的函數。
import xlrd
import xlwt
from datetime
def testXlrd(filename):
book=xlrd.open_workbook(filename)
sh=book.sheet_by_index(0)
print "Worksheet name(s): ",book.sheet_names()[0]
print 'book.nsheets',book.nsheets
print 'sh.name:',sh.name,'sh.nrows:',sh.nrows,'sh.ncols:',sh.ncols
print 'A1:',sh.cell_value(rowx=0,colx=1)
#如果A3的內容為中文
print 'A2:',sh.cell_value(0,2).encode('gb2312')
def testXlwt(filename):
book=xlwt.Workbook()
sheet1=book.add_sheet('hello')
book.add_sheet('word')
sheet1.write(0,0,'hello')
sheet1.write(0,1,'world')
row1 = sheet1.row(1)
row1.write(0,'A2')
row1.write(1,'B2')
sheet1.col(0).width = 10000
sheet2 = book.get_sheet(1)
sheet2.row(0).write(0,'Sheet 2 A1')
sheet2.row(0).write(1,'Sheet 2 B1')
sheet2.flush_row_data()
sheet2.write(1,0,'Sheet 2 A3')
sheet2.col(0).width = 5000
sheet2.col(0).hidden = True
book.save(filename)
if __name__=='__main__':
testXlrd(u'你好。xls')
testXlwt('helloWord.xls')
base=datetime.date(1899,12,31).toordinal()
tmp=datetime.date(2013,07,16).toordinal()
print datetime.date.fromordinal(tmp+base-1).weekday()
⑵ python 怎麼生出成一個表格,並發送郵件
# -*- coding: utf-8 -*-
#程序名稱:自動化缺陷報告腳本
#程序描述:實現從本地路徑讀取excel文件內容,並繪制HTML表格,將內容寫入郵件正文區發送
#編寫時間:2014.11.29-2014.12.4
#作者:劉琳澤
#解釋環境:Windows 7家庭高級版 Python 2.7.8IDLE
#引入excel文檔相關庫
import xlrd
import os,time
#引入郵件相關庫
import smtplib
from email.mime.text import MIMEText
from email.header import Header
import base64
#處理從excel中讀取的float類型數據的類
#目前集成兩種處理:(1)float到int型的轉換(2)float到str型的轉換,後續有需要可以增加方法以集成其他類型的轉換
class judgeFloat:
def floatToInt(self,variable):
variable="%d"%variable
return variable
def floatToStr(self,variable):
variable=xlrd.xldate_as_tuple(variable,0)
variable=list(variable)
if variable[1]<10:
variable[1]='0'+str(variable[1])
variable=str(variable[0])+str(variable[1])+str(variable[2])
return variable
#確定文檔是否修改的函數:獲取文檔的修改時間與本地時間對比,不一致要求用戶確認是否繼續執行,一致則直接執行
def openFile(filename,address):
filetime=time.strftime("%Y/%m/%d",time.localtime(os.stat(address+filename).st_mtime))
local=time.strftime("%Y/%m/%d",time.localtime())
if filetime!=local:
single=input("文檔今天還沒有修改過,請確認是否繼續?確認請輸入1後點擊回車,否則輸入2點擊回車。")
if single==1:
pass
elif single==2:
exit()
else:
print '您的輸入有誤!腳本即將結束。'
time.sleep(5)
exit()
else:
pass
#寫郵件的函數
def mailWrite(filename,address):
header='<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8" /></head>'
th='<body text="#000000">committed缺陷詳情:<table border="1" cellspacing="0" cellpadding="3" bordercolor="#000000" width="1800" align="left" ><tr bgcolor="#F79646" align="left" ><th>標識</th><th>摘要</th><th>狀態</th><th>優先順序</th><th>嚴重性</th><th>標記</th><th>所有者</th><th>創建時間</th><th>修改時間</th></tr>'
#打開文件
filepath=address+filename
book=xlrd.open_workbook(filepath)
sheet=book.sheet_by_index(0)
#獲取行列的數目,並以此為范圍遍歷獲取單元數據
nrows = sheet.nrows-1
ncols = sheet.ncols
body=''
cellData=1
for i in range(1,nrows+1):
td=''
for j in range(ncols):
#讀取單元格數據,賦給cellData變數供寫入HTML表格中
cellData=sheet.cell_value(i,j)
#調用浮點型轉換方法解決讀取的日期內容為浮點型數據的問題
if isinstance(cellData,float):
if j==0 and i>0:
cellDataNew=judgeFloat()
cellData=cellDataNew.floatToInt(cellData)
else:
cellDataNew=judgeFloat()
cellData=cellDataNew.floatToStr(cellData)
else:
pass
tip='<td>'+cellData+'</td>'
#並入tr標簽
td=td+tip
tr='<tr>'+td+'</tr>'
#為解決字元串拼接問題增設語句,tr從excel中讀取出來是unicode編碼,轉換成UTF-8編碼即可拼接
tr=tr.encode('utf-8')
#並入body標簽
body=body+tr
tail='</table></body></html>'
#將內容拼接成完整的HTML文檔
mail=header+th+body+tail
return mail
#發送郵件
def mailSend(mail):
#設置發件人
sender = '***'
#設置接收人
receiver = '***@***.com'
#設置郵件主題
subject = '測試郵件,請忽略!'
#設置發件伺服器,即smtp伺服器
smtpserver = 'smtp.***.net'
#設置登陸名稱
username = '***@***.net'
#設置登陸密碼
password = '******'
#實例化寫郵件到正文區,郵件正文區需要以HTML文檔形式寫入
msg = MIMEText(mail,'html','utf-8')
#輸入主題
msg['Subject'] = subject
#調用郵件發送方法,需配合導入郵件相關模塊
smtp = smtplib.SMTP()
#設置連接發件伺服器
smtp.connect('smtp.***.net')
#輸入用戶名,密碼,登陸伺服器
smtp.login(username, password)
#發送郵件
smtp.sendmail(sender, receiver, msg.as_string())
#退出登陸並關閉與發件伺服器的連接
smtp.quit()
#入口函數,配置文件地址和文件名
def main():
filename='Sheet1.xlsx'
address='d:/defectManage/'
openFile(filename,address)
mail=mailWrite(filename,address)
mailSend(mail)
#調用執行main函數
if __name__=="__main__":
main()
⑶ 怎麼安裝python模塊,如何安裝python模塊,常用安裝方式
推薦使用pip安裝python模塊:
安裝python模塊推薦使用pip
如果您安裝的是python2.7.10以上的版本,默認是安裝了pip的。例如:python2.7.10安裝後,pip默認安裝在C:Python27Scripts目錄下
pip的使用:
使用pip的前提是在cmd窗口中能執行pip,如下圖所示
piphelp
⑷ python 操作excel 讀 寫 xlsx
原文非常清晰,全程無bug,調試通過,留作記錄以防丟失
一、xlrd和xlwt
使用之前需要先安裝,windows上如果直接在cmd中運行python則需要先執行pip3 install xlrd和pip3 install xlwt,如果使用pycharm則需要在項目的解釋器中安裝這兩個模塊,File-Settings-Project:layout-Project Interpreter,點擊右側界面的+號,然後搜索xlrd和xlwt,然後點擊Install Package進行安裝。
對於excel來說,整個excel文件稱為工作簿,工作簿中的每個頁稱為工作表,工作表又由單元格組成。
對於xlrd和xlwt,行數和列數從0開始,單元格的行和列也從0開始,例如sheet.row_values(2)表示第三行的內容,sheet.cell(1,2).value表示第二行第三列單元格的內容。
1.xlrd模塊讀取excel文件
使用xlrd模塊之前需要先導入import xlrd,xlrd模塊既可讀取xls文件也可讀取xlsx文件。
獲取工作簿對象 :book = xlrd.open_workbook('excel文件名稱')
獲取所有工作表名稱 :names = book.sheet_names(),結果為列表
根據索引獲取工作表對象 :sheet = book.sheet_by_index(i)
根據名稱獲取工作表對象 :sheet = book.sheet_by_name('工作表名稱')
獲取工作錶行數 :rows = sheet.nrows
獲取工作表列數 :cols = sheet.ncols
獲取工作表某一行的內容 :row = sheet.row_values(i) ,結果為列表 【sheet.row(i),列表】
獲取工作表某一列的內容 :col = sheet.col_values(i) 結果為列表 【sheet.col(i),列表】
獲取工作表某一單元格的內容 :cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value,sheet.col(n)[m].value,結果為字元串或數值 【sheet.cell(0,0),xlrd.sheet.Cell對象】
示例:假設在py執行文件同層目錄下有一fruit.xls文件,有三個sheet頁Sheet1、Sheet2、Sheet3,其中Sheet1內容如下:
import xlrd
book = xlrd.open_workbook('fruit.xls')print('sheet頁名稱:',book.sheet_names())
sheet = book.sheet_by_index(0)
rows = sheet.nrows
cols = sheet.ncolsprint('該工作表有%d行,%d列.'%(rows,cols))print('第三行內容為:',sheet.row_values(2))print('第二列內容為%s,數據類型為%s.'%(sheet.col_values(1),type(sheet.col_values(1))))print('第二列內容為%s,數據類型為%s.'%(sheet.col(1),type(sheet.col(1))))print('第二行第二列的單元格內容為:',sheet.cell_value(1,1))print('第三行第二列的單元格內容為:',sheet.cell(2,1).value)print('第五行第三列的單元格內容為:',sheet.row(4)[2].value)print('第五行第三列的單元格內容為%s,數據類型為%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))print('第五行第三列的單元格內容為%s,數據類型為%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 執行結果# sheet頁名稱: ['Sheet1', 'Sheet2', 'Sheet3']# 該工作表有5行,3列.# 第三行內容為: ['梨', 3.5, 130.0]# 第二列內容為['單價/元', 8.0, 3.5, 4.5, 3.8],數據類型為<class 'list'>.# 第二列內容為[text:'單價/元', number:8.0, number:3.5, number:4.5, number:3.8],數據類型為<class 'list'>.# 第二行第二列的單元格內容為: 8.0# 第三行第二列的單元格內容為: 3.5# 第五行第三列的單元格內容為: 300.0# 第五行第三列的單元格內容為300.0,數據類型為<class 'float'># 第五行第三列的單元格內容為number:300.0,數據類型為<class 'xlrd.sheet.Cell'>
可以看出通過sheet.row(i)、sheet.col(i)也可獲取行或列的內容,並且結果也是一個列表,但是列表中的每一項類似字典的鍵值對,形式為數據類型:值。
而sheet.cell(0,0)獲取單元格內容,結果是一個鍵值對,並且是一個xlrd.sheet.Cell對象。
2.xlwt寫入excel文件
使用xlwt模塊之前需要先導入import xlwt,xlwt模塊只能寫xls文件,不能寫xlsx文件(寫xlsx程序不會報錯,但最後文件無法直接打開,會報錯)。
創建工作簿 :book = xlwt.Workbook(),如果寫入中文為亂碼,可添加參數encoding = 'utf-8'
創建工作表 :sheet = book.add_sheet('Sheet1')
向單元格寫入內容 :sheet.write(m,n,'內容1')、sheet.write(x,y,'內容2')
保存工作簿 :book.save('excel文件名稱'),默認保存在py文件相同路徑下,如果該路徑下有相同文件,會被新創建的文件覆蓋,即xlwt不能修改文件。
import xlwt
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
sheet.write(0,0,'hello')
sheet.write(1,0,'你好')
book.save('hello.xls')
逐個單元格寫入excel比較麻煩,可以按行或者列寫入。
import xlwt
proj = ['名稱','單價/元','庫存/kg']
fruit = ['蘋果','梨','香蕉','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,100,300]
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')foriin range(0,len(proj)):
sheet.write(0,i,proj[i]) #按行插入行標題foriin range(0,len(fruit)):
sheet.write(i+1,0,fruit[i])#插入第一列水果名稱foriin range(0,len(price)):
sheet.write(i+1,1,price[i])#插入第二列單價foriin range(0,len(storage)):
sheet.write(i+1,2,storage[i])#插入第三列庫存book.save('fruit2.xls')
二、openpyxl模塊
openpyxl模塊可實現對excel文件的讀、寫和修改,只能處理xlsx文件,不能處理xls文件,使用之前同樣需要先安裝該模塊,再導入 import openpyxl。
對於openpyxl,行數和列數都從1開始,單元格的行和列也從1開始。例如sheet.cell(1,2).value表示第一行第二列單元格的內容
1.openpyxl讀取excel文件
獲取工作簿對象:book = openpyxl.load_workbook('excel文件名稱')
獲取所有工作表名稱:names = book.sheetnames
獲取工作表對象:sheet1 = book.worksheets[n]、sheet2 = book['工作表名稱']、sheet3 = book[book.sheetnames[n]]
獲取工作表名稱:title = sheet1.title
獲取工作錶行數:rows = sheet1.max_row
獲取工作表列數:cols = sheet1.max_column
獲取某一單元格內容:cell = sheet.cell(1,2).value、sheet['單元格'].value例如sheet['B1'].value
假設有一fruit2.xlsx,除後綴名其他與上述fruit.xls完全一樣
import openpyxl
book = openpyxl.load_workbook('fruit2.xlsx')print('所有sheet頁名稱:',book.sheetnames)
sheet = book.worksheets[0]
sheet2 = book['Sheet1']
sheet3 = book[book.sheetnames[0]]print('工作表名稱:',sheet3.title)
rows = sheet.max_row
cols = sheet.max_columnprint('該工作表有%d行,%d列.'%(rows,cols))# 執行結果# 所有sheet頁名稱: ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名稱: Sheet1# 該工作表有5行,3列.
2.行和列生成器
對於xlrd模塊來說,可直接通過sheet.row[i]和sheet.col[i]獲取行和列的內容,但是對於openpyxl模塊來說,無法直接獲取某一行或列的內容,openpyxl模塊的sheet.rows和sheet.columns表示行和列的生成器,即generator object,需要通過循環或轉換成列表、元組的形式得到行或列的值。
print(sheet.rows,sheet.columns)forcolin sheet.columns:
print(col)forrowin sheet.rows:
foriin row:
print(i.value,end='')
print()# 執行結果# <generator object Worksheet._cells_by_row at 0x00000230E011A2A0> <generator object Worksheet._cells_by_col at 0x00000230E102FC00># (<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>)# (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>)# (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>)# 名稱 單價/元 庫存/kg# 蘋果 8 150# 梨 3.5 130# 香蕉 4.5 100# 橘子 3.8 300
如果要獲取某一行或者列的內容,可將行、列生成器對象轉換成列表或者元組,再循環列表或者元組得到內容。
前面說過openpyxl模塊的行和列都從1開始,但是由於將生成器轉化成了列表list(sheet.rows),而列表的索引從0開始,因此list(sheet.rows)[1]還是表示第二行的內容,不是第一行的內容。
foriinlist(sheet.rows)[1]:
print(i.value,end='')print()foriin list(sheet.columns)[0]:
print(i.value,end='')# 執行結果# 蘋果 8 150# 名稱 蘋果 梨 香蕉 橘子
獲取單元格的內容
print(sheet.cell(1,2).value)#第一行第二列單元格的內容print(sheet['a2'].value)#使用excel單元格的表示法,字母不區分大小寫
3.openpyxl寫excel文件
創建工作簿 :book = openpyxl.Workbook(),如果寫入中文為亂碼,可添加參數encoding = 'utf-8'
創建工作表: sheet = book.create_sheet('工作表名稱',0),0表示創建的工作表在工作薄最前面
向單元格寫入內容 :sheet.cell(m,n,'內容1')、sheet.cell(x,y,'內容2')
保存工作簿 :book.save('excel文件名稱'),默認保存在py文件相同路徑下,如果該路徑下有相同文件,會被新創建的文件覆蓋。
book = openpyxl.Workbook()
sheet = book.create_sheet('Sheet1',0)
proj = ['名稱','單價/元','庫存/kg']
fruit = ['蘋果','香蕉','梨','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,300,100]foriin range(len(proj)):
sheet.cell(1,i+1,proj[i])foriin range(len(fruit)):
sheet.cell(i+2,1,fruit[i])foriin range(len(price)):
sheet.cell(i+2,2,price[i])foriin range(len(storage)):
sheet.cell(i+2,3,storage[i])
book.save('fruit2.xlsx')
4.openpyxl修改excel文件
sheet.insert_rows(m)和sheet.insert_cols(n)分別表示在第m行、第n列前面插入行、列
sheet.delete_rows(m)和sheet.delete_cols(n)分別表示刪除第m行、第n列
rows = sheet.max_row
sheet.insert_rows(rows+2)
cherry = ['櫻桃',17,80] forjin cherry:
sheet.cell(rows+1,cherry.index(j)+1,j)
book.save('fruit2.xlsx')
修改單元格內容:sheet.cell(m,n) = '內容1'或者sheet['B3'] = '內容2'
sheet.cell(3,2,4)
sheet['B3'] = 5book.save('fruit2.xlsx')
在最後追加行:sheet.append(可迭代對象)
straberry = ['草莓',20,50]
sheet.append(straberry)
book.save('fruit2.xlsx')
三、xlsxwriter 模塊
只能操作xlsx,只能寫。在excel中插入圖片
import matplotlib.pyplot as plt
2 import pandas as pd
3 import random
4 import xlsxwriter
5
6 ts = pd.Series(random.randrange(10))
7 fig = plt.figure()
8 ax = fig.add_subplot(1,1,1)
9 ts.plot(ax=ax)
10 fig.savefig('foo.png')
11
12 workbook = xlsxwriter.Workbook('pngxls.xlsx') # 創建excel文件
13 worksheet1 = workbook.add_worksheet('png') # 括弧內為工作表表名
14 # 第一個參數是插入的起始單元格,第二個參數是圖片你文件的絕對路徑
15 worksheet1.write('A1','hello')
16 worksheet1.insert_image('B2','foo.png')
18 workbook.close()
xlrd、xlwt和openpyxl處理excel文件,在寫入文件的時候不如pandas簡單,pandas處理excel文件見另外一篇博客 https://www.cnblogs.com/Forever77/p/11298173.html
⑸ 如何用python讀excel文件
想要使用python實現對Excel文件的讀寫,首先需要安裝專用的模塊(如果你是大牛可以自己編寫)xlrd模塊。
解壓以後啟動cmd命令窗口,在其中輸入xlrd解壓後所在的目錄,執行安裝命令如圖所示(cmd命令的使用請自行網路,本機已經配置好了python環境才可以正常安裝)
在IDE環境中導入使用對應的xlrd模塊,以eclipse環境為例如圖所示
impot xlrd即可
打開Excel文件讀取數據的簡單示例如圖所示:
import xlrd後
(最新的xlrd 0.9.4版本跨平台同時支持.xls和.xlsx)
新手們在使用時會遇到:OSError: Invalid argument:XXX錯誤,這是文件I/O錯誤。在windows中要使用正斜杠 (對:C:/bbbb.xlsx,錯:('C:\bbbb.xlsx')
6
使用xlrd模塊簡單讀取excel中的sheet和行、列數據。
sheets()[i],row_values(i),col_values(i)
⑹ python如何處理大量excel數據
使用pip install openpyxl即可,但是在windows下安裝的是2.2.6版本,但是centos自動安裝的是4.1版本。
from xlwt import Workbook, Formula
import xlrd
book = Workbook()
sheet1 = book.add_sheet('Sheet 1')
sheet1.write(0,0,10)
sheet1.write(1,0,Formula('A1/B1'))
sheet2 = book.add_sheet('Sheet 2')
row = sheet2.row(0)
row.write(2,Formula("$A$1+$B$1*SUM('ShEEt 1'!$A$1:$b$2)"))
book = xlrd.open_workbook('formula.xls')
sheet = book.sheets()[0]
for i in range(nrows):
print (sheet.cell(i,j).value)
Python
是完全面向對象的語言。函數、模塊、數字、字元串都是對象。並且完全支持繼承、重載、派培銷寬生、多繼承,有益於增強源代碼的復用性。Python支持重載運算符和動態類型。相對於Lisp這種傳配亮統的函數式編程語言,Python對函數式設計只提供了有限的支持。有兩個標准庫(functools, itertools)提供了Haskell和Standard ML中久經考驗的函斗仔數式程序設計工具。