python模塊詳解
㈠ python庫與模塊的區別是什麼
Python庫與模塊的區別是什麼
模塊、庫主要區別在於他們的定義與所指范圍不同。
模塊:包含並且有組織的代碼片段為模塊,sample.py 其中文件名smaple為模塊名字。
模塊是一種以.py為後綴的文件,在.py文件中定義了一些常量和函數。模塊的名稱是該.py文件的名稱。模塊的名稱作為一個全局變數__name__的取值可以被其他模塊獲取或導入。模塊的導入通過ipmort來實現。
庫:庫的概念是具有相關功能模塊的集合。這也是正是Python的一大特色之一,即具有強大的標准庫,還有第三方庫以及自定義模塊。
Python中的庫是借用其他編程語言的概念,沒有特別具體的定義,Python庫著重強調其功能性。在Python中,具有某些功能的模塊和包都可以被稱作庫。模塊有諸多函數組成,包由諸多模塊機構化組成,庫中也可以包含包、模塊和函數。
更多技術請關注Python視頻教程。
㈡ 萬字干貨,Python語法大合集,一篇文章帶你入門
這份資料非常純粹,只有Python的基礎語法,專門針對想要學習Python的小白。
Python中用#表示單行注釋,#之後的同行的內容都會被注釋掉。
使用三個連續的雙引號表示多行注釋,兩個多行注釋標識之間內容會被視作是注釋。
Python當中的數字定義和其他語言一樣:
我們分別使用+, -, *, /表示加減乘除四則運算符。
這里要注意的是,在Python2當中,10/3這個操作會得到3,而不是3.33333。因為除數和被除數都是整數,所以Python會自動執行整數的計算,幫我們把得到的商取整。如果是10.0 / 3,就會得到3.33333。目前Python2已經不再維護了,可以不用關心其中的細節。
但問題是Python是一個 弱類型 的語言,如果我們在一個函數當中得到兩個變數,是無法直接判斷它們的類型的。這就導致了同樣的計算符可能會得到不同的結果,這非常蛋疼。以至於程序員在運算除法的時候,往往都需要手工加上類型轉化符,將被除數轉成浮點數。
在Python3當中撥亂反正,修正了這個問題,即使是兩個整數相除,並且可以整除的情況下,得到的結果也一定是浮點數。
如果我們想要得到整數,我們可以這么操作:
兩個除號表示 取整除 ,Python會為我們保留去除余數的結果。
除了取整除操作之外還有取余數操作,數學上稱為取模,Python中用%表示。
Python中支持 乘方運算 ,我們可以不用調用額外的函數,而使用**符號來完成:
當運算比較復雜的時候,我們可以用括弧來強制改變運算順序。
Python中用首字母大寫的True和False表示真和假。
用and表示與操作,or表示或操作,not表示非操作。而不是C++或者是Java當中的&&, || 和!。
在Python底層, True和False其實是1和0 ,所以如果我們執行以下操作,是不會報錯的,但是在邏輯上毫無意義。
我們用==判斷相等的操作,可以看出來True==1, False == 0.
我們要小心Python當中的bool()這個函數,它並不是轉成bool類型的意思。如果我們執行這個函數,那麼 只有0會被視作是False,其他所有數值都是True :
Python中用==判斷相等,>表示大於,>=表示大於等於, <表示小於,<=表示小於等於,!=表示不等。
我們可以用and和or拼裝各個邏輯運算:
注意not,and,or之間的優先順序,其中not > and > or。如果分不清楚的話,可以用括弧強行改變運行順序。
關於list的判斷,我們常用的判斷有兩種,一種是剛才介紹的==,還有一種是is。我們有時候也會簡單實用is來判斷,那麼這兩者有什麼區別呢?我們來看下面的例子:
Python是全引用的語言,其中的對象都使用引用來表示。is判斷的就是 兩個引用是否指向同一個對象 ,而==則是判斷兩個引用指向的具體內容是否相等。舉個例子,如果我們把引用比喻成地址的話,is就是判斷兩個變數的是否指向同一個地址,比如說都是沿河東路XX號。而==則是判斷這兩個地址的收件人是否都叫張三。
顯然,住在同一個地址的人一定都叫張三,但是住在不同地址的兩個人也可以都叫張三,也可以叫不同的名字。所以如果a is b,那麼a == b一定成立,反之則不然。
Python當中對字元串的限制比較松, 雙引號和單引號都可以表示字元串 ,看個人喜好使用單引號或者是雙引號。我個人比較喜歡單引號,因為寫起來方便。
字元串也支持+操作,表示兩個字元串相連。除此之外,我們把兩個字元串寫在一起,即使沒有+,Python也會為我們拼接:
我們可以使用[]來查找字元串當中某個位置的字元,用 len 來計算字元串的長度。
我們可以在字元串前面 加上f表示格式操作 ,並且在格式操作當中也支持運算,比如可以嵌套上len函數等。不過要注意,只有Python3.6以上的版本支持f操作。
最後是None的判斷,在Python當中None也是一個對象, 所有為None的變數都會指向這個對象 。根據我們前面所說的,既然所有的None都指向同一個地址,我們需要判斷一個變數是否是None的時候,可以使用is來進行判斷,當然用==也是可以的,不過我們通常使用is。
理解了None之後,我們再回到之前介紹過的bool()函數,它的用途其實就是判斷值是否是空。所有類型的 默認空值會被返回False ,否則都是True。比如0,"",[], {}, ()等。
除了上面這些值以外的所有值傳入都會得到True。
Python當中的標准輸入輸出是 input和print 。
print會輸出一個字元串,如果傳入的不是字元串會自動調用__str__方法轉成字元串進行輸出。 默認輸出會自動換行 ,如果想要以不同的字元結尾代替換行,可以傳入end參數:
使用input時,Python會在命令行接收一行字元串作為輸入。可以在input當中傳入字元串,會被當成提示輸出:
Python支持 三元表達式 ,但是語法和C++不同,使用if else結構,寫成:
上段代碼等價於:
Python中用[]表示空的list,我們也可以直接在其中填充元素進行初始化:
使用append和pop可以在list的末尾插入或者刪除元素:
list可以通過[]加上下標訪問指定位置的元素,如果是負數,則表示 倒序訪問 。-1表示最後一個元素,-2表示倒數第二個,以此類推。如果訪問的元素超過數組長度,則會出發 IndexError 的錯誤。
list支持切片操作,所謂的切片則是從原list當中 拷貝 出指定的一段。我們用start: end的格式來獲取切片,注意,這是一個 左閉右開區間 。如果留空表示全部獲取,我們也可以額外再加入一個參數表示步長,比如[1:5:2]表示從1號位置開始,步長為2獲取元素。得到的結果為[1, 3]。如果步長設置成-1則代表反向遍歷。
如果我們要指定一段區間倒序,則前面的start和end也需要反過來,例如我想要獲取[3: 6]區間的倒序,應該寫成[6:3:-1]。
只寫一個:,表示全部拷貝,如果用is判斷拷貝前後的list會得到False。可以使用del刪除指定位置的元素,或者可以使用remove方法。
insert方法可以 指定位置插入元素 ,index方法可以查詢某個元素第一次出現的下標。
list可以進行加法運算,兩個list相加表示list當中的元素合並。 等價於使用extend 方法:
我們想要判斷元素是否在list中出現,可以使用 in關鍵字 ,通過使用len計算list的長度:
tuple和list非常接近,tuple通過()初始化。和list不同, tuple是不可變對象 。也就是說tuple一旦生成不可以改變。如果我們修改tuple,會引發TypeError異常。
由於小括弧是有改變優先順序的含義,所以我們定義單個元素的tuple, 末尾必須加上逗號 ,否則會被當成是單個元素:
tuple支持list當中絕大部分操作:
我們可以用多個變數來解壓一個tuple:
解釋一下這行代碼:
我們在b的前面加上了星號, 表示這是一個list 。所以Python會在將其他變數對應上值的情況下,將剩下的元素都賦值給b。
補充一點,tuple本身雖然是不可變的,但是 tuple當中的可變元素是可以改變的 。比如我們有這樣一個tuple:
我們雖然不能往a當中添加或者刪除元素,但是a當中含有一個list,我們可以改變這個list類型的元素,這並不會觸發tuple的異常:
dict也是Python當中經常使用的容器,它等價於C++當中的map,即 存儲key和value的鍵值對 。我們用{}表示一個dict,用:分隔key和value。
對 。我們用{}表示一個dict,用:分隔key和value。
dict的key必須為不可變對象,所以 list、set和dict不可以作為另一個dict的key ,否則會拋出異常:
我們同樣用[]查找dict當中的元素,我們傳入key,獲得value,等價於get方法。
我們可以call dict當中的keys和values方法,獲取dict當中的所有key和value的集合,會得到一個list。在Python3.7以下版本當中,返回的結果的順序可能和插入順序不同,在Python3.7及以上版本中,Python會保證返回的順序和插入順序一致:
我們也可以用in判斷一個key是否在dict當中,注意只能判斷key。
如果使用[]查找不存在的key,會引發KeyError的異常。如果使用 get方法則不會引起異常,只會得到一個None :
setdefault方法可以 為不存在的key 插入一個value,如果key已經存在,則不會覆蓋它:
我們可以使用update方法用另外一個dict來更新當前dict,比如a.update(b)。對於a和b交集的key會被b覆蓋,a當中不存在的key會被插入進來:
我們一樣可以使用del刪除dict當中的元素,同樣只能傳入key。
Python3.5以上的版本支持使用**來解壓一個dict:
set是用來存儲 不重復元素 的容器,當中的元素都是不同的,相同的元素會被刪除。我們可以通過set(),或者通過{}來進行初始化。注意當我們使用{}的時候,必須要傳入數據,否則Python會將它和dict弄混。
set當中的元素也必須是不可變對象,因此list不能傳入set。
可以調用add方法為set插入元素:
set還可以被認為是集合,所以它還支持一些集合交叉並補的操作。
set還支持 超集和子集的判斷 ,我們可以用大於等於和小於等於號判斷一個set是不是另一個的超集或子集:
和dict一樣,我們可以使用in判斷元素在不在set當中。用可以拷貝一個set。
Python當中的判斷語句非常簡單,並且Python不支持switch,所以即使是多個條件,我們也只能 羅列if-else 。
我們可以用in來循環迭代一個list當中的內容,這也是Python當中基本的循環方式。
如果我們要循環一個范圍,可以使用range。range加上一個參數表示從0開始的序列,比如range(10),表示[0, 10)區間內的所有整數:
如果我們傳入兩個參數,則 代表迭代區間的首尾 。
如果我們傳入第三個元素,表示每次 循環變數自增的步長 。
如果使用enumerate函數,可以 同時迭代一個list的下標和元素 :
while循環和C++類似,當條件為True時執行,為false時退出。並且判斷條件不需要加上括弧:
Python當中使用 try和except捕獲異常 ,我們可以在except後面限制異常的類型。如果有多個類型可以寫多個except,還可以使用else語句表示其他所有的類型。finally語句內的語法 無論是否會觸發異常都必定執行 :
在Python當中我們經常會使用資源,最常見的就是open打開一個文件。我們 打開了文件句柄就一定要關閉 ,但是如果我們手動來編碼,經常會忘記執行close操作。並且如果文件異常,還會觸發異常。這個時候我們可以使用with語句來代替這部分處理,使用with會 自動在with塊執行結束或者是觸發異常時關閉打開的資源 。
以下是with的幾種用法和功能:
凡是可以使用in語句來迭代的對象都叫做 可迭代對象 ,它和迭代器不是一個含義。這里只有可迭代對象的介紹,想要了解迭代器的具體內容,請移步傳送門:
Python——五分鍾帶你弄懂迭代器與生成器,夯實代碼能力
當我們調用dict當中的keys方法的時候,返回的結果就是一個可迭代對象。
我們 不能使用下標來訪問 可迭代對象,但我們可以用iter將它轉化成迭代器,使用next關鍵字來獲取下一個元素。也可以將它轉化成list類型,變成一個list。
使用def關鍵字來定義函數,我們在傳參的時候如果指定函數內的參數名, 可以不按照函數定義的順序 傳參:
可以在參數名之前加上*表示任意長度的參數,參數會被轉化成list:
也可以指定任意長度的關鍵字參數,在參數前加上**表示接受一個dict:
當然我們也可以兩個都用上,這樣可以接受任何參數:
傳入參數的時候我們也可以使用*和**來解壓list或者是dict:
Python中的參數 可以返回多個值 :
函數內部定義的變數即使和全局變數重名,也 不會覆蓋全局變數的值 。想要在函數內部使用全局變數,需要加上 global 關鍵字,表示這是一個全局變數:
Python支持 函數式編程 ,我們可以在一個函數內部返回一個函數:
Python中可以使用lambda表示 匿名函數 ,使用:作為分隔,:前面表示匿名函數的參數,:後面的是函數的返回值:
我們還可以將函數作為參數使用map和filter,實現元素的批量處理和過濾。關於Python中map、rece和filter的使用,具體可以查看之前的文章:
五分鍾帶你了解map、rece和filter
我們還可以結合循環和判斷語來給list或者是dict進行初始化:
使用 import語句引入一個Python模塊 ,我們可以用.來訪問模塊中的函數或者是類。
我們也可以使用from import的語句,單獨引入模塊內的函數或者是類,而不再需要寫出完整路徑。使用from import *可以引入模塊內所有內容(不推薦這么干)
可以使用as給模塊內的方法或者類起別名:
我們可以使用dir查看我們用的模塊的路徑:
這么做的原因是如果我們當前的路徑下也有一個叫做math的Python文件,那麼 會覆蓋系統自帶的math的模塊 。這是尤其需要注意的,不小心會導致很多奇怪的bug。
我們來看一個完整的類,相關的介紹都在注釋當中
以上內容的詳細介紹之前也有過相關文章,可以查看:
Python—— slots ,property和對象命名規范
下面我們來看看Python當中類的使用:
這里解釋一下,實例和對象可以理解成一個概念,實例的英文是instance,對象的英文是object。都是指類經過實例化之後得到的對象。
繼承可以讓子類 繼承父類的變數以及方法 ,並且我們還可以在子類當中指定一些屬於自己的特性,並且還可以重寫父類的一些方法。一般我們會將不同的類放在不同的文件當中,使用import引入,一樣可以實現繼承。
我們創建一個蝙蝠類:
我們再創建一個蝙蝠俠的類,同時繼承Superhero和Bat:
執行這個類:
我們可以通過yield關鍵字創建一個生成器,每次我們調用的時候執行到yield關鍵字處則停止。下次再次調用則還是從yield處開始往下執行:
除了yield之外,我們還可以使用()小括弧來生成一個生成器:
關於生成器和迭代器更多的內容,可以查看下面這篇文章:
五分鍾帶你弄懂迭代器與生成器,夯實代碼能力
我們引入functools當中的wraps之後,可以創建一個裝飾器。裝飾器可以在不修改函數內部代碼的前提下,在外麵包裝一層其他的邏輯:
裝飾器之前也有專門的文章詳細介紹,可以移步下面的傳送門:
一文搞定Python裝飾器,看完面試不再慌
不知道有多少小夥伴可以看到結束,原作者的確非常厲害,把Python的基本操作基本上都囊括在裡面了。如果都能讀懂並且理解的話,那麼Python這門語言就算是入門了。
如果你之前就有其他語言的語言基礎,我想本文讀完應該不用30分鍾。當然在30分鍾內學會一門語言是不可能的,也不是我所提倡的。但至少通過本文我們可以做到熟悉Python的語法,知道大概有哪些操作,剩下的就要我們親自去寫代碼的時候去體會和運用了。
根據我的經驗,在學習一門新語言的前期,不停地查閱資料是免不了的。希望本文可以作為你在使用Python時候的查閱文檔。
最後,我這里有各種免費的編程類資料,有需要的及時私聊我,回復"學習",分享給大家,正在發放中............
㈢ python有哪些模塊 md5
python的md5模塊使用非常簡單,包括以下幾個函數:
md5.new([arg])
返回一個md5對象,如果給出參數,則相當於調用了update(arg)
md5.updte(arg)
用string參數arg更新md5對象
md5.digest()
返回16位元組的摘要,由傳給update的string生成,摘要沒有ascii字元
md5.hexdigest()
以16進制的形式返回摘要
代碼示例:
01.#!/usr/bin/python
02.import
sys
03.import
md5
04.
05.str=sys.argv[1]
06.key =
md5.new()
07.key.update(str)
08.print
key.hexdigest()
09.str=sys.argv[1]
保存代碼為md.py
1.[fengyj@fengyj
python]$ chmod +x md.py
2.[fengyj@fengyj
python]$ ./md.py fengyajie
3.
㈣ python標准庫中常用的網路相關模塊有哪些
標准庫 Python擁有一個強大的標准庫。Python語言的核心只包含數字、字元串、列表、字典、文件等常見類型和函數,而由Python標准庫提供了系統管理、網路通信、文本處理、資料庫介面、圖形系統、XML處理等額外的功能。 Python標准庫的主要功能有: 1.文本處理,包含文本格式化、正則表達式匹配、文本差異計算與合並、Unicode支持,二進制數據處理等功能 2.文件處理,包含文件操作、創建臨時文件、文件壓縮與歸檔、操作配置文件等功能 3.操作系統功能,包含線程與進程支持、IO復用、日期與時間處理、調用系統函數、日誌(logging)等功能 4.網路通信,包含網路套接字,SSL加密通信、非同步網路通信等功能 5.網路協議,支持HTTP,FTP,SMTP,POP,IMAP,NNTP,XMLRPC等多種網路協議,並提供了編寫網路伺服器的框架 6.W3C格式支持,包含HTML,SGML,XML的處理。 7.其它功能,包括國際化支持、數學運算、HASH、Tkinter等 Python社區提供了大量的第三方模塊,使用方式與標准庫類似。它們的功能覆蓋科學計算、Web開發、資料庫介面、圖形系統多個領域。第三方模塊可以使用Python或者C語言編寫。SWIG,SIP常用於將C語言編寫的程序庫轉化為Python模塊。Boost C++ Libraries包含了一組函式庫,Boost.Python,使得以Python或C++編寫的程式能互相調用。Python常被用做其他語言與工具之間的「膠水」語言。 著名第三方庫 1.Web框架 Django: 開源Web開發框架,它鼓勵快速開發,並遵循MVC設計,開發周期短。 ActiveGrid: 企業級的Web2.0解決方案。 Karrigell: 簡單的Web框架,自身包含了Web服務,py腳本引擎和純python的資料庫PyDBLite。 Tornado: 一個輕量級的Web框架,內置非阻塞式伺服器,而且速度相當快 webpy: 一個小巧靈活的Web框架,雖然簡單但是功能強大。 CherryPy: 基於Python的Web應用程序開發框架。 Pylons: 基於Python的一個極其高效和可靠的Web開發框架。 Zope: 開源的Web應用伺服器。 TurboGears: 基於Python的MVC風格的Web應用程序框架。 Twisted: 流行的網路編程庫,大型Web框架。 Quixote: Web開發框架。 2.科學計算 Matplotlib: 用Python實現的類matlab的第三方庫,用以繪制一些高質量的數學二維圖形。 SciPy: 基於Python的matlab實現,旨在實現matlab的所有功能。 NumPy: 基於Python的科學計算第三方庫,提供了矩陣,線性代數,傅立葉變換等等的解決方案。 3.GUI PyGtk: 基於Python的GUI程序開發GTK+庫。 PyQt: 用於Python的QT開發庫。 WxPython: Python下的GUI編程框架,與MFC的架構相似。 4.其它 BeautifulSoup: 基於Python的HTML/XML解析器,簡單易用。 PIL: 基於Python的圖像處理庫,功能強大,對圖形文件的格式支持廣泛。 PyGame: 基於Python的多媒體開發和游戲軟體開發模塊。 Py2exe: 將python腳本轉換為windows上可以獨立運行的可執行程序。
㈤ 盤點Python常用的模塊和包
模塊
1.定義
計算機在開發過程中,代碼越寫越多,也就越難以維護,所以為了編寫可維護的代碼,我們會把函數進行分組,放在不同的文件里。在python里,一個.py文件就是一個模塊。
2.優點:
提高代碼的可維護性。
提高代碼的復用,當模塊完成時就可以在其他代碼中調用。
引用其他模塊,包含python內置模塊和其他第三方模塊。
避免函數名和變數名等名稱沖突。
python內建模塊:
1.sys模塊
2.random模塊
3.os模塊:
os.path:講解
https://www.cnblogs.com/yufeihlf/p/6179547.html
數據可視化
1.matplotlib :
是Python可視化程序庫的泰斗,它的設計和在1980年代被設計的商業化程序語言MATLAB非常接近。比如pandas和Seaborn就是matplotlib的外包,它們讓你能用更少的代碼去調用 matplotlib的方法。
訪問:
https://matplotlib.org/
顏色:
https://www.cnblogs.com/darkknightzh/p/6117528.html
教程:
https://wizardforcel.gitbooks.io/matplotlib-user-guide/3.1.html
2.Seaborn:
它是構建在matplotlib的基礎上的,用簡潔的代碼來製作好看的圖表。Seaborn跟matplotlib最大的區別就是它的默認繪圖風格和色彩搭配都具有現代美感。
訪問:
http://seaborn.pydata.org/index.html
3.ggplot:
gplot 跟 matplotlib 的不同之處是它允許你疊加不同的圖層來完成一幅圖
訪問:
http://ggplot.yhathq.com/
4.Mayavi:
Mayavi2完全用Python編寫,因此它不但是一個方便實用的可視化軟體,而且可以方便地用Python編寫擴展,嵌入到用戶編寫的Python程序中,或者直接使用其面向腳本的API:mlab快速繪制三維圖
訪問:http://code.enthought.com/pages/mayavi-project.html
講解:https://blog.csdn.net/ouening/article/details/76595427https://www.jianshu.com/p/81e6f4f1cdd8
5.TVTK:
TVTK庫對標準的VTK庫進行包裝,提供了Python風格的API、支持Trait屬性和numpy的多維數組。
VTK (http://www.vtk.org/) 是一套三維的數據可視化工具,它由C++編寫,包涵了近千個類幫助我們處理和顯示數據
講解:https://docs.huihoo.com/scipy/scipy-zh-cn/tvtk_intro.html
機器學習
1.Scikit-learn
是一個簡單且高效的數據挖掘和數據分析工具,易上手,可以在多個上下文中重復使用。它基於NumPy, SciPy 和 matplotlib,開源,可商用(基於 BSD 許可)。
訪問:
講解:https://blog.csdn.net/finafily0526/article/details/79318401
2.Tensorflow
最初由谷歌機器智能科研組織中的谷歌大腦團隊(Google Brain Team)的研究人員和工程師開發。該系統設計的初衷是為了便於機器學習研究,能夠更快更好地將科研原型轉化為生產項目。
相關推薦:《Python視頻教程》
Web框架
1.Tornado
訪問:http://www.tornadoweb.org/en/stable/
2.Flask
訪問:http://flask.pocoo.org/
3.Web.py
訪問:http://webpy.org/
4.django
https://www.djangoproject.com/
5.cherrypy
http://cherrypy.org/
6.jinjs
http://docs.jinkan.org/docs/jinja2/
GUI 圖形界面
1.Tkinter
https://wiki.python.org/moin/TkInter/
2.wxPython
https://www.wxpython.org/
3.PyGTK
http://www.pygtk.org/
4.PyQt
https://sourceforge.net/projects/pyqt/
5.PySide
http://wiki.qt.io/Category:LanguageBindings::PySide
科學計算
教程
https://docs.huihoo.com/scipy/scipy-zh-cn/index.html#
1.numpy
訪問
http://www.numpy.org/
講解
https://blog.csdn.net/lm_is_dc/article/details/81098805
2.sympy
sympy是一個Python的科學計算庫,用一套強大的符號計算體系完成諸如多項式求值、求極限、解方程、求積分、微分方程、級數展開、矩陣運算等等計算問題
訪問
https://docs.sympy.org/0.7.1/guide.html#guide
講解
https://www.jianshu.com/p/339c91ae9f41
解方程
https://www.cnblogs.com/zyg123/p/10549354.html
3.SciPy
官網
https://www.scipy.org/
講解
https://blog.csdn.net/wsp_1138886114/article/details/80444621
4.pandas
官網
http://pandas.pydata.org/
講解
https://www.cnblogs.com/linux-wangkun/p/5903945.html
5.blaze
官網
http://blaze.readthedocs.io/en/latest/index.html
密碼學
1.cryptography
https://pypi.python.org/pypi/cryptography/
2.hashids
http://www.oschina.net/p/hashids
3.Paramiko
http://www.paramiko.org/
4.Passlib
https://pythonhosted.org/passlib/
5.PyCrypto
https://pypi.python.org/pypi/pycrypto
6.PyNacl
http://pynacl.readthedocs.io/en/latest/
爬蟲相關
requests
http://www.python-requests.org/
scrapy
https://scrapy.org/
pyspider
https://github.com/binux/pyspider
portia
https://github.com/scrapinghub/portia
html2text
https://github.com/Alir3z4/html2text
BeautifulSoup
https://www.crummy.com/software/BeautifulSoup/
lxml
http://lxml.de/
selenium
http://docs.seleniumhq.org/
mechanize
https://pypi.python.org/pypi/mechanize
PyQuery
https://pypi.python.org/pypi/pyquery/
creepy
https://pypi.python.org/pypi/creepy
gevent
一個高並發的網路性能庫
http://www.gevent.org/
圖像處理
bigmoyan
http://scikit-image.org/
Python Imaging Library(PIL)
http://www.pythonware.com/procts/pil/
pillow:
http://pillow.readthedocs.io/en/latest/
自然語言處理
1.nltk:
http://www.nltk.org/
教程
https://blog.csdn.net/wizardforcel/article/details/79274443
2.snownlp
https://github.com/isnowfy/snownlp
3.Pattern
https://github.com/clips/pattern
4.TextBlob
http://textblob.readthedocs.io/en/dev/
5.Polyglot
https://pypi.python.org/pypi/polyglot
6.jieba:
https://github.com/fxsjy/jieba
資料庫驅動
mysql-python
https://sourceforge.net/projects/mysql-python/
PyMySQL
https://github.com/PyMySQL/PyMySQL
PyMongo
https://docs.mongodb.com/ecosystem/drivers/python/
pymongo
MongoDB庫
訪問:https://pypi.python.org/pypi/pymongo/
redis
Redis庫
訪問:https://pypi.python.org/pypi/redis/
cxOracle
Oracle庫
訪問:https://pypi.python.org/pypi/cx_Oracle
SQLAlchemy
SQL工具包及對象關系映射(ORM)工具
訪問:http://www.sqlalchemy.org/
peewee,
SQL工具包及對象關系映射(ORM)工具
訪問:https://pypi.python.org/pypi/peewee
torndb
Tornado原裝DB
訪問:https://github.com/bdarnell/torndb
Web
pycurl
URL處理工具
smtplib模塊
發送電子郵件
其他庫暫未分類
1.PyInstaller:
是一個十分有用的第三方庫,它能夠在Windows、Linux、 Mac OS X 等操作系統下將 Python 源文件打包,通過對源文件打包, Python 程序可以在沒有安裝 Python 的環境中運行,也可以作為一個 獨立文件方便傳遞和管理。
2.Ipython
一種互動式計算和開發環境
講解
https://www.cnblogs.com/zzhzhao/p/5295476.html
命令
ls、cd 、run、edit、clear、exist
㈥ python中的time模塊
time模塊是python專門用來處理時間的內建庫。
下面我們來記錄一些基本使用方法。
ps: 用到了一些概念,比如unix時間戳,感興趣的同學自行網路。
下文參考他人博客內容, 傳送門
time.time()函數獲取的是Unix時間戳。
返回的是一個float類型的數值。
在python中的time模塊中定義了一個叫struct_time的元組,是用來構建時間對象的。
struct_time元組共9個元素組成,如下圖:
這個函數可以接受一個unix時間戳,然後轉換為struct_time。
如果不傳入second參數,則會返回當前時間的時間戳的struct_time對象
再試試傳入當前時間的時間戳,是否能得到上面的struct_time呢?
和我們預期的結果一致。
和localtime函數類似,默認情況gmtime函數獲取當前時間的utc時間。
返回當前時間的utc時間的struct_time對象。
也可以傳入任意的unix時間戳,來得到utc時間。
將一個時間戳struct_time對象轉換為時間戳。
傳入一個struct_time對象,返回"Sun Jun 20 23:21:05 1993"這種格式的字元串。不傳參數,返回當前時間的這種格式的字元串。
傳入格式和struct_time,返回按照format格式格式化後的時間字元串。
格式佔位符可以參考下圖:
將字元串時間轉為struct_time,time.strftime()的逆向操作。
㈦ 詳解Python中import方法引入模塊
在python用import或者from...import或者from...import...as...來導入相應的模塊,作用和使用方法與C語言的include頭文件類似。其實就是引入某些成熟的函數庫和成熟的方法,避免重復造輪子,提高開發速度。
python的import方法可以引入系統的模塊,也可以引入我們自己寫好的共用模塊,這點和php非常相似,但是它們的具體細節還不是很一樣。因為php是在引入的時候指明引入文件的具體路徑,而python中不能夠寫文件路徑進行引入。
下面總結一下import的幾種情況:
python包含子目錄中的模塊方法比較簡單,關鍵是能夠在sys.path裡面找到通向模塊文件的路徑。
下面將具體介紹幾種常用情況:
(1)主程序與模塊程序在同一目錄下:
如下面程序結構:
`-- src
|-- mod1.py
`-- test1.py
若在程序test1.py中導入模塊mod1, 則直接使用import mod1或from mod1 import *;
(2)主程序所在目錄是模塊所在目錄的父(或祖輩)目錄
如下面程序結構:
`-- src
|-- mod1.py
|-- mod2
| `-- mod2.py
`-- test1.py
若在程序test1.py中導入模塊mod2, 需要在mod2文件夾中建立空文件__init__.py文件(也可以在該文件中自定義輸出模塊介面); 然後使用 from mod2.mod2 import * 或import mod2.mod2.
(3)主程序導入上層目錄中模塊或其他目錄(平級)下的模塊
如下面程序結構:
`-- src
|-- mod1.py
|-- mod2
| `-- mod2.py
|-- sub
| `-- test2.py
`-- test1.py
若在程序test2.py中導入模塊mod1和mod2。首先需要在mod2下建立__init__.py文件(同(2)),src下不必建立該文件。然後調用方式如下:
下面程序執行方式均在程序文件所在目錄下執行,如test2.py是在cd sub;之後執行python test2.py
而test1.py是在cd src;之後執行python test1.py; 不保證在src目錄下執行python sub/test2.py成功。
import sys
sys.path.append("..")
import mod1
import mod2.mod2