pypypython
1. Cpython是什麼PyPy是什麼Python和這兩個東西有什麼關系
CPython:是用c語言實現Pyhon,是目前應用最廣泛的解釋器。最新的語言特性都是在這個上面先實現,基本包含了所有第三方庫支持,但是CPython有幾個缺陷,一是全局鎖使Python在多線程效能上表現不佳,二是CPython無法支持JIT(即時編譯),導致其執行速度不及Java和Javascipt等語言。於是出現了Pypy。
Pypy:是用Python自身實現的解釋器。針對CPython的缺點進行了各方面的改良,性能得到很大的提升。最重要的一點就是Pypy集成了JIT。但是,Pypy無法支持官方的C/Python API,導致無法使用例如Numpy,Scipy等重要的第三方庫。這也是現在Pypy沒有被廣泛使用的原因吧。
而PyPy與CPython的不同在於,別的一些python實現如CPython是使用解釋執行的方式,這樣的實現方式在性能上是很凄慘的。而PyPy使用了JIT(即時編譯)技術,在性能上得到了提升。
2. pypy在什麼情況下會比CPython慢很多
大量使用eval和exec的時候
經過測試,以下代碼需要大量內存分配和動態執行,cPython的速度是PyPy的大約3倍(僅體現在讀取文件上,cPython大約10秒,PyPy大約35秒)
# coding: utf-8
import sys, gc
from prettytable import PrettyTable
def ginput(statement):
'''
:param str statement:
:return:
'''
return raw_input(statement.decode('utf-8').encode('gbk')).decode('gbk').encode('utf-8')
def gprint(statement):
'''
:param str statement:
:return:
'''
print statement.decode('utf-8').encode('gbk')
def graise(errorinfo):
'''
:param str errorinfo:
:return:
'''
gprint(errorinfo)
ginput('回車退出')
sys.exit(1)
try:
f=open(u'線路路由表.txt','r')
except:
graise('文件 線路路由表.txt 不存在或打不開')
gprint('正在讀取文件,請盡量留出1GB左右空閑內存')
readbuff=f.read()
if readbuff[-1]==' ': # 分片處理,否則600站以上懟上2G的內存,很容易爆掉,1000站懟4G內存也會爆
buffs=readbuff.split(' ')
x=[]
for buff in buffs:
if buff:
x.extend(eval(buff))
gc.collect()
gprint('已經讀取%d座車站'%len(x))
else:
x=eval(readbuff) # type:list
gprint('文件讀取成功')
f.close()
sNums={x[i][0]:i for i in range(len(x))}
noToName={station[0]:station[1] for station in x}
nameToNo={a:b for b,a in noToName.items()}
gc.collect()
def finder(start,end):
try:
try:
start=int(start)
except:
start=nameToNo[start]
assert noToName[start]
try:
end=int(end)
except:
end=nameToNo[end]
end=noToName[end]
except:
gprint('出發地或目的地在線路圖中找不到')
return None
selection=x[sNums[start]]
selRoute=dict(selection[2])
selMap=selection[3]
try:
assert end in selMap
except:
gprint('脫網,出發站點和目的站點之間不可到達')
return None
prevNo=nameToNo[end]
routeMap=[]
while True:
prevName=noToName[prevNo]
routeMap.append((prevNo,noToName[prevNo],selRoute[prevNo])) # 表庫不支持gprint
prevNo=selMap[prevName]
if prevNo==0:
break
routeMap.reverse()
gprint('最短路線方案(未必最省時間):')
tb=PrettyTable([u'編號',u'站名',u'距離',u'換乘'], encoding='gbk')
tb.align[u'站名']='l'
tb.align[u'編號']='r'
tb.align[u'距離']='r'
tb.align[u'換乘']='l'
tb.padding_width=2
buff=0
times=0
for route in routeMap:
if buff!=route[0]//100:
buff=route[0]//100
if times!=0 and times!=len(routeMap)-1:
hc=u'%d號線'%buff
else:
hc=''
else:
hc=''
tb.add_row([route[0],route[1].decode('utf-8'),route[2],hc])
times=times+1
print(tb.get_string())
while True:
start=ginput('請輸入您的出發地(車站名或車站編號),退出請直接關閉程序 ')
end=ginput('請輸入您的目的地(車站名或車站編號) ')
finder(start,end)
以上代碼,其中打開的文件約30M,包括三行,每一行都是一個巨型列表
而PyPy快是很多情況下存在的,以下代碼包含大量計算,PyPy則比cPython快7倍,PyPy執行約40多秒,cPython執行約300多秒
# coding: utf-8
import xlrd, xlwt, time
from sys import exit
from xlutils. import as xl
w=raw_input(u'請輸入您文件所在的路徑,例如 f:\線路信息.xls,當前目錄則不用寫路徑,可以嘗試不寫後綴 '.encode('gbk')).decode('gbk')
start=time.time()
def gprint(statement):
print str(statement).decode('utf-8').encode('gbk')
if u'.' not in w:
w=w+'.xls'
assert w[-4:]==u'.xls', u'只支持xls結尾格式的文件'.encode('gbk')
try:
bk=xlrd.open_workbook(w)
except:
gprint('文件找不到')
exit(1)
st=bk.sheet_by_name(u'時刻表')
endcol=st.ncols
used=[ x for x in range(0,endcol,5) if u'快線' not in st.cell_value(0,x) ] # used columns
lineMap=[]
stNo=lambda station:station[0]
stName=lambda station:station[1]
stDist=lambda station:station[2]
stTrans=lambda station:station[3]
for x in used:
line=[ (int(st.cell_value(y,x)+0.5),st.cell_value(y,x+1).encode('utf-8'),int(st.cell_value(y,x+2)+0.5),[]) for y in range(4,64) if st.cell_value(y,x)!='' ]
lineMap.append(tuple(line))
for line in lineMap:
for station in line:
[ station[3].append(aStation[0]) for aLine in lineMap for aStation in aLine if aStation[1]==station[1] and aStation[0]!=station[0] ]
keyLineMap={line[0][0]//100:line for line in lineMap}
# can pass
feihuancheng=[ station[1] for line in lineMap for station in line if not station[3] ]
huanchengzhan={ station[1] for line in lineMap for station in line if station[3] }
gprint('發現換乘站%d座'%(len(huanchengzhan)))
gprint('線網共有車站%d座'%(len(huanchengzhan)+len(feihuancheng)))
# could pass
zongzhan=[ station[0] for line in lineMap for station in line ]
gprint('重復計入換乘站,一共有%d座車站'%(len(zongzhan)))
def findTransfer(station,distance):
# find all transfers connect to this station, append to a list together
li=[(station[0],distance)]
li.extend([(x,distance) for x in station[3]])
return li
def fetchNext(route,keyLineMap,walkedMap):
'''
:param list route:
:param dict keyLineMap:
:param dict walkedMap:
:return list:
'''
def adding(val,stopNo,dist):
if val==None:
return (stopNo,dist)
elif val[1]>dist:
return (stopNo,dist)
else:
return val
temp=None # single (stopNo, dist)
realPrvStNo=0
for prvStNo, prvDist in route:
line=keyLineMap[prvStNo//100]
order=prvStNo%100
if order<len(line):
nextStop=line[order]
if stName(nextStop) not in walkedMap:
buff=temp
temp=adding(temp,stNo(nextStop),prvDist+stDist(nextStop))
if buff!=temp:
found=nextStop
realPrvStNo=prvStNo
if order>1:
prevStop=line[order-2]
if stName(prevStop) not in walkedMap:
buff=temp
temp=adding(temp,stNo(prevStop),prvDist+stDist(line[order-1])) # 本站的距離欄就是上一站到本站的距離
if buff!=temp:
found=prevStop
realPrvStNo=prvStNo
if temp:
temp=(stName(found),findTransfer(found,temp[1]),realPrvStNo)
return temp
routes=[]
names={}
maxDist=0
walkMaps=[]
for line in lineMap:
gprint('當前處理到%d號線'%(line[0][0]//100))
for station in line:
stationName=stName(station)
if stationName in names.keys():
route=routes[names[stationName]][2]
walkedMap=walkMaps[names[stationName]]
else:
route=findTransfer(station,0)
walkedMap={stationName:0} # 結構為{站名:上一站編號}
while True:
nextStation=fetchNext(route,keyLineMap,walkedMap)
if nextStation:
walkedMap[nextStation[0]]=nextStation[2]
route.extend(nextStation[1])
else:
break
if route[-1][1]>maxDist:
maxDist=route[-1][1]
maxSt=stationName
routes.append((stNo(station),stationName,route))
walkMaps.append(walkedMap)
names[stationName]=len(routes)-1
gprint('全線網最大乘距:%d'%maxDist)
pj=bk.sheet_by_name(u'票價方案')
x=1
pjb=[]
while True:
price=pj.cell_value(x,1)
if price=='':
break
pjb.append((int(price+0.5),int(pj.cell_value(x,0)+0.5)*1000))
x=x+1
assert maxDist<=pjb[-1][1], u'線網最大站距超過最高票價范圍'.encode('gbk')
bback=xl(bk) # type: xlwt.Workbook
pjSheets=[x.name for x in bk.sheets() if u'號線' in x.name]
bk.release_resources()
hrange=lambda x,y:range(x,y+1) # 僅用於rangeMap的計算
findLine=lambda lineNo,rangeDict: [k for k,v in rangeDict.items() if lineNo in v][0] # 給定int型線路號,返回線路所在的表名
rangeMap={x:eval("hrange("+str(x[:-2]).replace('-',',')+")") for x in pjSheets }
findRow=lambda stationNo: zongzhan.index(stationNo)+2 # 返回車站所在的行號(0開始)
def lookup(distance):
'''
:param int distance:
:return int pr: 由距離(米)算出票價
'''
for pr,di in pjb:
if distance<=di:
break
return pr
namebuffer=''
for routeNo, routeName, route in routes:
if routeNo%100==1:
line=routeNo//100
sname=findLine(line,rangeMap)
if namebuffer!=sname: # 換入了下一張表,重置列號
c=2
namebuffer=sname
sheet=bback.get_sheet(sname) # type: xlwt.Worksheet
for toStationNo, distance in route:
price=lookup(distance)
place=findRow(toStationNo)
sheet.write(place,c,label=price)
c=c+1
nw=w.replace(u'.xls',u'另存為.xls')
bback.save(nw)
end=time.time()
gprint('文件已經保存: %s'%nw.encode('utf-8'))
gprint('耗時%d秒'%int(end-start))
f=open(u'線路路由表.txt','w')
spl=(len(routes)-1)//400
if spl==0:
f.write(str([(routes[i][0],routes[i][1],routes[i][2],walkMaps[i]) for i in range(len(routes))]).decode('string-escape'))
f.flush()
else:
for ind in range(spl+1): # 居然忘了range不顧尾
segs=routes[400*ind:400*(ind+1)]
walkSegs=walkMaps[400*ind:400*(ind+1)]
gprint('正在寫入片%d,本片區長%d'%(ind,len(segs)))
f.write(str([(segs[i][0],segs[i][1],segs[i][2],walkSegs[i]) for i in range(len(segs))]).decode('string-escape'))
f.write(' ')
f.flush()
f.close()
gprint('最近路線信息已保存至 線路路由表.txt,回車退出')
raw_input('')
3. 求教~~! 如何在pycharm中用pypy運行文件,默認的使用python運行文件的,大家幫幫忙,謝謝
設置里可以選擇你現在這個project的interpreter,你改成pypy就行了。
4. pypy 能完全支持python第三方庫嗎
quora上面也有這個問題, 但是回答的人比較少.
現在網路上也沒有什麼太多的應用例子.
但是本身已經是可用了.
5. pypy2.02 支持python3嗎
不支持吧,有些方法的用法都不一樣,比如Python3的input(),在python2是raw_input()
6. python相關,librabbitmq可以用pypy嗎
rabbitmq的python綁定其實是用c語言寫的主體,然後python調用,使用pypy加速其實多此一舉的。
_librabbitmq在python目錄肯定是.pyd文件,如果一定想使用pypy,可以切換到rabbitmq源碼目錄,試試pypy setup.py install 是否可以把c源代碼編譯成pypy的二進制擴展,如果報錯就是不支持了,你可以學習怎麼寫pypy的c擴展
7. python相關的問題 ( pypy 在windows下 怎麼安裝pip )希望有教程
將客戶端程序調用的函數名和參數傳遞給協議層(TProtocol),協議層將函數名和參數按照協議格式進行封裝,然後封裝的結果交給下層的傳輸層。
此處需要注意:
要與Thrift伺服器程序所使用的協議類型一樣,否則Thrift伺服器程序便無法在其協議層進行數據解析!
8. 腳本語言需要解釋器才能運行,為什麼可以用Python來寫Pypy,而且效率比CPython更高呢
但是C因為跟底層過於接近,所以實現JIT解釋器有諸多限制。(比如Psyco到項目死亡為止都沒能實現出64位的JIT解釋器) Pypy則換了另外一種思路。它先實現了一個Python的子集(注意,不是完整的python),叫RPython。然後用RPython去實現了Python的JIT解釋器。這個RPython本身,並不依賴運行時解釋器,而是直接被翻譯成C代碼(實際上可以翻譯成多種目標代碼,如Java、C#等)再進行編譯,本質上它是一種編譯型語言。所以,用RPython寫出來的程序,最終是會被編譯成本地代碼的,跟C寫的沒有本質區別。 由於RPython作者強大的優化功力,RPython程序最終編譯結果基本等同於C直接寫的效率。用這種程序實現出來的JIT解釋器,自然也不會慢。而JIT技術,又保證了運行在這個解釋器上的Python程序的效率的提升。