pythonbytesdecode

發布時間: 2023-02-27 15:19:38

A. python 中怎麼把類似這樣的'\xe5\xae\x9d\xe9\xb8\xa1\xe5\xb8\x82'轉換成漢字輸出

首先你要確定這是漢子的十六進制碼，還有他的編碼方式是什麼

我姑且算是utf-8來說明吧

把上述十六進制轉成二進制，python byte類型（記不清是否可以）也可以手動轉二進制
p3使用str(s, 'utf8') p2使用 s.decode('utf8')來對二進制解碼
輸出漢字

你要確定上述十六進制碼是漢字轉過來的，否則無論嘗試何種解碼方式皆不可得

B. python2.7.3中怎麼將str轉為bytes

bytes解碼會得到str str編碼會變成bytes >>> b'123'.decode('ascii')'123'>>> '123'.encode('ascii')b'123'

C. Python文件處理里encoding和encode有事區別，bytes類型是什麼意思

python問題我來回答你。

首先你要知道的是，字元串在Python內部的表示是unicode(統一碼、萬國碼)編碼，很多編程語言都是這么設計的，各個國家通用編碼，因此，在做編碼轉換時，通常需要以unicode作為中間編碼，即先將其他編碼的字元串解碼（decode）成unicode，再從unicode編碼（encode）成另一種編碼。
decode的作用是將其他編碼的字元串轉換成unicode編碼，如str1.decode('gb2312')，表示將gb2312編碼的字元串str1轉換成unicode編碼。
encode的作用是將unicode編碼轉換成其他編碼的字元串，如str2.encode('gb2312')，表示將unicode編碼的字元串str2轉換成gb2312編碼。
因此，轉碼的時候一定要先搞明白，字元串str是什麼編碼，然後decode成unicode，然後再encode成其他編碼。
bytes類型是 Python 3.x版本新增的數據類型，在 Python 2.x 中是不存在的。字元串是以字元為單位進行處理的，bytes類型是以位元組為單位處理的。
bytes 只負責以位元組序列的形式（二進制形式）來存儲數據，至於這些數據到底表示什麼內容（字元串、數字、圖片、音頻等），完全由程序的解析方式決定。
說白了，bytes 只是簡單地記錄內存中的原始數據，至於如何使用這些數據，bytes 並不在意，你想怎麼使用就怎麼使用，bytes 並不約束你的行為。

bytes 類型的數據非常適合在互聯網上傳輸，可以用於網路通信編程；bytes 也可以用來存儲圖片、音頻、視頻等二進制格式的文件。

舉個例子：

b = b'' # 創建一個空的bytes

b = byte() # 創建一個空的bytes

b = b'hello' # 直接指定這個hello是bytes類型

b = bytes('string',encoding='編碼類型') #利用內置bytes方法，將字元串轉換為指定編碼的bytes

b = str.encode('編碼類型') # 利用字元串的encode方法編碼成bytes，默認為utf-8類型

bytes.decode('編碼類型')：將bytes對象解碼成字元串，默認使用utf-8進行解碼。

D. python str與bytes編碼解碼

下面一張圖搞懂編碼、解碼、編碼表之間的關系。

不難看出，它們是一種根據編碼表進行翻譯、映射的過程：

實際上，字元串類型只有encode()方法，沒有decode()方法，而bytes類型只有decode()方法而沒有encode()方法。

二進制格式的數據也常稱為裸數據(raw data)，所以str數據經過編碼後得到raw data，raw data解碼後得到的str。

上面說了，編碼是將字元數據轉換成位元組數據(raw data)，解碼是將位元組數據轉換成字元數據。在Python中字元數據也就是字元串，即str類型，位元組數據也就是bytes類型或bytearray類型。

編碼時，可以使用位元組類型的構造方法bytes()、bytearray()來構造位元組，也可以使用str類型的encode()方法來轉換。

解碼時，可以使用str類型的構造方法str()來構造字元串，也可以使用bytes、bytearray()類型的decode()方法。

另外需要注意的是，編碼和解碼的過程中都需要指定編碼表(字元集)，默認採用的是utf-8字元集。

例如，使用encode()的方式將str編碼為bytes數據。

使用bytes()和bytearray()將str構造成bytes或bytearray數據，這兩個方法都要求str->byte的過程中給定編碼。

實際上，bytes()、bytearray()這兩個方法構造位元組數據的時候還有點復雜，因為可以從多個數據源來構造，比如字元串、整數值、buffer。如何使用這兩個方法構造位元組數據，詳細內容參考help(bytes)和help(bytearray)給出的說明，這里給幾個簡單示例。

構造bytes的方式：

構造bytearray的方式：

解碼是位元組序列到str類型的轉換。

例如，使用decode()方法進行解碼"我"字，它的utf-8的編碼對應為"\xe6\x88\x91"：

使用str()進行轉換。

當編碼、解碼的過程使用了不同的(不兼容的)編碼表時，就會出現亂碼。所以，解決亂碼的唯一方式是指定對應的編碼表進行編碼、解碼。

例如，使用utf-8編碼"我"字，得到一個bytes序列，然後使用gbk解碼這個bytes序列。

這里報錯了，因為utf-8的位元組序列里有gbk無法解碼的位元組。如果使用文本編輯器一樣的工具去顯化這個過程，得到的將是亂碼字元。

原文地址： https://www.cnblogs.com/f-ck-need-u/p/10185965.html

E. 您好，有關於Python的問題，想要請教你，方便加您的可以直接溝通的方式嗎

可以呀
Common Stumbling Blocks
本段簡單的列出容易使人出錯的變動（初學者應該注意）。
· print語句被print()函數取代了，可以使用關鍵字參數來替代老的print特殊語法。例如：
Old: print "The answer is", 2*2
New: print("The answer is", 2*2)

Old: print x, # 使用逗號結尾禁止換行
New: print(x, end=" ") # 使用空格代替換行

Old: print # 輸出新行
New: print() # 輸出新行

Old: print >>sys.stderr, "fatal error"
New: print("fatal error", file=sys.stderr)

Old: print (x, y) # 輸出repr((x, y))
New: print((x, y)) # 不同於print(x,y)!

你可以自定義輸出項之間的分隔符：
print("There are <", 2**32, ">possibilities!", sep="")
輸出結果是：
There are <4294967296> possibilities!

注意：

print()函數不支持老print語句的"軟空格"特性，例如，在python2.x中，print "A\n", "B"會輸出"A\nB\n"，而python3.0中，print("A\n","B")會輸出"A\n B\n"

使用 2to3 源碼轉換工具時，所有的print語句被自動轉換成print()函數調用，對大項目，這是無需爭論的。
· python3.0使用字元串(strings)和bytes代替Unicode字元串和8位字元串，這意味著幾乎所有使用Unicode編碼和二進制數據的代碼都要改動。這個改動很不錯，在2.x的世界裡，無數的bug都是因為編碼問題。
· map()和filter()返回迭代器(iterators)
· dict方法keys(),items(),values()返回視圖(同樣是迭代器)而不是列表(list)
· 內建的sorted()方法和list.sort()方法不再接受表示比較函數的cmp參數，使用key參數代替。
· 1/2返回浮點數，使用1//2能得到整數。
· repr()函數對於long整數不再包含拖尾的L，所以不加判斷的去除最後一個字元會導致去掉一個有用的數字。
String and Bytes
· 現在只有一種字元串:str，它的行為和實現都很像2.x的unicode串。
· basestring超類已經去掉了，2to3 工具會把每個出現的basestring替換成str。
· PEP3137:新類型bytes，用來表示二進制數據和編碼文本，str和bytes不能混合，需要時，必須進行顯示的轉換，轉換方法是str.encode()(str->bytes)和bytes.decode()(bytes->str).
· 在原始字元串(raw strings)中所有反斜線都按字面量解釋，不再特殊處理Unicode轉義字元。
· PEP3112:bytes字面量，例如b"abc"，創建bytes實例。
· PEP3120:默認源文件編碼為UTF-8
· PEP3131:可以使用非ASCII標識符(然而，除了注釋中貢獻者的名字之外，標准庫仍然只包含ASCII)
· PEP3116:新的IO實現，API幾乎100%向後兼容，二進制文件使用bytes代替strings
· 去除了StringIO和cStringIO模塊，取而代之的是io.StringIO或者io.BytesIO
PEP3101：字元串格式化的新方法
· str.format方法(原文提到替代了%操作符，實際上，format方法和%的用法差別很大，各有所長)。
PEP3106:修補了dict的keys(),items(),values()方法
· 刪除了dict.iterkeys(),dict.itervalues()和dict.iteritems()
· dict.keys(),dict.values()和dict.items()返回dict相關數據的引用
PEP3107:函數註解(FunctionAnnotations)
· 註解函數參數和返回值的標准化方法
Exception Stuff
· PEP352:異常類必須繼承自BaseException,它異常結構的基類。
· 移除了StandardError
· Dropping sequence behavior (slicing!)and message attribute of exception instances.
· PEP3109:拋出異常：現在必須使用raiseException(args)而不是原來的raise Exception, args
· PEP3110:捕獲異常，現在必須使用exceptException as identifier而不是原來的except Exception,identifier
· PEP3134:異常鏈(Exceptionchain)。
· 改良了一些windows不能載入模式時的異常信息，具有本地化處理。
New Class and Metaclass Stuff
· 移除了classic class
· PEP3115:新的metaclass語法
· PEP3119:抽象基類。
· PEP3129:類包裝。
· PEP3141:數字抽象基類
其他的語言變化

這里列出大多數的Python語言核心和內建函數的變化。
· 移除了backticks(使用repr()代替)
· 移除了<>(不等號，使用!=代替)
· as和with變成了關鍵字
· True,False和None變成了關鍵字
· PEP237:long不存在了，只有int，它和原來的long一樣。不再支持以L結尾的數字字面量。移除sys.maxint，因為int現在已經是無限大了
· PEP238:int相除，返回float
· 改變了順序操作符的行為，例如x<y，當x和y類型不匹配時拋出TypeError而不是返回隨即的bool值
· 移除了__getslice__，語法a[i:j]被解釋成a.__getitem__(slice(i,j))
· PEP3102:keyword-only arguments.在函數參數列表中，出現在*args之後的命名參數只能使用"關鍵字參數"的形式調用
· PEP3104:nonlocal聲明。使用nonlocal可以聲明一個外部變數(不是global變數)
· PEP3111:raw_input() 改名為input()，也就是說，新的input()函數從標准輸入設備(sys.stdin)讀取一行並返回(不包括行結束符)，如果輸入過早終止，該函數拋出EOFError，如果想使用老的input()，可以使用(input())代替。
· xrange()改名為range()，range()現在不是產生一個列表(list)，而是一個迭代器。
· PEP3113:移除了"元組參數拆包(tuple parameter unpacking)"。這種寫法已經不行了：
1. deffoo(a, (b, c)):…
2.
3. 現在要這樣寫:
4.
5. deffoo(a, b_c):
6. b,c = b_c
· PEP3114:next()重命名為__next__(),新的內建函數next()可以調用一個對象的__next__()方法。
· PEP3127:新的八進制字面量，二進制字面量和bin()函數。你應該寫0o666而不是0666，oct()函數也做了響應的改動。同樣，0b1010等價於10，bin(10)返回"0b1010″。0666這種寫法現在是錯誤的。
· PEP3132:支持迭代器拆包。現在你可以這樣寫:
1 a,b, *rest = some_seqence
2
3 甚至象這樣：
4
5 *rest,a = stuff
6 一般情況下，rest對象是list，而等號右邊的對象是可迭代的
· PEP3135:新的super()。你可以不適用任何參數調用super()，正確的參數和實例會被正確選擇。如果使用參數，它的行為不變，和以前一樣。
· zip(),map(),filter()返回迭代器。
· 移除了string.letters和它的小夥伴們(string.lowcase和string.uppercase)，現在上場的是string.ascii_letters等
· 移除了apply(),callable(),exefile(),file(),rece(),reload()
· 移除了dict.has_key()。使用in操作符進行測試
· exec語句沒有了，現在是exec()函數
· 移除了__oct__()和__hex__()特殊方法。oct()和hex()方法使用__index__()
· 移除了對__members__和__methods__的支持
· nb_nonzero重命名為nb_bool,__nonzero__()重命名為__bool__()
Optimizations
· 一般情況下，python 3.0比python 2.5慢33%左右。不過仍有提升空間。
模塊變動(新的，改進的和廢棄的)
· 移除了cPickle模塊，可以使用pickle模塊代替。最終我們將會有一個透明高效的模塊。
· 移除了imageop模塊
· 移除了audiodev, Bastion, bsddb185,exceptions, linuxaudiodev, md5, MimeWriter, mimify, popen2, rexec, sets, sha,stringold, strop, sunaudiodev, timing和xmllib模塊
· 移除了bsddb模塊(單獨發布，可以從獲取)
· 移除了new模塊
· os.tmpnam()和os.tmpfile()函數被移動到tmpfile模塊下
· tokenize模塊現在使用bytes工作。主要的入口點不再是generate_tokens，而是tokenize.tokenize()
Build and C API Changes

Python's build process和C API的改動包括:
· PEP3118:新的Buffer API
PEP3121:擴展模塊的的Initialization& Finalization
· PEP3123:使PyObject_HEAD符合標准C
其他的改動和修復

閱讀全文

熱點內容

java返回this 發布：2025-10-20 08:28:16 瀏覽：845

製作腳本網站發布：2025-10-20 08:17:34 瀏覽：1109

python中的init方法發布：2025-10-20 08:17:33 瀏覽：815

圖案密碼什麼意思發布：2025-10-20 08:16:56 瀏覽：983

怎麼清理微信視頻緩存發布：2025-10-20 08:12:37 瀏覽：872

c語言編譯器怎麼看執行過程發布：2025-10-20 08:00:32 瀏覽：1221

郵箱如何填寫發信伺服器發布：2025-10-20 07:45:27 瀏覽：442

shell腳本入門案例發布：2025-10-20 07:44:45 瀏覽：325

怎麼上傳照片瀏覽上傳發布：2025-10-20 07:44:03 瀏覽：1001

python股票數據獲取發布：2025-10-20 07:39:44 瀏覽：969

pythonbytesdecode

與pythonbytesdecode相關的資訊