當前位置:首頁 » 編程語言 » gb2312轉utf8php

gb2312轉utf8php

發布時間: 2024-08-14 09:27:06

『壹』 php中用utf8編碼輸出中文就是亂碼

header("Content-Type: text/html; charset=utf-8");
可以省略,因為在meta已經定義了。
亂碼的原因是保存文件時,文件的編碼與顯示編碼不一致,只要另存為一次就好了

『貳』 php實現utf-8和GB2312編碼相互轉換函數代碼

復制代碼
代碼如下:
<?php
/********************************************

*

*
函數名:get_utf8_to_gb($value)

*

用:utf8編碼字元串轉換成gb2312編碼

*

者:劉先忠

*

期:2011-11-09

*

********************************************/
function
get_utf8_to_gb($value){

$value_1=
$value;

$value_2
=
@iconv(
"utf-8",
"gb2312//IGNORE",$value_1);//使用@抵制錯誤,如果轉換字元串中,某一個字元在目標字元集里沒有對應字元,那麼,這個字元之後的部分就被忽略掉了;即結果字元串內容不完整,此時要使用//IGNORE

$value_3
=
@iconv(
"gb2312",
"utf-8//IGNORE",$value_2);
if
(strlen($value_1)
==
strlen($value_3))

{

return
$value_2;

}else

{

return
$value_1;

}
}
/********************************************

*

*
函數名:get_gb_to_utf8($value)

*

用:gb2312編碼字元串轉換成utf8編碼

*

者:劉先忠

*

期:2011-11-09

*

********************************************/
function
get_gb_to_utf8($value){

$value_1=
$value;

$value_2
=
@iconv(
"gb2312",
"utf-8//IGNORE",$value_1);

$value_3
=
@iconv(
"utf-8",
"gb2312//IGNORE",$value_2);

if
(strlen($value_1)
==
strlen($value_3))

{

return
$value_2;

}else

{

return
$value_1;

}
}
?>

『叄』 怎樣將php源程序改為utf8

給個轉碼的方法給你吧! 你可以自己修改$outEncoding的參數,下面的方法默認是轉換為gb2312的字元集了,你調用方法就可以將你的字元串轉換字元

//中文字元編碼轉換
public function safeEncoding($string,$outEncoding ='GB2312')
{
$encoding = "UTF-8";
for($i=0;$i<strlen($string);$i++)
{
if(ord($string{$i})<128)
continue;

if((ord($string{$i})&224)==224)
{
//第一個位元組判斷通過
$char = $string{++$i};
if((ord($char)&128)==128)
{
//第二個位元組判斷通過
$char = $string{++$i};
if((ord($char)&128)==128)
{
$encoding = "UTF-8";
break;
}
}
}

if((ord($string{$i})&192)==192)
{
//第一個位元組判斷通過
$char = $string{++$i};
if((ord($char)&128)==128)
{
// 第二個位元組判斷通過
$encoding = "GB2312";
break;
}
}
}

if(strtoupper($encoding) == strtoupper($outEncoding))
return $string;
else
return iconv($encoding,$outEncoding,$string);
}

『肆』 如何將phpinfo字元串類型轉換

php中iconv、mb_convert_encoding函數字元編碼轉換詳解如下:

iconv函數庫能夠完成各種字元集間的轉換,是php編程中不可缺少的基礎函數庫。

  • 用法如下:

$string="親愛的朋友歡迎訪問博客,希望給您帶來一點點的幫助!";
iconv("utf8","gbk",$string)//將字元串string編碼由utf8轉變成gbk;
  • 擴展如下:

echo[MathProcessingError]str=′好,歡迎訪問博客,該博客記錄一個程序員的成長過程!′;echo′<br/>′;echoiconv(′GB2312′,′UTF−8′,str);//將字元串的編碼從GB2312轉到UTF-8
echo'<br/>';
echoiconv_substr([MathProcessingError]str,1,1,′UTF−8′);//按字元個數截取而非位元組printr(iconvgetencoding());//得到當前頁面編碼信息echoiconvstrlen(str,'UTF-8');//得到設定編碼的字元串長度
//也有這樣用的
[MathProcessingError]content=iconv("UTF−8","gbk//TRANSLIT",content);
  • 備註:

1、iconv不是php的默認函數,也是默認安裝的模塊。需要安裝才能用的。

如果是windows2000+php,你可以修改php.ini文件,將extension=php_iconv.dll前的";"去掉,同時你要你的原php安裝文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是這個目錄,我本地的沒有操作這一步)

linux環境下,用靜態安裝的方式,在configure時加多一項 --with-iconv就可以了,phpinfo看得到iconv的項。(Linux7.3+Apache4.06+php4.3.2);

到此php中的iconv 介紹完畢

2、用iconv函數把抓取來過的utf-8編碼的頁面轉成gb2312, 發現只有用iconv函數把抓取過來的數據一轉碼數據就會無緣無故的少一些。原因是這樣的:

string iconv ( string in_charset, string out_charset, string str )

注意:第二個參數,除了可以指定要轉化到的編碼以外,還可以增加兩個後綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會自動將不能直接轉化的字元變成一個或多個近似的字元,//IGNORE 會忽略掉不能轉化的字元,而默認效果是從第一個非法字元截斷。 被截斷了,當然就會少了;

可以這樣修改iconv("UTF-8","GB2312//IGNORE",$string) 會忽略掉不能轉化的字元;

  • 附加:

  1. PHP中的mb_convert_encoding與iconv函數介紹

  2. mb_convert_encoding這個函數是用來轉換編碼的,和iconv函數差不多。

  3. 英文一般不會存在編碼問題,只有中文數據才會有這個問題。比如用Zend Studio或Editplus寫程序時,用的是gbk編碼,如果數據需要入資料庫,而資料庫的編碼為utf8時,這時就要把數據進行編碼轉換,不然進到資料庫就會變成亂碼。

  4. 做一個GBK To UTF-8

    <?php
    header("content-Type:text/html;charset=Utf-8");//設置字元的編碼是utp-8
    echomb_convert_encoding("你系我的友仔","UTF-8","GBK");
    ?>
  5. 再做GB2312 To Big5

<?php
header("content-Type:text/html;charset=big5");
echomb_convert_encoding("朋友","big5","GB2312");
?>

不過要使用上面的函數需要安裝但是需要先enable mbstring 擴展庫,道理還是一樣的,修改php.ini。

PHP中的另外一個函數iconv也是用來轉換字元串編碼的,與上函數功能相似。

下面還有一些詳細的例子:

iconv—
(PHP4>=4.0.5,PHP5)
mb_convert_encoding—Convertcharacterencoding
(PHP4>=4.0.6,PHP5)
  • 用法:

  1. stringmb_convert_encoding(stringstr,stringto_encoding[,mixedfrom_encoding]
  2. 需要先enable mbstring 擴展庫,在 php.ini里將; extension=php_mbstring.dll 前面的 ;

  3. 去掉mb_convert_encoding 可以指定多種輸入編碼,它會根據內容自動識別,但是執行效率比iconv差太多;

  4. 那為何還要講解 這個 mb_convert_encoding()函數呢?答案如下:

  5. 發現iconv在轉換字元」—」到gb2312時會出錯,如果沒有ignore參數,所有該字元後面的字元串都無法被保存。不管怎麼樣,這個」—」都無法轉換成功,無法輸出。

  6. 另外mb_convert_encoding沒有這個bug.

一般情況下用 iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉化後無法正常顯示時才用mb_convert_encoding 函數.

『伍』 php gb2312轉換UTF-8編碼

<?php
header("Content-Type:text/html; charset=GB2312");//定義頁面編碼方式gb2312
echo urlencode("網路");//gb2312編碼的
echo "<br>";//換行
echo urlencode(iconv('GB2312', 'UTF-8', '網路'));//utf-8編碼的
echo "<br>";
echo urlencode("網路");//還是gb2312編碼的
?>
規定好,頁面編碼後,頁面編碼就是統一不會再改變。
iconv 、mb_convert_encoding 這些函數改變的只是傳入那一個字元串的編碼。
而不是頁面編碼,別搞混了。
header("Content-Type:text/html; charset=GB2312");
才是規定頁面編碼的代碼。

熱點內容
上傳醫保局 發布:2024-11-25 14:57:00 瀏覽:732
刀劍神域緩存 發布:2024-11-25 14:56:07 瀏覽:520
c語言計算機二級編程題 發布:2024-11-25 14:46:49 瀏覽:313
c語言判斷進程是否存在 發布:2024-11-25 14:42:50 瀏覽:274
大數據緩存 發布:2024-11-25 14:29:07 瀏覽:436
存儲體與MAR 發布:2024-11-25 14:23:08 瀏覽:283
電腦瀏覽器怎麼取消配置文件 發布:2024-11-25 14:20:39 瀏覽:164
如何消除伺服器數據傳輸瓶頸 發布:2024-11-25 14:08:48 瀏覽:289
安卓開發程序如何上傳到手機上 發布:2024-11-25 14:08:30 瀏覽:29
訪客qq獲取系統源碼 發布:2024-11-25 14:08:30 瀏覽:18