當前位置:首頁 » 編程語言 » php字元串截取中英文

php字元串截取中英文

發布時間: 2023-08-06 16:22:13

php 如何實現按字數分割中英文混雜字元串成數組

以下是我編寫的代碼,實現對中英文混雜字元進行分割:

<?php
function mbStrSplit ($string, $len=1) {
$start = 0;
$strlen = mb_strlen($string);
while ($strlen) {
$array[] = mb_substr($string,$start,$len,"utf8");
$string = mb_substr($string, $len, $strlen,"utf8");
$strlen = mb_strlen($string);
}
return $array;
}

header('Content-type:text/html;charset=utf-8');
$str = '我愛北京3我愛上海-我愛xianggang';
$r = mbStrSplit($str, 4);
echo '<pre>';
print_r($r);
echo '</pre>';
?>

運行結果:

Array
(
[0] => 我愛北京
[1] => 3我愛上
[2] => 海-我愛
[3] => xian
[4] => ggan
[5] => g
)

㈡ php截取字元串之截取utf8或gbk編碼的中英文字元串示例

php中自帶strlen是返回的位元組數,對於utf8編碼的中文返回時3個,不滿足需求,下面給大家提供一個方法來完成這樣的功能
微博的發言有字數限制,其計數方式是,中文算2個,英文算1個,全形字元算2個,半形字元算1個。
php中自帶strlen是返回的位元組數,對於utf8編碼的中文返回時3個,不滿足需求。
mb_strlen
可以根據字元集計算長度,比如utf8的中文計數為1,但這不符合微博字數限制需求,中文必須計算為2才可以。
google了下,找到一個discuz中截取各種編碼字元的類,改造了下,已經測試通過.其中參數$charset
只支持gbk與utf-8。

代碼如下:
$a
=
"s@@你好";
var_mp(strlen_weibo($a,'utf-8'));

結果輸出為8,其中字母s計數為1,全形@計數為2,半形@計數為1,兩個中文計數為4。源碼如下:

代碼如下:
function
strlen_weibo($string,
$charset='utf-8')
{

$n
=
$count
=
0;

$length
=
strlen($string);

if
(strtolower($charset)
==
'utf-8')

{

while
($n
<
$length)

{

$currentByte
=
ord($string[$n]);

if
($currentByte
==
9
||

$currentByte
==
10
||

(32
<=
$currentByte
&&
$currentByte
<=
126))

{

$n++;

$count++;

}
elseif
(194
<=
$currentByte
&&
$currentByte
<=
223)

{

$n
+=
2;

$count
+=
2;

}
elseif
(224
<=
$currentByte
&&
$currentByte
<=
239)

{

$n
+=
3;

$count
+=
2;

}
elseif
(240
<=
$currentByte
&&
$currentByte
<=
247)

{

$n
+=
4;

$count
+=
2;

}
elseif
(248
<=
$currentByte
&&
$currentByte
<=
251)

{

$n
+=
5;

$count
+=
2;

}
elseif
($currentByte
==
252
||
$currentByte
==
253)

{

$n
+=
6;

$count
+=
2;

}
else

{

$n++;

$count++;

}

if
($count
>=
$length)

{

break;

}

}

return
$count;

}
else

{

for
($i
=
0;
$i
<
$length;
$i++)

{

if
(ord($string[$i])
>
127)

{

$i++;

$count++;

}

$count++;

}

return
$count;

}
}

㈢ php中有幾個截取字元創的函數

函數名 作用 php版本
chr() 從指定的 ASCII 值返回字元。 3
chunk_split() 把字元串分割為一連串更小的部分。 3
count_chars() 返回字元串所用字元的信息。 4
explode() 把字元串打散為數組。 3
implode() 把數組元素組合為一個字元串。 3
join() implode() 的別名。 3
levenshtein() 返回兩個字元串之間的 Levenshtein 距離。 3
localeconv() 返回包含本地數字及貨幣信息格式的數組。 4
ltrim() 從字元串左側刪除空格或其他預定義字元。 3
md5() 計算字元串的 MD5 散列。 3
md5_file() 計算文件的 MD5 散列。 4
metaphone() 計算字元串的 metaphone 鍵。 4
money_format() 把字元串格式化為貨幣字元串。 4
nl_langinfo() 返回指定的本地信息。 4
nl2br() 在字元串中的每個新行之前插入 HTML 換行符。 3
number_format() 通過千位分組來格式化數字。 3
parse_str() 把查詢字元串解析到變數中。 3
print() 輸出一個或多個字元串。 3
printf() 輸出格式化的字元串。 3
similar_text() 計算兩個字元串的匹配字元的數目。 3
sprintf() 把格式化的字元串寫寫入一個變數中。 3
str_ireplace() 替換字元串中的一些字元。(對大小寫不敏感) 5
str_replace() 替換字元串中的一些字元。(對大小寫敏感) 3
str_split() 把字元串分割到數組中。 5
strcasecmp() 比較兩個字元串。(對大小寫不敏感) 3
strchr() 搜索字元串在另一字元串中的第一次出現。strstr() 的別名 3
strcspn() 返回在找到任何指定的字元之前,在字元串查找的字元數。 3
stripos() 返回字元串在另一字元串中第一次出現的位置(大小寫不敏感) 5
stristr() 查找字元串在另一字元串中第一次出現的位置(大小寫不敏感) 3
strlen() 返回字元串的長度。 3
strpbrk() 在字元串中搜索指定字元中的任意一個。 5
strpos() 返回字元串在另一字元串中首次出現的位置(對大小寫敏感) 3
strrchr() 查找字元串在另一個字元串中最後一次出現的位置。 3
strripos() 查找字元串在另一字元串中最後出現的位置(對大小寫不敏感) 5
strrpos() 查找字元串在另一字元串中最後出現的位置(對大小寫敏感) 3
strspn() 返回在字元串中包含的特定字元的數目。 3
strstr() 搜索字元串在另一字元串中的首次出現(對大小寫敏感) 3
strtok() 把字元串分割為更小的字元串。 3
strtr() 轉換字元串中特定的字元。 3
substr() 返回字元串的一部分。 3
substr_compare() 從指定的開始長度比較兩個字元串。 5
substr_count() 計運算元串在字元串中出現的次數。 4
substr_replace() 把字元串的一部分替換為另一個字元串。 4
ucwords() 把字元串中每個單詞的首字元轉換為大寫。 3
wordwrap() 按照指定長度對字元串進行折行處理。 4

㈣ PHP指定截取字元串中的中英文或數字字元的實例分享

我們在開發過程中,經常會碰到截取中文英文數字等的問題,大家知道中文所佔的字元和英文數字是不同的;然後我們就會在項目的common里寫一些日常的函數包含時間計算轉換和中英文字元截取的函數;比如截取中英文的函數沒個幾行代碼恐怕拿不下來的吧,現在就告訴大家一個簡單的(自己本地運行過的),如有問題,請大家多多指教

$c
=
'ddaabbccaa';
$d
=
'地球需要我們每個人的愛護';
$frist1
=
mb_substr(
$c,
0,
1
,"UTF-8");
//
d
$delete_last1
=
mb_substr($d,
-1,1,"UTF-8");
//

echo
$frist1.'+++'.$delete_last1.'<br/>';
//
d+++護
$frist2
=
mb_substr(
$d,
0,
1
,"UTF-8");
//

$delete_last2
=
mb_substr($d,
-1,1,"UTF-8");
//

echo
$frist2.'+++'.$delete_last2.'<br/>';
//
地+++護
$e
=
'11aa22cc33';
$f
=
'aa地球需要我們每個人的愛護';
$g
=
'地球需要我們每個人的愛護gg';
$h
=
'地球需要我們每個人的愛護';
$first3
=
mb_substr(
$e,
0,
1
,"UTF-8");
//
1
$last3
=
mb_substr(
$f,
0,
1
,"UTF-8");
//
a
$delete_last3
=
mb_substr($f,
-1,1,"UTF-8");
//

$delete_last4
=
mb_substr($g,
-1,1,"UTF-8");
//
g
$frist4
=
mb_substr(
$g,
0,
1
,"UTF-8");
//

$delete_last5
=
mb_substr($h,
-1,1,"UTF-8");
//

echo
$first3.'+++'.$last3.'---'.$delete_last3.'***'.$delete_last4.'&&&'.$frist4.'<br/>';
//
1+++a---護***g&&&地
echo
$last3.'...'.$delete_last3.'<br/>';
//
a...護
echo
$frist4.'...'.$delete_last5.'<br/>';
//
地...護
//
這樣不管字元串里是中英文數字等都是可以的無需判斷,如:
」地...護「
或者
「地...」
或者
「...護」
PS:過濾字元串中空格的方法
去除字元串首尾中英文空格的方法:
function
mbTrim($str)
{
return
mb_ereg_replace('(^(|
)+|(|
)+$)',
'',
$str);
}
下面的正則驗證時過濾掉用戶輸入的連續空格,包括全形空格和半形空格
$user
=
mb_ereg_replace('^(|
)+',
'',
$user);
$user
=
mb_ereg_replace('(|
)+$',
'',
$user);
$age
=
mb_ereg_replace('^(|
)+',
'',
$age);
$age
=
mb_ereg_replace('(|
)+$',
'',
$age);
$method
=
mb_ereg_replace('^(|
)+',
'',
$method);
$method
=
mb_ereg_replace('(|
)+$',
'',
$method);
$address
=
mb_ereg_replace('^(|
)+',
'',
$address);
$address
=
mb_ereg_replace('(|
)+$',
'',
$address);

熱點內容
怎麼翻錄加密視頻 發布:2025-02-06 21:58:12 瀏覽:550
逃離塔科夫啟動器選什麼伺服器 發布:2025-02-06 21:44:48 瀏覽:292
我的世界手機版伺服器開服教程 發布:2025-02-06 21:43:01 瀏覽:272
微信娛樂源碼 發布:2025-02-06 21:34:53 瀏覽:530
編譯翻譯運行 發布:2025-02-06 21:05:20 瀏覽:201
安卓源碼版本 發布:2025-02-06 20:51:34 瀏覽:433
安卓系統網路播放器哪個好 發布:2025-02-06 20:42:02 瀏覽:818
頭條緩存的視頻格式 發布:2025-02-06 20:32:18 瀏覽:116
ftp不顯示文件夾 發布:2025-02-06 20:30:37 瀏覽:127
蘋果手機解壓怎麼打開 發布:2025-02-06 20:29:35 瀏覽:476