php字元串截取中英文

發布時間: 2023-08-06 16:22:13

㈠ php 如何實現按字數分割中英文混雜字元串成數組

以下是我編寫的代碼，實現對中英文混雜字元進行分割：

<?php
function mbStrSplit ($string, $len=1) {
$start = 0;
$strlen = mb_strlen($string);
while ($strlen) {
$array[] = mb_substr($string,$start,$len,"utf8");
$string = mb_substr($string, $len, $strlen,"utf8");
$strlen = mb_strlen($string);
}
return $array;
}

header('Content-type:text/html;charset=utf-8');
$str = '我愛北京3我愛上海-我愛xianggang';
$r = mbStrSplit($str, 4);
echo '<pre>';
print_r($r);
echo '</pre>';
?>

運行結果：

Array
(
[0] => 我愛北京
[1] => 3我愛上
[2] => 海-我愛
[3] => xian
[4] => ggan
[5] => g
)

㈡ php截取字元串之截取utf8或gbk編碼的中英文字元串示例

php中自帶strlen是返回的位元組數，對於utf8編碼的中文返回時3個，不滿足需求,下面給大家提供一個方法來完成這樣的功能
微博的發言有字數限制，其計數方式是，中文算2個，英文算1個，全形字元算2個，半形字元算1個。
php中自帶strlen是返回的位元組數，對於utf8編碼的中文返回時3個，不滿足需求。
mb_strlen
可以根據字元集計算長度，比如utf8的中文計數為1，但這不符合微博字數限制需求，中文必須計算為2才可以。
google了下，找到一個discuz中截取各種編碼字元的類，改造了下，已經測試通過.其中參數$charset
只支持gbk與utf-8。

代碼如下:
$a
=
"s＠@你好";
var_mp(strlen_weibo($a,'utf-8'));

結果輸出為8，其中字母s計數為1，全形＠計數為2，半形@計數為1，兩個中文計數為4。源碼如下：

代碼如下:
function
strlen_weibo($string,
$charset='utf-8')
{

$n
=
$count
=
0;

$length
=
strlen($string);

if
(strtolower($charset)
==
'utf-8')

{

while
($n
<
$length)

{

$currentByte
=
ord($string[$n]);

if
($currentByte
==
9
||

$currentByte
==
10
||

(32
<=
$currentByte
&&
$currentByte
<=
126))

{

$n++;

$count++;

}
elseif
(194
<=
$currentByte
&&
$currentByte
<=
223)

{

$n
+=
2;

$count
+=
2;

}
elseif
(224
<=
$currentByte
&&
$currentByte
<=
239)

{

$n
+=
3;

$count
+=
2;

}
elseif
(240
<=
$currentByte
&&
$currentByte
<=
247)

{

$n
+=
4;

$count
+=
2;

}
elseif
(248
<=
$currentByte
&&
$currentByte
<=
251)

{

$n
+=
5;

$count
+=
2;

}
elseif
($currentByte
==
252
||
$currentByte
==
253)

{

$n
+=
6;

$count
+=
2;

}
else

{

$n++;

$count++;

}

if
($count
>=
$length)

{

break;

}

}

return
$count;

}
else

{

for
($i
=
0;
$i
<
$length;
$i++)

{

if
(ord($string[$i])
>
127)

{

$i++;

$count++;

}

$count++;

}

return
$count;

}
}

㈢ php中有幾個截取字元創的函數

函數名作用 php版本
chr() 從指定的 ASCII 值返回字元。 3
chunk_split() 把字元串分割為一連串更小的部分。 3
count_chars() 返回字元串所用字元的信息。 4
explode() 把字元串打散為數組。 3
implode() 把數組元素組合為一個字元串。 3
join() implode() 的別名。 3
levenshtein() 返回兩個字元串之間的 Levenshtein 距離。 3
localeconv() 返回包含本地數字及貨幣信息格式的數組。 4
ltrim() 從字元串左側刪除空格或其他預定義字元。 3
md5() 計算字元串的 MD5 散列。 3
md5_file() 計算文件的 MD5 散列。 4
metaphone() 計算字元串的 metaphone 鍵。 4
money_format() 把字元串格式化為貨幣字元串。 4
nl_langinfo() 返回指定的本地信息。 4
nl2br() 在字元串中的每個新行之前插入 HTML 換行符。 3
number_format() 通過千位分組來格式化數字。 3
parse_str() 把查詢字元串解析到變數中。 3
print() 輸出一個或多個字元串。 3
printf() 輸出格式化的字元串。 3
similar_text() 計算兩個字元串的匹配字元的數目。 3
sprintf() 把格式化的字元串寫寫入一個變數中。 3
str_ireplace() 替換字元串中的一些字元。（對大小寫不敏感） 5
str_replace() 替換字元串中的一些字元。（對大小寫敏感） 3
str_split() 把字元串分割到數組中。 5
strcasecmp() 比較兩個字元串。（對大小寫不敏感） 3
strchr() 搜索字元串在另一字元串中的第一次出現。strstr() 的別名 3
strcspn() 返回在找到任何指定的字元之前，在字元串查找的字元數。 3
stripos() 返回字元串在另一字元串中第一次出現的位置(大小寫不敏感) 5
stristr() 查找字元串在另一字元串中第一次出現的位置(大小寫不敏感) 3
strlen() 返回字元串的長度。 3
strpbrk() 在字元串中搜索指定字元中的任意一個。 5
strpos() 返回字元串在另一字元串中首次出現的位置（對大小寫敏感） 3
strrchr() 查找字元串在另一個字元串中最後一次出現的位置。 3
strripos() 查找字元串在另一字元串中最後出現的位置(對大小寫不敏感) 5
strrpos() 查找字元串在另一字元串中最後出現的位置(對大小寫敏感) 3
strspn() 返回在字元串中包含的特定字元的數目。 3
strstr() 搜索字元串在另一字元串中的首次出現（對大小寫敏感） 3
strtok() 把字元串分割為更小的字元串。 3
strtr() 轉換字元串中特定的字元。 3
substr() 返回字元串的一部分。 3
substr_compare() 從指定的開始長度比較兩個字元串。 5
substr_count() 計運算元串在字元串中出現的次數。 4
substr_replace() 把字元串的一部分替換為另一個字元串。 4
ucwords() 把字元串中每個單詞的首字元轉換為大寫。 3
wordwrap() 按照指定長度對字元串進行折行處理。 4

㈣ PHP指定截取字元串中的中英文或數字字元的實例分享

我們在開發過程中，經常會碰到截取中文英文數字等的問題，大家知道中文所佔的字元和英文數字是不同的；然後我們就會在項目的common里寫一些日常的函數包含時間計算轉換和中英文字元截取的函數；比如截取中英文的函數沒個幾行代碼恐怕拿不下來的吧，現在就告訴大家一個簡單的(自己本地運行過的)，如有問題，請大家多多指教

$c
=
'ddaabbccaa';
$d
=
'地球需要我們每個人的愛護';
$frist1
=
mb_substr(
$c,
0,
1
,"UTF-8");
//
d
$delete_last1
=
mb_substr($d,
-1,1,"UTF-8");
//
護
echo
$frist1.'+++'.$delete_last1.' ';
//
d+++護
$frist2
=
mb_substr(
$d,
0,
1
,"UTF-8");
//
地
$delete_last2
=
mb_substr($d,
-1,1,"UTF-8");
//
護
echo
$frist2.'+++'.$delete_last2.' ';
//
地+++護
$e
=
'11aa22cc33';
$f
=
'aa地球需要我們每個人的愛護';
$g
=
'地球需要我們每個人的愛護gg';
$h
=
'地球需要我們每個人的愛護';
$first3
=
mb_substr(
$e,
0,
1
,"UTF-8");
//
1
$last3
=
mb_substr(
$f,
0,
1
,"UTF-8");
//
a
$delete_last3
=
mb_substr($f,
-1,1,"UTF-8");
//
護
$delete_last4
=
mb_substr($g,
-1,1,"UTF-8");
//
g
$frist4
=
mb_substr(
$g,
0,
1
,"UTF-8");
//
地
$delete_last5
=
mb_substr($h,
-1,1,"UTF-8");
//
護
echo
$first3.'+++'.$last3.'---'.$delete_last3.'***'.$delete_last4.'&&&'.$frist4.' ';
//
1+++a---護***g&&&地
echo
$last3.'...'.$delete_last3.' ';
//
a...護
echo
$frist4.'...'.$delete_last5.' ';
//
地...護
//
這樣不管字元串里是中英文數字等都是可以的無需判斷，如:
」地...護「
或者
「地...」
或者
「...護」
PS：過濾字元串中空格的方法
去除字元串首尾中英文空格的方法：
function
mbTrim($str)
{
return
mb_ereg_replace('(^(|
)+|(|
)+$)',
'',
$str);
}
下面的正則驗證時過濾掉用戶輸入的連續空格，包括全形空格和半形空格
$user
=
mb_ereg_replace('^(|
)+',
'',
$user);
$user
=
mb_ereg_replace('(|
)+$',
'',
$user);
$age
=
mb_ereg_replace('^(|
)+',
'',
$age);
$age
=
mb_ereg_replace('(|
)+$',
'',
$age);
$method
=
mb_ereg_replace('^(|
)+',
'',
$method);
$method
=
mb_ereg_replace('(|
)+$',
'',
$method);
$address
=
mb_ereg_replace('^(|
)+',
'',
$address);
$address
=
mb_ereg_replace('(|
)+$',
'',
$address);

閱讀全文

熱點內容

半導體靜態存儲器發布：2025-03-22 05:53:34 瀏覽：793

編程知識卡片發布：2025-03-22 05:40:40 瀏覽：371

搭建的網站伺服器連接失敗發布：2025-03-22 05:39:08 瀏覽：592

浪潮的伺服器地址發布：2025-03-22 05:37:30 瀏覽：410

凱撒加密在線發布：2025-03-22 05:36:45 瀏覽：656

空調壓縮機銘牌含義發布：2025-03-22 05:27:03 瀏覽：62

編程強省發布：2025-03-22 05:26:21 瀏覽：142

跨雲伺服器平台發布：2025-03-22 05:25:30 瀏覽：654

安卓如何在寶馬車上放歌發布：2025-03-22 05:06:15 瀏覽：284

命令提示符進入文件夾發布：2025-03-22 05:00:09 瀏覽：408

php字元串截取中英文

與php字元串截取中英文相關的資訊