PHPerKaigi 2025

iconv_strlen

(PHP 5, PHP 7, PHP 8)

iconv_strlenВозвращает количество символов в строке

Описание

iconv_strlen(string $string, ?string $encoding = null): int|false

В отличие от функции strlen(), функция iconv_strlen() учитывает кодировку строки. Длина строки string иногда не соответствует количеству байтов в ней, поскольку в кодировках символы кодируются переменным количеством байтов, например, в Юникоде символы кодируются и двумя, и четырьмя байтами.

Список параметров

string

Строка.

encoding

Функция предполагает, что кодировка строки string эквивалентна значению директивы iconv.internal_encoding, если параметр encoding опустили.

Возвращаемые значения

Функция возвращает количество символов в аргументе string в виде целого числа или false, если при кодировании возникла ошибка.

Список изменений

Версия Описание
8.0.0 Параметр encoding теперь принимает значение null.

Смотрите также

  • grapheme_strlen() - Получает длину строки в единицах графемы
  • mb_strlen() - Получает длину строки
  • strlen() - Получает длину строки

Добавить

Примечания пользователей 2 notes

up
12
hfuecks @ nospam org
18 years ago
If iconv_strlen is passed a UTF-8 string containing badly formed sequences, it will return FALSE. This is in contrast to mb_strlen of the behaviour of utf8_decode, which strip out any bad sequences;

<?php
# UTF-8 string containing bad sequence: \xe9
$str = "I?t?rn?ti?n\xe9?liz?ti?n";

print
"mb_strlen: ".mb_strlen($str,'UTF-8')."\n";
print
"strlen/utf8_decode: ".strlen(utf8_decode($str))."\n";
print
"iconv_strlen: ".iconv_strlen($str,'UTF-8')."\n";
?>

Displays;

mb_strlen: 20
strlen/utf8_decode: 20
iconv_strlen:

(PHP 5.0.5)

As such it is being "stricter" than mb_strlen and it may mean you need to check for invalid sequences first. A quick way to check is to exploit the behaviour of the PCRE extension (see notes on pattern modifiers);

<?php
if (preg_match('/^.{1}/us',$str,$ar) != 1) {
die(
"string contains invalid UTF-8");
}
?>

A slower but stricter check (regex) can be found at: http://www.w3.org/International/questions/qa-forms-utf-8

Similiar applies to iconv_substr, iconv_strpos and iconv_strrpos
up
4
sheryl
4 years ago
Notice there is a disconnect:
>If charset`parameter is omitted, str is assumed to be encoded in iconv.internal_encoding.

But clicking on the iconv.internal_encoding link (https://www.php.net/manual/en/iconv.configuration.php), the docs indicate that iconv.internal_encoding is deprecated since 5.6.
To Top