Codificaciones de caracteres admitidas

Actualmente, el módulo mbstring admite las siguientes condificaciones de caracteres. Cualquiera de estas codificaciones de caracteres se puede especificar en el parámetro encoding de las funciones de mbstring.

Esta extensión de PHP admite las siguientes codificaciones de caracteres:

  • UCS-4*
  • UCS-4BE
  • UCS-4LE*
  • UCS-2
  • UCS-2BE
  • UCS-2LE
  • UTF-32*
  • UTF-32BE*
  • UTF-32LE*
  • UTF-16*
  • UTF-16BE*
  • UTF-16LE*
  • UTF-7
  • UTF7-IMAP
  • UTF-8*
  • ASCII*
  • EUC-JP*
  • SJIS*
  • eucJP-win*
  • SJIS-win*
  • ISO-2022-JP
  • ISO-2022-JP-MS
  • CP932
  • CP51932
  • SJIS-mac** (alias: MacJapanese)
  • SJIS-Mobile#DOCOMO** (alias: SJIS-DOCOMO)
  • SJIS-Mobile#KDDI** (alias: SJIS-KDDI)
  • SJIS-Mobile#SOFTBANK** (alias: SJIS-SOFTBANK)
  • UTF-8-Mobile#DOCOMO** (alias: UTF-8-DOCOMO)
  • UTF-8-Mobile#KDDI-A**
  • UTF-8-Mobile#KDDI-B** (alias: UTF-8-KDDI)
  • UTF-8-Mobile#SOFTBANK** (alias: UTF-8-SOFTBANK)
  • ISO-2022-JP-MOBILE#KDDI** (alias: ISO-2022-JP-KDDI)
  • JIS
  • JIS-ms
  • CP50220
  • CP50220raw
  • CP50221
  • CP50222
  • ISO-8859-1*
  • ISO-8859-2*
  • ISO-8859-3*
  • ISO-8859-4*
  • ISO-8859-5*
  • ISO-8859-6*
  • ISO-8859-7*
  • ISO-8859-8*
  • ISO-8859-9*
  • ISO-8859-10*
  • ISO-8859-13*
  • ISO-8859-14*
  • ISO-8859-15*
  • byte2be
  • byte2le
  • byte4be
  • byte4le
  • BASE64
  • HTML-ENTITIES
  • 7bit
  • 8bit
  • EUC-CN*
  • CP936
  • GB18030**
  • HZ
  • EUC-TW*
  • CP950
  • BIG-5*
  • EUC-KR*
  • UHC (CP949)
  • ISO-2022-KR
  • Windows-1251 (CP1251)
  • Windows-1252 (CP1252)
  • CP866 (IBM866)
  • KOI8-R*

* denota codificaciones que pueden ser utilizadas en expresiones regulares también.

** denota codificaciones que están disponibles desde PHP 5.4.0.

Cualquier entrada en php.ini que acepte un nombre de codificación también puede utilizar los valores "auto" y "pass". Las funciones de mbstring que aceptan un nombre de codificación también pueden utilizar el valor "auto".

Si se establece el valor "pass", no se utilizará ninguna conversión de la codificación de caracteres.

Si se establece el valor "auto", se utilizará la lista de codificaciones definida por el NLS. Por ejemplo, si el NLS está configurado como Japanese, el valor que se asume será "ASCII,JIS,UTF-8,EUC-JP,SJIS".

Véase también mb_detect_order()

add a note add a note

User Contributed Notes 3 notes

up
2
akniep at rayo dot info
1 year ago
Use mb_list_encodings() to check if an encoding is supported by mbstring before using its functions for it.
up
1
Tomolimo (olivier dot moron at raynet-it dot com)
1 year ago
Apart of this list, GB2312 encoding is also supported.
It is Chinese Simplified encoding which is now superseded by GB18030, but GB2312 is not in the list.
If you try to us it, the result will allright even if it is not in the list.
Regards,
Tomolimo
up
0
Anonymous
1 month ago
CP850 (DOS-Latin-1) is also supported.
To Top