符号化形式 |
環境依存のEndianness(memoryでのByte Order)
Multi-Byte文字のByte Orderが標準出力に影響 |
BOM(Byte Order Mark)
Byte Orderを区別する印 |
---|---|---|
UTF-8 | 1Byte毎に処理するので影響なし |
0xEF 0xBB 0xBF
現在はBOMなし推奨 |
UTF-16 |
BE/Big Endianness/Most Significant Byte first
LE/Little Endianness/Least Significant Byte first BE既定/UTF-8と1Byte文字の互換性あり |
0xFE 0xFF
0xFF 0xFE BOMなしの場合 |
UTF-16BE |
BE/上位Byteがmemoryの下位addressに格納される場合
または上位Byteから先に標準出力する場合 |
BOMなし必須 |
UTF-16LE |
LE/下位Byteがmemoryの下位addressに格納される場合
または下位Byteから先に標準出力する場合 |
BOMなし必須 |
例)下記16進数表記2Bytesのdata
0x1234 上位(の桁)1Byte: 0x12 下位(の桁)1Byte: 0x34 BE: 0x12→0x34の順にmemoryに格納または標準出力 LE: 0x34→0x12の順にmemoryに格納または標準出力 |