> UTF-8 (от англ. Unicode Transformation Format, 8-bit — «формат преобразования Юникода, 8-битный»)
— одна из общепринятых и стандартизированных кодировок текста, которая позволяет
хранить символы Юникода, используя переменное количество байт (от 1 до 6).
Проверяем в PB
исходные данные
Буква "П"
В Unicode 041F => вручную в UTF8 = D09F
Позиция<=слово для теста
CF.EE.E7.E8.F6.E8.FF <= хранится в памяти в win1251
PokeS(,,,#PB_Unicode)
1F.04.3E.04.37.04.38.04.46.04.38.04.4F.04 <= !? PB_Unicode с перестановкой байтов
PokeS(,,,#PB_UTF8)
C3.8F.C3.AE.C3.A7.C3.A8.C3.B6.C3.A8.C3.BF <= ????
Декодируем вручную из UTF8 => CF ??? Да это же буква "П" в Win1251 CF !!!
Как же так? Ведь в UTF8 должен быть код Unicode а не Win1251 !!!
И как сделать так чтобы в UTF8-строке был код Unicode ?