PureBasic - форум

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » PureBasic - форум » Вопросы по PureBasic » UTF8, Unicode и 1251 ???


UTF8, Unicode и 1251 ???

Сообщений 1 страница 2 из 2

1

> UTF-8 (от англ. Unicode Transformation Format, 8-bit — «формат преобразования Юникода, 8-битный»)
— одна из общепринятых и стандартизированных кодировок текста, которая позволяет
хранить символы Юникода, используя переменное количество байт (от 1 до 6).

Проверяем в PB
исходные данные
Буква "П"
В Unicode 041F => вручную в UTF8 = D09F

Позиция<=слово для теста
CF.EE.E7.E8.F6.E8.FF <= хранится в памяти в win1251

PokeS(,,,#PB_Unicode)
1F.04.3E.04.37.04.38.04.46.04.38.04.4F.04 <= !? PB_Unicode с перестановкой байтов

PokeS(,,,#PB_UTF8)
C3.8F.C3.AE.C3.A7.C3.A8.C3.B6.C3.A8.C3.BF <= ????

Декодируем вручную из UTF8 => CF ??? Да это же буква "П" в Win1251 CF !!!

Как же так? Ведь в UTF8 должен быть код Unicode а не Win1251 !!!

И как сделать так чтобы в  UTF8-строке был код Unicode ?

0

2

Уже обсуждалось http://purebasic.info/phpBB3ex/viewtopi … amp;t=1661
Но с версии 5.50 уже не актуально, т. к. ASCII больше не поддерживается, а если прогу компилировать с поддержкой юникода то описанной проблемы нет.

0


Вы здесь » PureBasic - форум » Вопросы по PureBasic » UTF8, Unicode и 1251 ???