Неявные преобразования типа char
- Войдите на сайт для отправки комментариев
Вс, 12/05/2019 - 12:44
вынужден задать вопрос в Песочнице, так как вопрос явно элементарный... ноя не понимаю.
Ардуино ИДЕ 1.8.3, плата Уно
Код
char m[] = "Привет"; void setup() { Serial.begin(115200); while (! Serial); for (byte i =0; m[i]; i++ ) Serial.println(m[i], HEX); } void loop() {}
Вывод:
FFFFFFD0 FFFFFF9F FFFFFFD1 FFFFFF80 FFFFFFD0 FFFFFFB8 FFFFFFD0 FFFFFFB2 .....
Если в первой строке кода поменять тип строки на unsigned cahr - печается все нормально, 8-битные значения.
Возникает два вопроса:
- в шестнадцатиричном представлении знаковый и беззнаковый символ совпадают же - так откуда разница?
- судя по количеству символов в выводе, знаковый символ при печати превратился в лонг??? -
Особенность реализации.
Дело в том, что у класса Print есть метод для беззнакового char и системы счисления
Потому беззнаковый и работает нормально.
А такого же метода для знакового char - нет (т.е. нет метода size_t print(char, int = DEC); )
Компилятор начинает искать походящий метод. Находит для int, но он на самом деле просто прокси на long, смотрите:
Вот Вы и получаете печать long в результате.
Евгений, дело не только в классе принт
Смотрите, если код поменять вот так:
то для unsigned char значения символов 0xD0 будут напечатаны, а для знакового - нет, так как на самом деле компилятор при сравнении в строке 6 тоже конвертирует символы в 0xFFFFFFD0, а это конечно не равно 0xD0
m[i] преобразуется в int и будет равно FFD0, а второй операнд 0xD0 уже int, поэтому и результат false.
Вопщем, век живи, - век в канпилятор плюйся.
То есть самый безопасный способ сравнения char - сравнение с другим char?
Или приведением. == (char)0xd0.
Евгений, дело не только в классе принт
то для unsigned char значения символов 0xD0 будут напечатаны, а для знакового - нет, так как на самом деле компилятор при сравнении в строке 6 тоже конвертирует символы в 0xFFFFFFD0, а это конечно не равно 0xD0
Это уже другой вопрос (там было "только"). А здесь Green уже ответил. Вы сравниваете char с int, разумеется, перед сравнением всё будет преобразовано к int.
Вообще, с автоматическими преобразованиями надо поосторожнее, я как раз сегодня в сосендней теме об этом писал совсем по другому поводу.
То есть самый безопасный способ сравнения char - сравнение с другим char?
Да, самый безопасный - не смешивать типы в выражении и не полагаться на неявные преобразования.
Коллеги, я тут писал симпатичный (на мой взгляд) примерчик на использование переполнения, и по ходу написания наткнулся на ещё одну красивую ошибку связанную с неявнями преобразованиями типов.
Посмотрите на вот этот код.
Все числа до единого описаны как uint8_t, то бишь беззнаковые. Как Вам нравится остаток от деления на 32 равный 255.
Это, собственно, про тоже, о чём тут речь шла. Пояснять, надеюсь, не нужно?
Пояснять, надеюсь, не нужно?
нужно.
Не понимаю, почему выражение в скобках (e-s) в котором оба операнда имеют тип uint8_t, не приводится автоматически к этому же типу? я всегда считал, что если все операнды в выражении одного типа, то результат будет этого же типа без всяких приведений.
int - int = int, int % int = int, а после int приведится к uint8 (пока нет ЕвгенияП)).
int - int = int, int % int = int, а после int приведится к uint8 (пока нет ЕвгенияП)).
да откуда ж там int - int = int ? там же явным образом ( uint8 - uint8)
Такие правила.( Любые операнды типа char, unsigned char или short преобразуются к типу int.
Подставляем: 31 - 32 = -1, -1 % 32 = -1, преобразуем в uint8 = 255. Сейчас Евгений разнесёт.)
Помните эпичный срач про сдвиги, когда Великий газировал лужу насчёт кривизны компилятора, а когда ему показали, что поведение компилятора полностью соответствует стандарту языка, он продолжил газирование, заявлением, что «в стандарте тоже много несуразностей», т.е. «язык тоже кривой» :)
Так вот, здесь ровно тоже самое и ровно по тем же причинам. Собственно, там я всё подробно объяснял, и потому думал, что дальнейших пояснений не надо. Ну, давайте расскажу тоже самое на примере не сдвигов, а арифметических операций.
Давайте посмотрим на определения операции умножения и деления (*, /, %), а также сложения и вычитания (только то, что нас интересует):
Ага, значит перед выполнением арифметической операции должны быть применены «usual arithmetic conversions». Смотрим, что за зверь такой. Полное определение «usual arithmetic conversions» даётся в разделе 8(11) стандарта (стр. 94). Там много всего, нас интересует только фраза из п. 8(11.5) «Otherwise, the integral promotions shall be performed on both operands».
Час от часу не легче, значит, для обоих операндов должны быть выполнены «integral promotions»
Этому зверю целиком посвящён раздел 7.6 стандарта. Там тоже хватает всего, но нас интересует пункт 7.6(1) на стр. 89 – «A prvalue of an integer type other than bool, char16_t, char32_t, or wchar_t whose integer conversion rank is less than the rank of int can be converted to a prvalue of type int if int can represent all the values of the source type; otherwise, the source prvalue can be converted to a prvalue of type unsigned int»
Ну, вот и чудненько. Значит, перед выполнением арифметической операции, мы должны с каждым операндом, размер которого меньше размера типа int, проделать такую штуку:
Вот и давайте теперь пошагово разберём код:
Итак, первым выполняется действие в скобках. Оба операнда короче int. Все их возможные значения (0-255) в int вполне себе помещаются. Значит, e и s будут преобразованы к int, а потом над ними выполнена операция вычитания. Результат очевидно, имеет тим int и равен -1.
Далее выполняется %. Первый операнд уже int, как мы выяснили. Второй - короче int. Все его возможные значения (0-255) в int вполне себе помещаются, стало быть его тоже преобразуют в int. После этого будет выполнена операция % над двумя операндами типа int: "-1 % 32". Результат этой операции, очевидно равен -1 (типа int).
Ну, и операция присваивания. Перед её выполнением, правая часть будет преобразована к типу левой (к uint8_t ), т.е. -1 превратится в 255, что мы ошалело и наблюдаем.
Случай
я так подробно разбирать не буду. В скобках также получится -1 типа int, но она тут же будет преобразована к uint8_t и станет 255. При выполнении % оба операнда снова будут преобразованы к типу int и будет выполнена операция "255 % 32". Результат 31. При присваивании, 31 преобразуется к типу uint8_t без видимых изменений.
Ну, вот как-то так. Собственно, здесь нет ничего, чего бы уже не объяснил коллега Green, за что ему спасибо, просто я счёл нужным рассказать с прямыми ссылками на "Завет".
Пример я привёл исключительно в подтверждение ранее высказанной мысли - не стоит полагаться на неявные преобразования - там граблей разбросано немерянно. Я вот, например, знаю и понимаю что и как там происходит (всё, что здесь написал), но это отнюдь не помешало мне сегодня по этим граблям пройтись. Проблемой это, конечно, не стало (ругнулся и поправил), но на грабли таки наступил.
Гыыы :) Великий !!!! газировал!!!! лужу !!!
плюсую неистово :)
Спасибо!
Но я все равно еще спрошу. можно?
как же все-таки обехопасить себя от подобных ситуаций. если даже Ваша рекомендация из #8 ("самый безопасный - не смешивать типы в выражении") - в данном случае не сработала. Все типы в вашем примере одинаковые
И еще я не вполне понял, почему такая разница между char и unsigned char - первый преобразуется к int в сравнении (см код в #2), а второй нет, хотя размер обоих меньше int
Так это известный срач. Вот про косяк компилятора, далее следует тыкание носом в стандарт, и через пять постов бессмертный перл про косяк языка.
И еще я не вполне понял, почему такая разница между char и unsigned char - первый преобразуется к int в сравнении (см код в #2), а второй нет, хотя размер обоих меньше int
Там дело не в сравнение, а в передаче параметров. У класса Print есть метод с параметром unsigned char, потому просто используется этот метод и ничего преобразовавыть не надо. А такого же метода с параметром char нет (авторы не написали), потому компилятор начинает искать подходящий метод, для чего выполняет то самое usual arithmetic conversions, о котором я и писал. Вот char в int и превращается.
Но я все равно еще спрошу. можно?
как же все-таки обехопасить себя от подобных ситуаций.
У меня другой вопрос возник сразу после прочтения: как, мать ево, вообще что-то работает у любителей, если такие фокусы компилятор по стандарту исполняет? Каждый второй газовый котёл должен взлетать на воздух...
Каждый второй газовый котёл должен взлетать на воздух...
Так, вроде, газовики, решившие свою задачу, больше на форум и не приходили.))))) Этакий, лайт геноцид.))))
Там дело не в сравнение, а в передаче параметров. У класса Print есть метод
Евгений, с классом принт был пример в заглавном посте. А я про код в #2, в котором дело не в классе Print
Сокращенный вариант:
В коде выше если m[] -массив типа char, равенство никогда не будет истинным, а для unsigned char все работает так, как ожидается. Поясните, почему в одном случае выполняется преобразование в инт, а в другом нет
Update. Сорри, туплю. В обоих случаях происходит преобразование, но в случае char преобразование идет в int и получается 0xFFD0 и условие ложно. А в случае unsigned char преобразуем в unsigned int и получаем 0x00D0, поэтому равенство выполняется
Но я все равно еще спрошу. можно?
как же все-таки обехопасить себя от подобных ситуаций.
У меня другой вопрос возник сразу после прочтения: как, мать ево, вообще что-то работает у любителей, если такие фокусы компилятор по стандарту исполняет? Каждый второй газовый котёл должен взлетать на воздух...
пора забить на канпилятор и писать в кодах?
Каждый второй газовый котёл должен взлетать на воздух...
Так, вроде, газовики, решившие свою задачу, больше на форум и не приходили.))))) Этакий, лайт геноцид.))))
Поэтому, наверное, во всех ардуинопримерах int-ы понатыканы даже там, где им вообще быть не нужно.
пора забить на канпилятор и писать в кодах?
Вы уверены. что качество полученного кода будет лучше, чем у канпилятора? :)))
пора забить на канпилятор и писать в кодах?
Ага - и искать ошибки в программе с тысячей строк причем не структурированных. Писал - удовольствие ниже среднего.
Поэтому я например беру разрядность переменных с запасом, чтоб компилятор не думал что к чему преобразовать.
Особенно много запаса можно разместить например в Тини13.)
Я отдельным табом держу в редакторе приоритеты и правила преобразований типов. Потому что плохо когда знаешь и забыл (ещё хуже когда не знаешь и забыл)).
пора забить на канпилятор и писать в кодах?
Вы уверены. что качество полученного кода будет лучше, чем у канпилятора? :)))
у Вас то однозначно будет лучше, ну или не хуже )))
У меня другой вопрос возник сразу после прочтения: как, мать ево, вообще что-то работает у любителей, если такие фокусы компилятор по стандарту исполняет? Каждый второй газовый котёл должен взлетать на воздух...
Если память мне не изменяет, далеко не все новички отписываются о результатах по окончании своих экспериментов.
У меня другой вопрос возник сразу после прочтения: как, мать ево, вообще что-то работает у любителей, если такие фокусы компилятор по стандарту исполняет?
А ну отставить беспорядок нарушат! А то додик в стрингах разяснит что.
Ты "наехал" на компилятор - это всегда принак тупости и непрофессионализма. Ровно так Архат уже делал.
Я бы не хотел, чтобы в мои слова вкладывался такой смысл, который позволял бы использовать их споре о корректности или некорректности работы компилятора.
Моё удивление связано с тем, что широкие массы любителей, внезапно получивших доступ к лёгким способам разработки и, на третий день после покупки development board, без задней (а часто - и передней) мысли пытающихся собирать контроллеры, управляющие потенциально опасными устройствами, так редко сталкиваются с проблемами неявного приведения типов, что взрывы их газовых котлов не слышны каждые пять минут.
Я бы не хотел, чтобы в мои слова вкладывался такой смысл, который позволял бы использовать их споре о корректности или некорректности работы компилятора.
Моё удивление связано с тем, что широкие массы любителей, внезапно получивших доступ к лёгким способам разработки и, на третий день после покупки development board, без задней (а часто - и передней) мысли пытающихся собирать контроллеры, управляющие потенциально опасными устройствами, так редко сталкиваются с проблемами неявного приведения типов, что взрывы их газовых котлов не слышны каждые пять минут.
"...известно расхожее мнение о доброте дельфинов, основанное на рассказах пловцов, которых животные толкали к берегу, но нет данных от тех, кого толкали в обратном направлении"
С другой стороны, всё не так трагично. Конструкторы контроллеров "на третий день после покупки" просто не доходят до стадии работающего контроллера, т.к. не могут включить китайский релейный модуль, спрашивают про него здесь, обижаются и бросают это дело. Или постепенно доходят - но тогда и контроллер может получиться вполне приличным.
А котлы взрывались задолго до появления ардуинства. И дипломированные конструкторы промавтоматики, бывает, такого наворотят, что хоть стой, хоть падай.
А я тут заметил, что вот эти ужастики про signed/unsigned – это ведь прямой ответ на часто всплывающий вопрос: как лучше определять константы – макросами через define или константами через const. Как раз, второй случай даёт нам полный контроль, а с первым – на откуп компилятору.
Да, с define это не всегда явно. Просто нужно знать что по умолчанию это int, но ничто не мешает указывать явно, дописывая U, L или UL, или вообще тип (uint8_t)XX. С другой стороны, тут как то своему пацану делал задание на C# - так там вообще нет препроцессора... Никакой тебе условной трансляции, никаких тебе define. Для меня это была тоска... Просто неудобно.)
делал задание на C# - так там вообще нет препроцессора... Никакой тебе условной трансляции, никаких тебе define. Для меня это была тоска... Просто неудобно.)
https://docs.microsoft.com/ru-ru/dotnet/csharp/language-reference/preprocessor-directives/preprocessor-define
Есть всё, и даже ConditionalAttribute. Т.е. сделать можно всё, определив директиву, а константы загнать в статические элементы структуры, которую (структуру) определить по разному в зависимости от какого-то define. Конечно, всё не так, как в С++, но кой-чего сделать можно. Впрочем, обычно не возникает необходимости, поскольку подход к программированию на С# - другой, и там и без препроцессора всё нормально реализуется.
Ну да, с наскоку не разобрался.( Немного по другому, конечно. Просто сразу подумал, ну раз "старший брат" от этого отказался, значит что то в этом есть.)
Да, с define это не всегда явно. Просто нужно знать что по умолчанию это int
К вопросу о #define:
----------
Тип целой константы зависит от ее вида, значения и суффикса (о типах см. А4). Если константа — десятичная и не имеет суффикса, то она принимает первый из следующих типов, который годится для представления ее значения: int, long int, unsigned long int.
Восьмеричная или шестнадцатеричная константа без суффикса принимает первый возможный из типов: int, unsigned int, long int, unsigned long int.
----------
Но это я так, по ходу дела. Решил, собственно, пройтись по этим неявным преобразованиям... и вот на чём споткнулся:
Читая K&R я понимаю алгоритм приведения так: первый операнд остаётся, как есть, второй, в соответствии с требованием целочисленного повышения, расширяется до размерности первого. С этим ОК. Далее, в результате перемножения, производимого в размерности uint16_t, я ожидал встретиться с переполнением, результат которого будет запихан в uint32_t.
Однако, Codelite мне рисует result: 16711425, что не очень-то похоже на ожидаемое. В каком месте я не дочитал про преобразования?
Однако, Codelite мне рисует result: 16711425, что не очень-то похоже на ожидаемое. В каком месте я не дочитал про преобразования?
ты что-то путаешь, 65535 * 255 как раз и будет 16711425, тут нет никаких неожиданностей
Ожидал, что все вычисления пройдут в размерности uint16_t (оба операнда должны быть приведены к наибольшей размерности) и только затем результат будет перенесён в переменную размерности uint32_t. А тут кажется, что вычисления происходят сразу в uint32_t.
Язык программирования Си, Брайан Керниган, Деннис Ритчи, 3-е издание
-----------
А 6.5. Арифметические преобразования
Во многих операциях преобразование типов операндов и определение типа результата осуществляются по одним и тем же правилам. Они состоят в том, что операнды приводятся к некоторому общему типу, который также является и типом результата.
-----------
Общий тип - uint16_t, стало быть и типом результата ему быть.
Во, а "на Ардуине" всё, как в букваре:
Итого: 65281.
В CodeLite нечестный Си подсунули штоли... Или на ПК всё приводится к 32-разрядному int (UINT_MAX = 4294967295), а не к ANSI (UINT_MAX = 65535)? Как же мне тогда на ПК провести этот эксперимент...
Памойму, на ПК int равен размеру указателя, т.е 4 байта для 32х разрядных программ и 8 для х64
Ожидал, что все вычисления пройдут в размерности uint16_t
Тогда запускайте в системе, где int 16-битный (на ардуине, например). Попробуйте напечатать sizeof(int), если он, паче чаяния, окажется 2, то будем думать дальше.
решил вот попробовать, но наверное не понял о чем спор выше, а так вроде все правильно int - 2 байта показывает
Ожидал, что все вычисления пройдут в размерности uint16_t
Тогда запускайте в системе, где int 16-битный (на ардуине, например). Попробуйте напечатать sizeof(int), если он, паче чаяния, окажется 2, то будем думать дальше.
sizeof(int), как и предсказывалось, равен 4.
Теперь я понял, почему так вышло - компилятор в CodeLite uint16_t притянул за уши к int, который фактически является uint32_t. Поэтому и не было переполнения.
P.S. Никому нельзя верить.
Но я все равно еще спрошу. можно?
как же все-таки обехопасить себя от подобных ситуаций.
У меня другой вопрос возник сразу после прочтения: как, мать ево, вообще что-то работает у любителей, если такие фокусы компилятор по стандарту исполняет? Каждый второй газовый котёл должен взлетать на воздух...
Вот, вот, как вообще у любителей к коим себя отношу что-то работает )))
Отправляем с консоли A123 и
Вот, вот, как вообще у любителей к коим себя отношу что-то работает )))
Написано криво, вот и не работает, как надо, чему тут удивляться? В строке 14 в буфере может не быть ничего, т.к. до этого уже читали с буфера.