кирилица в char

Сб, 10/03/2018 - 12:11

#1

andriano

Offline

Зарегистрирован: 20.06.2015

Чтайте про кодировку utf-8 (это кодировка с переменным количеством байтов на символ)

Сб, 10/03/2018 - 12:21

#2

Olej

Offline

Зарегистрирован: 05.03.2018

AVS пишет:

char совсем кирилицу не поддерживает?

Как мне кажется ... я здесь в теме исчерпывающе расписал что и как происходит.

Но администрация форума считает, что может на свой вкус произвольно вытирать любые сообщения в любых количествах.

Благодарите администрацию!

*********************************************************

Администрация, в свою очередь, благодарит Olej за фразу "Для пользователей Linux/UNIX это естественно и понятно ... ну а вЫньдаунов от такого плющит и колбасит.", послужившую причиной удаления поста.

Сб, 10/03/2018 - 12:30

#3

kalapanga

Offline

Зарегистрирован: 23.10.2016

Olej пишет:

Но администрация форума считает, что может на свой вкус произвольно вытирать любые сообщения в любых количествах.

Вы пять дней на форуме, а начали хамить, холивары разводить, на три буквы людей посылать. Вот Вас самих туда и отправили...

Сб, 10/03/2018 - 12:41

#4

Olej

Offline

Зарегистрирован: 05.03.2018

kalapanga пишет:

холивары разводить,

Про холивары - это вы ТС-ру расскажите. ;-) Оно ему сильно поможет.

Сб, 10/03/2018 - 12:46

#5

AVS

Offline

Зарегистрирован: 11.12.2017

К сожалению я не могу разобраться с этими кодировками, их вроде как очень много различного рода, той же utf8 в интернете тьма и каждая (как понял) для своего языка. Но она что, выбирается или устанавливается автоматически. Ну и желательно, чтобы 1 симпол занимал один байт

Сб, 10/03/2018 - 12:52

#6

Olej

Offline

Зарегистрирован: 05.03.2018

AVS пишет:

К сожалению я не могу разобраться с этими кодировками,

А вы у kalapanga поспрашивайте - он думает, что это понимает...

AVS пишет:

той же utf8 в интернете тьма и каждая (как понял) для своего языка. Но она что, выбирается или устанавливается автоматически.

Ничего подобного - UTF8 это способ кодирвания для UNICODE представления символов любого языка, ничего выбирать и устанавливать не надо. Всё абсолютно строго стандартизовано ...

AVS пишет:

Ну и желательно, чтобы 1 симпол занимал один байт

Мало ли что там вам желательно...

Сб, 10/03/2018 - 13:28

#7

AVS

Offline

Зарегистрирован: 11.12.2017

Но ведь char занимает 1 байт, разве нет? Если вы мне предлагаете что-то весов в2 байта, то боюсь не подойдёт... А можете подсказать, как узнать вес того или иного массива? Автоматически
Боюсь представить, что здесь будет, когда я доготовлю кушать

Сб, 10/03/2018 - 13:40

#8

Olej

Offline

Зарегистрирован: 05.03.2018

AVS пишет:

Но ведь char занимает 1 байт, разве нет?

char занимает 1 байт. Но char и символ - это не одно и то же.

Любой (в том числе и ASCII) символ в UNICODE выражается 4-байтным значением, которое в способе кодирования UTF-8 представляется переменным числом (1-4) последовательных байт.

И тогда о кодировках, таблицах кодировки, всех этих CP-866, CP-1251, KOI-8r etc. - нужно забыть как страшный сон... всё это уходит в прошлое ... начиная года с 2005-го.

P.S. Всё это есть в стандарте языка C99, 1999 года ... см. стандарт (и POSIX API). В реализациях C где-то есть в полной мере, где-то частично...

Сб, 10/03/2018 - 13:45

#9

sadman41

Offline

Зарегистрирован: 19.10.2016

AVS пишет:

Но ведь char занимает 1 байт, разве нет?

.. А можете подсказать, как узнать вес того или иного массива?

Так будет понаглядней:

char c[] = "абвгд";

void setup() {
  Serial.begin(9600);
}

void loop() {
int i = 0;
  while (i < sizeof(c) ) {
    Serial.print("'");  Serial.print((char) c[i]);  Serial.print("' => ");
    Serial.println((byte) c[i], DEC);
    i = i + 1;
  }
  Serial.println("_____");
  delay(2000);
}

Сб, 10/03/2018 - 13:48

#10

andycat

Offline

Зарегистрирован: 07.09.2017

AVS пишет:

К сожалению я не могу разобраться... . Ну и желательно, чтобы 1 симпол занимал один байт

Я например в своих проектах работаю с кодировкой win1251 - пожалуйста 1 байт.

А уже вывод куда надо - преобразую на ходу

Сб, 10/03/2018 - 13:53

#11

AVS

Offline

Зарегистрирован: 11.12.2017

но вроде как везде пишут, что char и byte занимают один байт..а тут получается, что занимает уже как int или long//

насчет длины массива - понятно как вычислить его длину, яимел ввиду, что может есть функция, типа как в php, которая вычисляет прям вес

Сб, 10/03/2018 - 13:54

#12

AVS

Offline

Зарегистрирован: 11.12.2017

оу, а подскажите, как использоватьь именно эту кодировку, я потому и спрашивал вначале, только одну ардуино использует кодировку или же подбирает автоматически или может мы сами можем выбрать

Сб, 10/03/2018 - 13:58

#13

andycat

Offline

Зарегистрирован: 07.09.2017

Кодировки не "используют", ими пользуются разными в зависимости от задачи, показать что? Преобразование строки из одной в другую? Тупо цикл, тут где то на форуме было, мне с мобильника текст лень писать.

Сб, 10/03/2018 - 13:59

#14

Olej

Offline

Зарегистрирован: 05.03.2018

AVS пишет:

но вроде как везде пишут, что char и byte занимают один байт..а тут получается, что занимает уже как int или long//

И char и byte занимают 1 байт, всё верно, только символ, буква - это уже не эквивалент char. Эквивалентность char и byte тянулась из ... какого-то дремучего 1970 года или ещё раньше. Все новые, современные языки программирования давно от этого отказались: Plan-9, Linux, Python, Go, Swift, Kotlin ... - везде UTF-8.

Сб, 10/03/2018 - 14:01

#15

AVS

Offline

Зарегистрирован: 11.12.2017

а помойму изспользовать и пользовать это одно и то же. Как мне использовать именно win1251

Сб, 10/03/2018 - 14:01

#16

Olej

Offline

Зарегистрирован: 05.03.2018

AVS пишет:

Если вы мне предлагаете что-то весов в2 байта, то боюсь не подойдёт...

Какая вам разница что там вам предлагает стандарт? Стандарт предлагает, а вы - пользуйтесь.

Сб, 10/03/2018 - 14:03

#17

sadman41

Offline

Зарегистрирован: 19.10.2016

У вас Far есть? Посмотрите им .ino-файл скетча, где есть русские буквы, обратите в какой кодовой странице он сохранен, переключитесь на ANSI...

Принудительно вы можете в массиве задать ascii-коды, например так: char c[] = "\x80\x81\x82\x83";

Сб, 10/03/2018 - 14:03

#18

AVS

Offline

Зарегистрирован: 11.12.2017

а, ну я понял, я б тое отказался, будь у меня оперативка 16 гб, а не 1 кб, а память исчислялась терабайтами) но ведь возможность использовать менее "емкие" кодировки все таки есть

Сб, 10/03/2018 - 14:03

#19

andycat

Offline

Зарегистрирован: 07.09.2017

AVS пишет:

а помойму изспользовать и пользовать это одно и то же. Как мне использовать именно win1251

Не знаю)
Наводящий вопрос : а что сделать то? Вывести в монитор порта или в СМС отправить или что?
Вот например использование, начиная с 341 строки древний код
http://arduino.ru/forum/proekty/arduino-bluetooth-klaviatura-s-shifrovan...

Сб, 10/03/2018 - 14:08

#20

AVS

Offline

Зарегистрирован: 11.12.2017

far это файловый менеджер? в поиске он выходит первым

а вот насчет принудительного задавания это еще интереснее. Мне было бы удобнее самому попорядку задать каждой букве свой код(мне нужны то только все буквы и основные знаки препинания

я правильно вас, понял, букве а я могу задать код, например 1, и в дальнейшем у буквы а код будет всегда 1?

Сб, 10/03/2018 - 14:11

#21

Olej

Offline

Зарегистрирован: 05.03.2018

AVS пишет:

Мне было бы удобнее самому попорядку задать каждой букве свой код

Какой ужас!!!

Сб, 10/03/2018 - 14:14

#22

andycat

Offline

Зарегистрирован: 07.09.2017

AVS пишет:

far это файловый менеджер? в поиске он выходит первым

а вот насчет принудительного задавания это еще интереснее. Мне было бы удобнее самому попорядку задать каждой букве свой код(мне нужны то только все буквы и основные знаки препинания

я правильно вас, понял, букве а я могу задать код, например 1, и в дальнейшем у буквы а код будет всегда 1?

Тяжёлый случай (
Вы уверены что попали на нужный форум?
С программированием как вообще?
Каждое устройство отображает символ в зависимости от кода так как это задумали его создатели, а уж преобразовать из одного кода в другой ваша забота.
Задайте в поиске - таблица соответствия unicode win1251 utf8 - может быть тогда наглядно все понятно вам будет

Сб, 10/03/2018 - 14:14

#23

sadman41

Offline

Зарегистрирован: 19.10.2016

AVS пишет:

far это файловый менеджер? в поиске он выходит первым

а вот насчет принудительного задавания это еще интереснее. Мне было бы удобнее самому попорядку задать каждой букве свой код(мне нужны то только все буквы и основные знаки препинания

я правильно вас, понял, букве а я могу задать код, например 1, и в дальнейшем у буквы а код будет всегда 1?

Far - это файловый менеджер, да. У него мощный редактор/просмотрщик.

Не понимаю, что такое "задать букве код". Вы можете в строку поместить байты с определенными значениями (0..255) и потом засылать их в некоторое устройство. Как устройство их будет интерпретировать - вопрос второй.

Сб, 10/03/2018 - 14:16

#24

AVS

Offline

Зарегистрирован: 11.12.2017

andycat пишет:

AVS пишет:

а помойму изспользовать и пользовать это одно и то же. Как мне использовать именно win1251

Не знаю) Наводящий вопрос : а что сделать то? Вывести в монитор порта или в СМС отправить или что? Вот например использование, начиная с 341 строки древний код http://arduino.ru/forum/proekty/arduino-bluetooth-klaviatura-s-shifrovaniem-speck#comment-306261

на данный момент мне просто нужно суметь получить адекватные еоды русских букв,

надо посидеть с вашим кодом

Сб, 10/03/2018 - 14:17

#25

AVS

Offline

Зарегистрирован: 11.12.2017

Olej пишет:

AVS пишет:

Мне было бы удобнее самому попорядку задать каждой букве свой код

Какой ужас!!!

может в дальнейшем я уйду от этого

Сб, 10/03/2018 - 14:19

#26

AVS

Offline

Зарегистрирован: 11.12.2017

andycat пишет:

AVS пишет:

far это файловый менеджер? в поиске он выходит первым

а вот насчет принудительного задавания это еще интереснее. Мне было бы удобнее самому попорядку задать каждой букве свой код(мне нужны то только все буквы и основные знаки препинания

я правильно вас, понял, букве а я могу задать код, например 1, и в дальнейшем у буквы а код будет всегда 1?

Тяжёлый случай ( Вы уверены что попали на нужный форум? С программированием как вообще? Каждое устройство отображает символ в зависимости от кода так как это задумали его создатели, а уж преобразовать из одного кода в другой ваша забота. Задайте в поиске - таблица соответствия unicode win1251 utf8 - может быть тогда наглядно все понятно вам будет

ну в програмировании я обычный среднестатистический человек, в что не мегает мне решать простенькие вещи, но вот с кодировками я просто до этого совсем не был знаком(

Сб, 10/03/2018 - 14:19

#27

andycat

Offline

Зарегистрирован: 07.09.2017

AVS пишет:

andycat пишет:

AVS пишет:

а помойму изспользовать и пользовать это одно и то же. Как мне использовать именно win1251

Не знаю) Наводящий вопрос : а что сделать то? Вывести в монитор порта или в СМС отправить или что? Вот например использование, начиная с 341 строки древний код http://arduino.ru/forum/proekty/arduino-bluetooth-klaviatura-s-shifrovaniem-speck#comment-306261

на данный момент мне просто нужно суметь получить адекватные еоды русских букв,

надо посидеть с вашим кодом

Получить адекватные коды Где??? Из чего??? Озвучте конкретное требование. ЗЫ : не надо с моим кодом сидеть - плохой пример, сейчас бы я все по другому написал.

Сб, 10/03/2018 - 14:22

#28

AVS

Offline

Зарегистрирован: 11.12.2017

качаемс, посмотримс, ну а вообще, я так и хотел делать, на крайний случай, ведь запросто каждую букву можно обозвать числом и она спокойно влезет в 1 байт, разве что меня такой вопрос интересует. Что будет более емким char c[] = "эюя"; или byte c[] = '31','32','33';

Сб, 10/03/2018 - 14:25

#29

andycat

Offline

Зарегистрирован: 07.09.2017

AVS пишет:

качаемс, посмотримс, ну а вообще, я так и хотел делать, на крайний случай, ведь запросто каждую букву можно обозвать числом и она спокойно влезет в 1 байт, разве что меня такой вопрос интересует. Что будет более емким char c[] = "эюя"; или byte c[] = '31','32','33';

А второй вариант однобайтовый куда собираетесь выводить? Хранить компактно это только пол дела

Сб, 10/03/2018 - 14:25

#30

AVS

Offline

Зарегистрирован: 11.12.2017

andycat пишет:

AVS пишет:

andycat пишет:

AVS пишет:

а помойму изспользовать и пользовать это одно и то же. Как мне использовать именно win1251

Не знаю) Наводящий вопрос : а что сделать то? Вывести в монитор порта или в СМС отправить или что? Вот например использование, начиная с 341 строки древний код http://arduino.ru/forum/proekty/arduino-bluetooth-klaviatura-s-shifrovaniem-speck#comment-306261

на данный момент мне просто нужно суметь получить адекватные еоды русских букв,

надо посидеть с вашим кодом

Получить адекватные коды Где??? Из чего??? Озвучте конкретное требование. ЗЫ : не надо с моим кодом сидеть - плохой пример, сейчас бы я все по другому написал.

cкажем так, на каждую отдельную букву мне нужно делать свое отдельное действие. Для этого мне у каждой буквы нужно возиметь числовой код, а уже эот код будет соответствовать отпределенной позиции в другом массиве

Сб, 10/03/2018 - 14:29

#31

AVS

Offline

Зарегистрирован: 11.12.2017

мне нужно перебирать текст, не более, выводить буквы, каждой букве будет назначено отдельное действие

второй вариант сложнее для восприятия, но можно написать програмулину, которая будет переводить обычный текс в это добро, встаили в ардуино,а дальше пусть сама

по емкости они оба занимают 3 байта?

Сб, 10/03/2018 - 14:30

#32

AVS

Offline

Зарегистрирован: 11.12.2017

я как понимаю варианты с заменой одной кодировки на другую требуют постоянного пребора, того же for или while для каждого символа?

Сб, 10/03/2018 - 14:32

#33

andycat

Offline

Зарегистрирован: 07.09.2017

AVS пишет:

я как понимаю варианты с заменой одной кодировки на другую требуют постоянного пребора, того же for или while для каждого символа?

Нет, я давал ссылку, никакого перебора, тупо математика, в конце концов - вы табличку в интернете соответствия кодировок посмотрели - совсем ведь просто

Сб, 10/03/2018 - 14:36

#34

AVS

Offline

Зарегистрирован: 11.12.2017

не удите, таблицу я видел. Но ведь у вас в коед постоянно используется ф-я RusKeyTo1251

Сб, 10/03/2018 - 14:39

#35

andycat

Offline

Зарегистрирован: 07.09.2017

И? Но не цикл же по всей кодовой таблице.

Сб, 10/03/2018 - 14:56

#36

andriano

Offline

Зарегистрирован: 20.06.2015

AVS пишет:

ведь запросто каждую букву можно обозвать числом и она спокойно влезет в 1 байт

Кто Вам сказал эту глупость?

Попытайтесь запихнуть 54600 китайских иероглифов в 1 байт.

А для англосакса, что иероглифы, что кириллица - без разницы.

Собсвенно, исчерпывающий ответ для человепка, который умеет пользоваться поиском, я привел в ответе №1.

Но раз Вы поиском пользоваться не умеете, начните с этого: https://ru.wikipedia.org/wiki/UTF-8

Если будет непонятно... и после второго-третьего прочтения непонятно, походите по ссылкам: https://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%82%D0%B5%D0%B3%D0%BE%D1%80%D0%B8%D1%8F:%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D1%8B%D0%B5_%D0%BA%D0%BE%D0%B4%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B8

Сб, 10/03/2018 - 15:13

#37

AVS

Offline

Зарегистрирован: 11.12.2017

Я так то писал, что нужен мне только русскиц

Сб, 10/03/2018 - 15:41

#38

andriano

Offline

Зарегистрирован: 20.06.2015

AVS, Вы уж определитесь, Вам нужно "каждую букву" или только кириллическую, Вам нужна своя собственная ни с чем не совместимая кодировка, или Вы хотите пользоваться какой-либо стандартной (например, utf-8).

Сб, 10/03/2018 - 17:10

#39

AVS

Offline

Зарегистрирован: 11.12.2017

Но я ведь вроде писал, что мне нужны только русские и пара знаков, все в общем то) прошу прощения если выразился не так.

Сб, 10/03/2018 - 21:17

#40

andriano

Offline

Зарегистрирован: 20.06.2015

А на второй вопрос?

Сб, 10/03/2018 - 21:28

#41

wdrakula

Offline

Зарегистрирован: 15.03.2016

Главный вопрос так и не задали: А куда это нужно выводить? В смысле это экран, COM-порт, СМС, Web-сервер, блютус?

Это все очень разные темы, совсем разные. Некоторые экраны вообще не знают русского (к счастью), те, которые знают, имеют кучу разных шрифтов в разных кодировках.

И смежный вопрос - откура вводить эту абракадабру, сорри, кириллицу? В коде при программировании? Или при работе с какойц-то клавы? Или придет по СМС? Или по сети? Это тоже все совершенно разные вещи.

--------------------

Лучший выход - в жопу кириллицу (это проще), или учиться, учиться и еще раз учиться. Если хотим помощи, то точно описать свои задумки и хотелки, тебе подберут самый оптимальный вариант решения.

Arduino.ru

Регистрация новых пользователей и создание новых тем теперь только на новом форуме https://forum.arduino.ru