Коди ansi для релейного захисту. Кодування: корисна інформація та коротка ретроспектива. набір символів ANSI

	Код (двійковий)	(десятковий беззнаковий)	(десятковий знаковий)




А (велике латинське)
B (велике латинське)
a (мале латинське)
А (велике російське) У кодуванні ANSI
А (велике російське) У кодуванні ASCII

Подібний код, як показано вище, відповідає також цілій кількості від 0 до 255 у беззнаковому (unsigned) форматі. Таким чином, кожному символу відповідає ціле число, яке також називається кодом символу. Сукупність кодів символів називається кодовою таблицею або кодуванням .

Для персональних комп'ютерів найбільш поширені кодові таблиці ANSI (American National Standard Institute) та ASCII (American Standard Code for Information Interchange). Таблиця ANSI застосовується у Windows, а ASCII застосовувалася у DOS. Однак у цих двох таблицях перші 128 кодів (від 0 до 127) збігаються ; вони відрізняються лише наступними 128 кодами, що використовуються зберігання національних (російських) букв і знаків " псевдографики " .

У наведених таблицях позначення КСозначає "код символу", а З- "Символ".

Стандартна частина таблиці символів (ascii-ansi)

Деякі з перерахованих вище символів мають особливий сенс. Так, наприклад, символ із кодом 9 позначає символ горизонтальної табуляції, символ із кодом 10 – символ перекладу рядка, символ із кодом 13 – символ повернення каретки.

Reg.ru: домени та хостинг

Найбільший реєстратор та хостинг-провайдер у Росії.

Понад 2 мільйони доменних імен на обслуговуванні.

Просування, пошта для домену, рішення для бізнесу.

Понад 700 тис. клієнтів у всьому світі вже зробили свій вибір.

*Наведіть курсор миші, щоб призупинити прокручування.

Назад вперед

Кодування: корисна інформація та коротка ретроспектива

Цю статтю я вирішив написати як невеликий огляд щодо питання кодувань.

Ми розберемося, що таке взагалі кодування і трохи торкнемося історії того, як вони з'явилися в принципі.

Ми поговоримо про деякі їх особливості а також розглянемо моменти, що дозволяють нам працювати з кодуванням більш усвідомлено та уникати появи на сайті так званих кракозябрів, тобто. нечитаних символів.

Отже, поїхали...

Що таке кодування?

Спрощено кажучи, кодування- це таблиця зіставлень символів, які ми бачимо на екрані, певним числовим кодам.

Тобто. кожен символ, який ми вводимо з клавіатури, або на екрані монітора, закодований певною послідовністю бітів (нулів і одиниць). 8 біт, як ви, напевно, знаєте, дорівнюють 1 байту інформації, але про це трохи пізніше.

Зовнішній вигляд самих символів визначається файлами шрифтів, які встановлені на вашому комп'ютері. Тому процес виведення на екран тексту можна описати як постійне зіставлення послідовностей нулів та одиниць якимсь конкретним символам, що входять до складу шрифту.

Батьком усіх сучасних кодувань можна вважати ASCII.

Ця абревіатура розшифровується як American Standard Code for Information Interchange(американська стандартна кодувальна таблиця для друкованих символів та деяких спеціальних кодів).

Це однобайтове кодування, В яку спочатку закладено всього 128 символів: літери латинського алфавіту, арабські цифри і т.д.

Пізніше вона була розширена (спочатку вона не використовувала всі 8 біт), тому з'явилася можливість використовувати вже не 128, а 256 (2 в 8 ступенів) різних символів, які можна закодувати в одному байті інформації.

Таке вдосконалення дозволило додавати до ASCII символи національних мов, крім вже існуючої латиниці.

Варіантів розширеного кодування ASCII існує дуже багато тому, що мов у світі теж чимало. Думаю, що багато хто з вас чув про таке кодування, як KOI8-R - це також розширене кодування ASCII, призначена для роботи із символами російської мови.

Наступним кроком у розвитку кодувань можна вважати появу так званих ANSI-кодувань.

По суті це були ті самі розширені версії ASCII, однак з них були видалені різні псевдографічні елементи та додані символи друкарні, для яких раніше не вистачало "вільних місць".

Прикладом такого ANSI-кодування є всім відома Windows-1251. Крім типографічних символів, у це кодування також були включені літери алфавітів мов, близьких до російської (українська, білоруська, сербська, македонська та болгарська).

ANSI-кодування - це збірна назва. Насправді, реальне кодування під час використання ANSI буде визначатися тим, що зазначено у реєстрі операційної системи Windows. У випадку з російською мовою це буде Windows-1251, однак для інших мов це буде інший різновид ANSI.

Як ви розумієте, купа кодувань і відсутність єдиного стандарту до добра не довели, що й спричинило часті зустрічі з так званими кракозябрами- Нечитаним безглуздим набором символів.

Причина їх появи проста – це спроба відобразити символи, закодовані за допомогою однієї таблиці кодування, використовуючи іншу таблицю кодування.

У контексті веб-розробки ми можемо зіткнутися з кракозябрами, коли, наприклад, російський текст помилково зберігається не в тому кодуванні, яке використовується на сервері.

Зрозуміло, це єдиний випадок, коли ми можемо отримати нечитаний текст - варіантів тут маса, особливо, якщо врахувати, що є ще база даних, у якій інформація зберігається у певній кодуванні, є зіставлення з'єднання з базою даних тощо.

Виникнення всіх цих проблем стало стимулом для створення чогось нового. Це мало бути кодування, яке могло б кодувати будь-яку мову у світі (адже за допомогою однобайтових кодувань при всьому бажанні не можна описати всі символи, скажімо, китайської мови, де їх явно більше, ніж 256), будь-які додаткові спецсимволи та типографіку.

Одним словом, треба було створити універсальне кодування, яке вирішило б проблему кракозябрів раз і назавжди.

Юнікод - універсальне кодування тексту (UTF-32, UTF-16 та UTF-8)

Сам стандарт було запропоновано у 1991 році некомерційною організацією «Консорціум Юнікоду»(Unicode Consortium, Unicode Inc.), і першим результатом його роботи стало створення кодування UTF-32.

До речі, сама абревіатура UTFрозшифровується як Unicode Transformation Format(Формат Перетворення Юнікод).

У цьому кодуванні для кодування одного символу передбачалося використовувати аж 32 біта, тобто. 4 байти інформації. Якщо порівнювати це число з однобайтовими кодуваннями, то ми дійдемо простого висновку: для кодування 1 символу в цьому універсальному кодуванні потрібно у 4 рази більше бітів, що "обтяжує" файл у 4 рази.

Очевидно також, що кількість символів, яка потенційно могла бути описана за допомогою даного кодування, перевищує всі розумні межі і технічно обмежена числом, рівним 2 32 ступеня. Зрозуміло, що це був явний перебір і марнотратство з погляду ваги файлів, тому дане кодування не набуло поширення.

На зміну їй прийшла нова технологія - UTF-16.

Як очевидно з назви, у цьому кодуванні один символ кодують вже не 32 біти, а лише 16(Тобто 2 байти). Очевидно, це робить будь-який символ удвічі "легшим", ніж у UTF-32, однак і вдвічі "важчим" за будь-який символ, закодований за допомогою однобайтового кодування.

Кількість символів, доступне для кодування UTF-16 дорівнює, як мінімум, 2 в 16 ступеня, тобто. 65536 символів. Начебто б все непогано, до того ж остаточна величина кодового простору в UTF-16 була розширена до більш ніж 1 мільйона символів.

Однак і це кодування до кінця не задовольняло потреби розробників. Скажімо, якщо ви пишете, використовуючи виключно латинські символи, то після переходу з розширеної версії кодування ASCII до UTF-16 вага кожного файлу збільшувалася вдвічі.

В результаті, була зроблена ще одна спроба створення чогось універсального, і цим чимось стало всім нам відоме кодування UTF-8.

UTF-8- це багатобайтове кодування зі змінною довгою символом. Дивлячись на назву, можна за аналогією з UTF-32 і UTF-16 подумати, що для кодування одного символу використовується 8 біт, проте це не так. Точніше, не зовсім так.

Справа в тому, що UTF-8 забезпечує найкращу сумісність із старими системами, що використовували 8-бітові символи. Для кодування одного символу в UTF-8 реально використовується від 1 до 4 байт(Гіпотетично можна і до 6 байт).

У UTF-8 всі латинські символи кодуються 8 бітами, як і в кодуванні ASCII. Іншими словами, базова частина кодування ASCII (128 символів) перейшла в UTF-8, що дозволяє "витрачати" на їх подання всього 1 байт, зберігаючи при цьому універсальність кодування, заради якого все й починалося.

Отже, якщо перші 128 символів кодуються 1 байтом, всі інші символи кодуються вже 2 байтами і більше. Зокрема, кожен символ кирилиці кодується саме 2 байтами.

Таким чином, ми отримали універсальне кодування, що дозволяє охопити всі можливі символи, які потрібно відобразити, не обтяжуючи без необхідності файли.

З BOM або без BOM?

Якщо ви працювали з текстовими редакторами (редакторами коду), наприклад Notepad++, phpDesigner, rapid PHPі т.д., то, ймовірно, звертали увагу на те, що при заданні кодування, в якому буде створена сторінка, можна вибрати, як правило, 3 варіанти:

ANSI
- UTF-8
- UTF-8 без BOM

Відразу скажу, що вибирати завжди варто саме останній варіант. UTF-8 без BOM.

Отже, що таке BOM і чому нам це не потрібно?

BOMрозшифровується як Byte Order Mark. Це спеціальний Unicode символ, що використовується для індикації порядку байтів текстового файлу. За специфікацією його використання не обов'язкове, проте якщо BOMвикористовується, він повинен бути встановлений на початку текстового файлу.

Не будемо вдаватися до деталей роботи BOM. Для нас головний висновок такий: використання цього службового символу разом з UTF-8 заважає програмам зчитувати кодування нормально., внаслідок чого виникають помилки у роботі скриптів.

Windows-1251 — набір символів та кодування, що є стандартним 8-бітовим кодуванням для всіх російських версій Microsoft Windows. Це кодування користується досить великою популярністю у східноєвропейських країнах. Windows-1251 вигідно відрізняється від інших 8-бітових кириличних кодувань (таких як CP866, KOI8-R та ISO 8859-5) наявністю практично всіх символів, що використовуються в традиційній російській друкарні для звичайного тексту (відсутня тільки знак наголосу). Кирилічні символи йдуть за абеткою.
Windows-1251 також містить усі символи для близьких до російської мов: білоруської, української, сербської, македонської та болгарської.
На практиці цього виявилося достатньо, щоб кодування Windows-1251 закріпилося в інтернеті до поширення UTF-8.

Таблиця кодів символів Windows-1251

Dec	Hex	Символ	Dec	Hex	Символ
000	00	NOP	128	80	Ђ
001	01	SOH	129	81	Ѓ
002	02	STX	130	82	‚
003	03	ETX	131	83	ѓ
004	04	EOT	132	84	„
005	05	ENQ	133	85	…
006	06	ACK	134	86	†
007	07	BEL	135	87	‡
008	08	BS	136	88	€
009	09	TAB	137	89	‰
010	0A	LF	138	8A	Љ
011	0B	VT	139	8B	‹
012	0C	FF	140	8C	Њ
013	0D	CR	141	8D	Ќ
014	0E	SO	142	8E	Ћ
015	0F	SI	143	8F	Џ
016	10	DLE	144	90	ђ
017	11	DC1	145	91	‘
018	12	DC2	146	92	’
019	13	DC3	147	93	“
020	14	DC4	148	94	”
021	15	NAK	149	95
022	16	SYN	150	96	–
023	17	ETB	151	97	—
024	18	CAN	152	98
025	19	EM	153	99	™
026	1A	SUB	154	9A	љ
027	1B	ESC	155	9B	›
028	1C	FS	156	9C	њ
029	1D	GS	157	9D	ќ
030	1E	RS	158	9E	ћ
031	1F	US	159	9F	џ
032	20	SP	160	A0
033	21	!	161	A1	Ў
034	22	"	162	A2	ў
035	23	#	163	A3	Ћ
036	24	$	164	A4	¤
037	25	%	165	A5	Ґ
038	26	&	166	A6	¦
039	27	"	167	A7	§
040	28	(	168	A8	Ё
041	29	)	169	A9	©
042	2A	*	170	AA	Є
043	2B	+	171	AB	«
044	2C	,	172	AC	¬
045	2D	-	173	AD
046	2E	.	174	AE	®
047	2F	/	175	AF	Ї
048	30	0	176	B0	°
049	31	1	177	B1	±
050	32	2	178	B2	І
051	33	3	179	B3	і
052	34	4	180	B4	ґ
053	35	5	181	B5	µ
054	36	6	182	B6	¶
055	37	7	183	B7	·
056	38	8	184	B8	е
057	39	9	185	B9	№
058	3A	:	186	BA	є
059	3B	;	187	BB	»
060	3C	<	188	BC	ј
061	3D	=	189	BD	Ѕ
062	3E	>	190	BE	ѕ
063	3F	?	191	BF	ї
064	40	@	192	C0	А
065	41	A	193	C1	Б
066	42	B	194	C2	У
067	43	C	195	C3	Г
068	44	D	196	C4	Д
069	45	E	197	C5	Е
070	46	F	198	C6	Ж
071	47	G	199	C7	З
072	48	H	200	C8	І
073	49	I	201	C9	Й
074	4A	J	202	CA	До
075	4B	K	203	CB	Л
076	4C	L	204	CC	М
077	4D	M	205	CD	Н
078	4E	N	206	CE	Про
079	4F	O	207	CF	П
080	50	P	208	D0	Р
081	51	Q	209	D1	З
082	52	R	210	D2	Т
083	53	S	211	D3	У
084	54	T	212	D4	Ф
085	55	U	213	D5	Х
086	56	V	214	D6	Ц
087	57	W	215	D7	Ч
088	58	X	216	D8	Ш
089	59	Y	217	D9	Щ
090	5A	Z	218	DA	Ъ
091	5B	[	219	DB	Ы
092	5C	\	220	DC	Ь
093	5D	]	221	DD	Е
094	5E	^	222	DE	Ю
095	5F	_	223	DF	Я
096	60	`	224	E0	а
097	61	a	225	E1	б
098	62	b	226	E2	в
099	63	c	227	E3	г
100	64	d	228	E4	д
101	65	e	229	E5	е
102	66	f	230	E6	ж
103	67	g	231	E7	з
104	68	h	232	E8	і
105	69	i	233	E9	й
106	6A	j	234	EA	до
107	6B	k	235	EB	л
108	6C	l	236	EC	м
109	6D	m	237	ED	н
110	6E	n	238	EE	про
111	6F	o	239	EF	п
112	70	p	240	F0	р
113	71	q	241	F1	з
114	72	r	242	F2	т
115	73	s	243	F3	у
116	74	t	244	F4	ф
117	75	u	245	F5	х
118	76	v	246	F6	ц
119	77	w	247	F7	год
120	78	x	248	F8	ш
121	79	y	249	F9	щ
122	7A	z	250	FA	ъ
123	7B	{	251	FB	ы
124	7C	\|	252	FC	ь
125	7D	}	253	FD	е
126	7E	~	254	FE	ю
127	7F	DEL	255	FF	я

Опис спеціальних (керуючих) символів

Спочатку керуючі символи таблиці ASCII (діапазон 00-31 плюс 127) були розроблені для того, щоб керувати пристроями апаратних засобів, таких як телетайп, введення даних на перфострічку та ін.
Керуючі символи (крім горизонтальної табуляції, перекладу рядка та повернення каретки) не використовуються у HTML-документах.

Спеціальні (керуючі) символи

Код	Опис
NUL, 00	Null, порожній
SOH, 01	Start Of Heading, початок заголовка
STX, 02	Start of TeXt, початок тексту
ETX, 03	End of TeXt, кінець тексту
EOT, 04	End of Transmission, кінець передачі
ENQ, 05	Enquire. Прошу підтвердження
ACK, 06	Висновокзнання. Підтверджую
BEL, 07	Bell, дзвінок
BS, 08	Backspace, повернення на один символ назад
TAB, 09	Tab, горизонтальна табуляція
LF, 0A	Line Feed, переклад рядка Зараз у більшості мов програмування позначається як \n
VT, 0B	Vertical Tab, вертикальна табуляція
FF, 0C	Form Feed, прогін сторінки, нова сторінка
CR, 0D	Carriage Return, повернення каретки Зараз у більшості мов програмування позначається як \r
SO, 0E	Shift Out, змінити колір фарбуючої стрічки в принтері.
SI, 0F	Shift In, повернути колір фарбуючої стрічки в принтері назад
DLE, 10	Data Link Escape, перемикання каналу передачі даних
DC1, 11 DC2, 12 DC3, 13 DC4, 14	Device Control, символи керування пристроями
NAK, 15	Negative Acknowledgment, не підтверджую
SYN, 16	Synchronization. Символ синхронізації
ETB, 17	End of Text Block, кінець текстового блоку
CAN, 18	Cancel, скасування переданого раніше
EM, 19	End of Medium, кінець носія даних
SUB, 1A	Substitute, підставити. Ставиться дома символу, значення якого було втрачено чи зіпсовано під час передачі
ESC, 1B	Escape Керуюча послідовність
FS, 1C	File Separator, роздільник файлів
GS, 1D	Group Separator, роздільник груп
RS, 1E	Record Separator, роздільник записів
US, 1F	Unit Separator, роздільник юнітів
DEL, 7F	Delete, стерти останній символ.

Іноді навіть досить досвідчений фахівець не одразу скаже вам, чому відповідає те чи інше значення тиску чи довжини в одній системі значень в іншій системі величин.

Щоб полегшитивам це завдання, ми пропонуємо таблиці співвідношення величин тиску та довжини в європейській та американській системах з невеликими поясненнями. Але спочатку кілька слів про самі стандарти.

DIN- це німецький стандарт (розшифровується як Deutsches Institut für Normung, тобто розроблений Німецьким інститутом стандартизації), який розробляється суворо у рамках положень Міжнародної організації зі стандартизації – ISO (International Organization for Standardization).

ANSI– стандарт, ухвалений у Сполучених Штатах Америки. Розшифровується як American National Standards Instituteтобто стандарт Американського національного інституту зі стандартизації.

Відповідно, норми ANSI визначаються саме цим інститутом і далеко не завждиміж стандартами DINі ANSIможна простежити точні відповідностіу різних сферах.

Переведення одиниць тиску з ANSI в DIN

Тут все просто: якщо за стандартом ANSIнавпаки тиску коштує цифра 150 - це означає, що номінальний (на який розрахована арматура) тиск становить 20 бар, 300 - 50 бар і т.д. Максимальне значення по ANSI Class– 2500 дорівнюватиме 420 бар за європейським стандартом DIN.

Користуючись цією таблицею, не складнопереводити значення тиску і назад: з DINв ANSI, хоча здійснювати такий переклад нашим інженерам потрібно набагато рідше.

Переведення одиниць довжини з американської системи до європейської (російської)

Як відомо, американцівсе вимірюють дюймами та футами, а ми і європейці- міліметрами, сантиметрами та метрами, тобто, як і переважна більшість держав світу, ми живемо в метричноїсистемі одиниць.

Як переводити дюйми в міліметри? Насправді, в цьому також немає нічого складного, достатньо лише запам'ятати, що один дюйм дорівнює 25,4 мм. Однак нерідко цифрою після коми нехтуютьі для рівного рахунку вказують, що 1 дюйм = 25 мм.

Таким чином, якщо, наприклад, переріз вхідного отвору дорівнює 2 дюймам за американською системою заходів, то, перевівши за вищевказаним правилом це значення в нашу систему заходів, отримуємо 50 мм або, що точніше - 51 мм (округливши 50,8 за правилами) .

Залишилося додати, що діаметр в технічниххарактеристиках маркується латинськими літерами DNі нерідко вказується саме в дюймах, а тиск позначається за допомогою букв PNі вказується найчастіше в барах- у всякому разі, ми використовуємо саме таке маркування як найбільше зручну.

А наступна таблиця допоможевам вирахувати не тільки точнекількість міліметрів в одному дюймі (з точністю до тисячної міліметра), але й допоможе дізнатися скільки міліметрів міститься, наприклад, в 2,5 дюймах.

Для цього знаходимо колонку 2"" (2 дюйми), а зліва шукаємо значення 1/2. Разом 2,5 дюйма = 63,501 мм, що можна округлити до 64 мм, а, наприклад, 6,25 дюйма (тобто 6 і 1/4) = 158,753 мм чи 159 мм.

	Дюйми "" у міліметрах

До речі, на нашому сайті ви можете перекласти будь-який текст у десятковий, шістнадцятковий, двійковий код, скориставшись Калькулятором кодів онлайн.

Таблиця ASCII

ASCII (American Standard Code for Information Interchange)

Зведена таблиця кодів ASCII

ASCII таблиця кодів символів Windows (Win-1251)

		Символ









		спец. Табуляція
		спец. LF (Повернення каретки)


		спец. CR (Новий рядок)


















		зчіп. SP (Пробіл)

		Символ

Розширена таблиця кодів ASCII

Форматування символи.

	Backspace (Повернення до одного символу). Вказує на рух механізму друку або курсору дисплея на одну позицію.
	Horizontal Tabulation (Горизонтальне Табулювання). Показує рух механізму друку або курсора дисплея до наступної "позиції табуляції".
	Line Feed (Переклад рядка). Показує рух механізму друку або курсору дисплея на початок наступного рядка (на один рядок вниз).
	Vertical Tabulation (Вертикальне табулювання). Показує рух механізму друку або курсору дисплея до наступної групи рядків.
	Form Feed (Переклад сторінки). Показує рух механізму друку або курсора дисплея до вихідної позиції наступної сторінки, форми або екрана.
	Carriage Return (Переклад каретки). Показує рух механізму друку або курсора дисплея до вихідної (крайньої лівої) позиції поточного рядка.

Передача даних.

	Start of Heading (Початок заголовка). Використовується для визначення початку заголовка, який може містити інформацію про маршрутизацію або адресу.
	Start of Text (Початок тексту). Показує початок тексту та одночасно кінець заголовка.
	End of Text (Кінець тексту). Застосовується при завершенні тексту, який було розпочато із символу STX.
	Enquiry (Запит). Запит ідентифікаційних даних (типу "Хто Ви?") від віддаленої станції.
	Acknowledge (Підтвердження). Приймальний пристрій передає цей символ відправнику як підтвердження успішного прийому даних.
	Negative Acknowledgement (Непідтвердження). Приймальний пристрій передає цей символ відправнику у разі заперечення (невдачі) прийому даних.
	Synchronous/Idle (Синхронізація). Застосовується у синхронізованих системах передачі. У моменти відсутності передачі даних система постійно посилає символи SYN для забезпечення синхронізації.
	End of Transmission Block (Кінець Блоку Передачі). Показує кінець блоку даних для комунікаційних цілей. Застосовується для розбиття окремих блоків великих обсягів даних.

Розділові знаки під час передачі інформації.

Інші символи.

	Null. (No character- немає даних). Застосовується передачі у разі відсутності даних.
	Bell (Дзвінок). Застосовується для керування пристроями сигналізації.
	Shift Out. Показує, що всі наступні кодові комбінації повинні інтерпретуватись згідно з зовнішнім набором символів до приходу символу SI.
	Shift In. Показує, що наступні кодові комбінації повинні інтерпретуватися згідно зі стандартним набором символів.
	Data Link Escape (Переключення). Зміна значення символів, що йдуть слідом. Застосовується для додаткового контролю або передачі довільної комбінації біт.
DC1, DC2, DC3, DC4	Device Controls (Контроль пристрою). Символи керування допоміжними пристроями (спеціальними функціями).
	Cancel (Скасувати). Показує, що дані, які передували цьому символу в повідомленні чи блоці, повинні бути ігноровані (зазвичай у разі виявлення помилки).
	End of Medium (Кінець Носії). Вказує на фізичний кінець стрічки чи іншого носія інформації
	Substitute (Заступник). Використовується для заміни помилкового або неприпустимого символу.
	Escape (Розширення). Застосовується розширення коду, вказуючи те що, що наступний символ має альтернативне значення.
	Space (Пробіл). Недрукований символ для розділення слів або переміщення механізму друку або курсору дисплея вперед на одну позицію.
	Delete (Видалення). Застосовується для видалення (стирання) попереднього знака у повідомленні

Ноутбуки