Член : Најава |Регистрација |Неуспешно знаење
Барај
Карактери на универзален карактер [Модификација ]
Конзорциумот на Уникод (УЗ) и Меѓународната организација за стандардизација (ИСО) соработуваат на Универзалниот карактер сет (УЦС). UCS е меѓународен стандард за прикажување на карактери кои се користат во природните јазици, математика, музика и други домени до машински читливи вредности. Со создавање на ова мапирање, UCS им овозможува на продавачите на компјутерски софтвер да комуницираат и да пренесуваат UCS кодирани текстуални низи од една до друга. Поради тоа што е универзална мапа, може да се користи за да претставува повеќе јазици во исто време. Ова ја избегнува конфузијата со користење на повеќекратни наследни карактери, што може да резултира со ист редослед на кодови кои имаат повеќе значења и на тој начин да бидат неправилно декодирани ако е избран погрешниот.
UCS има потенцијален капацитет да кодира над 1 милион карактери. Секој UCS карактер е апстрактно претставена со кодна точка, која е цел број од 0 до 1.114.111, што се користи за претставување на секој знак во рамките на внатрешната логика на софтверот за обработка на текст (1114,112 = 220 216 или 17 × 216, или хексадецимални 110000 кодови). Од Уникод 10.0, објавен во јуни 2017 година, се доделени 280.016 (25%) од овие кодни поени, вклучувајќи 136.755 (12%) доделени знаци, 137.468 (12.3%) се задржани за приватна употреба, 2.048 за сурогати и 66 назначени не- ликови, оставајќи 834.096 (75%) непристранет. Бројот на кодирани знаци се состои од следниов начин:

136.537 графички знаци (од кои некои немаат видлив знак, но сè уште се сметаат за графички)
218 специјални намени за контрола и форматирање.
ISO го одржува основното мапирање на знаци од име на знак во кодот точка. Често термините "карактер" и "код точка" ќе се користат наизменично. Меѓутоа, кога се прави разлика, кодна точка се однесува на цел број: што може да се смета за нејзина адреса. Додека карактерот во UCS 10646 вклучува комбинација од кодот и нејзиното име, Уникод додава многу други корисни својства на наборот на знаци, како што се блок, категорија, скрипта и насоченост.
Во прилог на UCS, Уникод, исто така, обезбедува и други детали за имплементација, како што се:

трансцентрирање на мапирање помеѓу UCS и други множества на знаци
различни сорти на карактери и стрингови за различни јазици
алгоритам за поставување двонасочен текст, каде што текстот на истата линија може да се префрли помеѓу лево-десно и од десно кон лево
алгоритам за преклопување на случај

Крајните корисници на компјутерски софтвер ги внесуваат овие знаци во програми преку различни методи на внесување. Методите на внесување можат да бидат преку тастатура или графичка палета на знаци.
UCS може да се подели на различни начини, како на пример со авион, блок, карактерска категорија или својство на знаци.
[Азбука][Логограм][Abugida][Хангул][Kanji][Hanja][Арапски][Хебрејски јазик][Тана]
1.Преглед на референца за знаци
2.Авиони
3.Блокови
4.Категории
5.Специјални карактери
5.1.Бајт цел марка
5.2.Математички невидливи
5.3.Фракција коса црта
5.4.Двонасочно неутрално форматирање
5.5.Двонасочно генерално форматирање
5.6.Интерлинеарни карактери за означување
5.7.Специфични за сценарио
5.8.Други
6.Празни простори, столари и сепаратори
6.1.Графемарски столари и не-столари
6.2.Зборници и сепаратори
6.3.Други сепаратори
6.4.Простори
6.5.Линија-кршење контролни знаци
7.Посебни кодни поени
7.1.Не-карактери
7.2.Сурогати
7.3.Приватно користење
8.Ликови графема кластери и хиероглифи
8.1.Карактери за компатибилност
9.Карактеристики на карактери
[Испратите Повеќе Содржина ]


Авторски права @2018 Lxjkh