Rakstzīmju kodējums

Vikipēdijas lapa

Rakstzīmju kodējums jeb rakstzīmju kopa (angļu: Character encoding jeb character set) ir sistēma, kas paredzēta rakstzīmju kodēšanai noteiktā secībā. Rakstzīmes var būt alfabēta burti, cipari, dažādi simboli. Rakstzīmju kopas visplašāk izmanto datu elektroniskā apstrādē, uzglabāšanā un pārsūtīšanā. Piemēram, Morzes kods, kurā latīņu alfabēta burtus kodē ar gariem un īsiem telegrāfa signāliem, vai ASCII, kurā burtus, ciparus, un citus simbolus kodē ar 7 bitu skaitļiem.

Datoru ēras sākumā radās vajadzība standartizēt teksta rakstzīmju un citu simbolu izmantošanu elektroniskajās sistēmās; ASV izveidoja ASCII (1963.) un EBCDIC (1964.). Drīz vien šīs kopas izrādījās ierobežotas, un tika izgudrotas dažādas metodes, kā tās paplašināt. Daudzo rakstību, tai skaitā ķīniešu, korejiešu un japāņu, atbalstam ir izstrādātas īpašas sistēmas rakstzīmju kodēšanai.

Vienkāršās rakstzīmju kopas[labot šo sadaļu | labot pirmkodu]

Tradicionāli termini "rakstzīmju kopa" un "rakstzīmju kodējums" bija sinonīmi, tā kā viens standarts noteica gan to, kādas rakstzīmes ir pieejamas, gan to, kā tās kodējamas koda vienību plūsmā (parasti viens simbols vienai koda vienībai).

Modernie kodēšanas modeļi[labot šo sadaļu | labot pirmkodu]

Unikods un tā paralēlais standarts ISO/IEC 10646 (Universal Character Set) novirzījās no šīs idejas. Tie izvirzīja sekojošus jautājumus: kādas rakstzīmes ir pieejamas, to secības, kā šie secības numuri kodējami kā "koda vienības" un visbeidzot kā šīs vienības kodētas kā oktetu (baitu) plūsma. Šī sadalījuma pamatideja ir izveidot universālu rakstzīmju kopu, kuru varētu kodēt dažādos veidos.

Pazīstamākie rakstzīmju kodējumi[labot šo sadaļu | labot pirmkodu]