Rakstzīmju kodējums

Vikipēdijas raksts

(Pāradresēts no Rakstzīmju kopa)
Pārlēkt uz: navigācija, meklēt

Rakstzīmju kodējums jeb rakstzīmju kopa (angļu: Character encoding jeb character set) ir sistēma, kas paredzēta rakstzīmju kodēšanai noteiktā secībā. Rakstzīmes var būt alfabēta burti, cipari, dažādi simboli. Rakstzīmju kopas visplašāk izmanto datu elektroniskā apstrādē, uzglabāšanā un pārsūtīšanā. Piemēram, Morzes kods, kurā latīņu alfabēta burtus kodē ar gariem un īsiem telegrāfa signāliem, vai ASCII, kurā burtus, ciparus, un citus simbolus kodē ar 7 bitu skaitļiem.

Datoru ēras sākumā radās vajadzība standartizēt teksta rakstzīmju un citu simbolu izmantošanu elektroniskajās sistēmās; ASV izveidoja ASCII (1963.) un EBCDIC (1964.). Drīz vien šīs kopas izrādījās ierobežotas, un tika izgudrotas dažādas metodes, kā tās paplašināt. Daudzo rakstību, tai skaitā ķīniešu, korejiešu un japāņu, atbalstam ir izstrādātas īpašas sistēmas rakstzīmju kodēšanai.

[izmainīt šo sadaļu] Vienkāršās rakstzīmju kopas

Tradicionāli termini "rakstzīmju kopa" un "rakstzīmju kodējums" bija sinonīmi, tā kā viens standarts noteica gan to, kādas rakstzīmes ir pieejamas, gan to, kā tās kodējamas koda vienību plūsmā (parasti viens simbols vienai koda vienībai).

[izmainīt šo sadaļu] Modernie kodēšanas modeļi

Unikods un tā paralēlais standarts ISO/IEC 10646 (Universal Character Set) atgāja no šīs idejas. Tie atdalīja idejas: kādas rakstzīmes ir pieejamas, to secības, kā šie secības numuri kodējami kā "koda vienības" un visbeidzot, kā šīs vienības kodētas kā oktetu (baitu) plūsma. Šīs dekompozīcijas pamatideja ir izveidot universālu rakstzīmju kopu, kuru var kodēt dažādos veidos.

[izmainīt šo sadaļu] Pazīstamākās rakstzīmju kodējumi