ÒdinatèTeknoloji enfòmasyon

Kodaj "Unicode": pèsonaj kodaj estanda

Chak itilizatè entènèt nan yon tantativ yo mete kanpe youn oswa lòt la nan fonksyon li yo nan omwen yon fwa te wè sou ekran an ekri nan lèt Latin pawòl Bondye a "Unicode." Ki sa ki se li, ou pral aprann lè yo li atik sa a.

definisyon

Kodaj "Unicode" - estanda pèsonaj kodaj. Li te pwopoze pa Unicode Inc. òganizasyon ki pa Peye- nan lane 1991. se estanda nan fèt yo pote ansanm pi gwo kantite a posib pou diferan kalite karaktè nan yon dokiman. Page, ki te etabli sou baz la ladan l ', kapab genyen lèt ak karaktè nan lang diferan (ki soti nan Ris nan Koreyen) ak siy matematik. Nan ka sa a, tout nan karaktè yo ki nan seri pèsonaj la yo ap parèt san yo pa nenpòt pwoblèm.

Rezon ki fè yo pou kreyasyon an nan

Yon fwa sou yon tan, depi lontan anvan aparans nan yon sistèm sèl se "Unicode" kodaj chwazi ki baze sou preferans yo nan otè a nan dokiman an. Pou rezon sa a, souvan li yon dokiman, li te nesesè yo sèvi ak tab diferan. Pafwa li nesesè fè plizyè fwa, ki anpil konplitché lavi sa a ki nan itilizatè a mwayèn. Kòm deja mansyone, yo te solisyon an nan pwoblèm sa a nan lane 1991 envite nan Unicode Inc. yon òganizasyon ki pa Peye-yo ofri yon nouvo tip kodaj karaktè. Li te fèt nan konbine demode ak yon varyete de estanda. "Unicode" - yon kodaj ki ozvolila reyalize malè a nan moman an: yo kreye yon zouti ki sipòte yon nimewo gwo karaktè. Rezilta a depase anpil atant - te gen dokiman an menm tan ki gen lang angle ak tèks Ris, Latin lan, ak ekspresyon matematik.

Men, kreyasyon an nan yon kodaj inifye anvan pa bezwen nan rezoud yon kantite pwoblèm sa yo ki te parèt akòz varyete nan gwo nan estanda ki egziste deja nan moman sa. Ki pi komen an nan yo:

  • Elvish ekri, oswa "bavardaj";
  • limit yo nan mete nan karaktè;
  • pwoblèm transfòme codings;
  • font repetisyon.

Ti èkskursus istorik

Imajine ke 80th nan lakou. pyès ki nan konpitè òdinatè se pa konsa pou sa komen ak gen yon fòm diferan de jodi a. Pandan ke chak OS se inik ak rafine bezwen espesifik chak antouzyast la. Bezwen pou echanj la nan enfòmasyon se konvèti nan yon tout bagay rivork adisyonèl. Ap eseye li yon dokiman kreye pa yon lòt sistèm opere, souvan montre yon seri etranj nan karaktè, ak jwèt la kòmanse ak kodaj la. Li pa toujou fè l 'vit, epi pafwa nesesè dokiman Kapab louvri nan sis mwa, e menm pita. Moun ki souvan echanj enfòmasyon, kreye pou tèt yo yon tab konvèsyon. Lè sa a, travay sou yo revele yon detay enteresan: bezwen an kreye yo nan de direksyon, "soti nan m 'ki nan ou" retounen ak lide. Fè ordinèr entèrvèrsyon machin informatique pa kapab, pou li nan kolòn adwat la nan sous la, ak bò gòch la - rezilta a, men se pa vis vèrsa. Si ou wè bezwen an yo sèvi ak nenpòt karaktè espesyal nan dokiman an, yo te gen yo dwe ajoute premye, ak Lè sa a yon lòt, epi pou esplike patnè nan sa li bezwen pou fè pou karaktè sa yo pa vin tounen yon "bavardaj." Li kite yo pa bliye ke pou chak kodaj te gen yo devlope oswa aplike polis pwòp yo, ki te mennen nan kreyasyon an nan yon nimewo gwo Doublon nan eksplwatasyon an.

Imajine plis ke polis yo sou paj la, ou pral wè 10 moso nan ki idantik Times New Roman ak yon nòt ti, paske utf-8, UTF-16, ANSI, uk-2. Koulye a, ou konprann ke devlopman nan estanda inivèsèl te enperatif?

"Papa ak fondatè nan créateur yo nan"

Orijin yo nan kreyasyon an Unicode te kapab jwenn nan 1987 lè Dzho Bekker nan Fotokopye, ansanm ak Lee Collins ak Mak Davis soti nan Apple la te kòmanse rechèch nan jaden an nan kreyasyon pratik nan yon seri pèsonaj inivèsèl. Nan mwa Out 1988, Dzho Bekker pibliye yon pwopozisyon bouyon pou kreyasyon an nan 16-bit milti-bileng sistèm kodaj entènasyonal yo.

Yon mwa apre kèk te Unicode k ap travay gwoup elaji genyen ladan yo Ken Whistler ak Mike Kernegana soti nan RLG, Glenn Rayt nan Solèy Microsystems ak plizyè lòt espesyalis, pèmèt ranpli fòm nan ak travay sou fòmasyon an preliminè sou yon estanda komen kodaj.

deskripsyon jeneral

Unicode la ki baze sou konsèp nan senbòl la. Anba definisyon sa a refere a yon fenomèn abstrè ki egziste nan yon fòm patikilye nan ekri e yo reyalize nan yon grafèm ( "pòtrè" yo). Chak karaktè ki te bay nan "Unicode" kòd la inik sa ki nan yon estanda inite patikilye. Eg grafèm B se tou nan lang angle ak alfabè Ris, men li koresponn ak Unicode 2 karaktè diferan. Yo se sijè a konvèsyon miniskil, t. E., Chak nan ki dekri baz done a kle, yon seri pwopriyete ak non an plen.

Benefis nan Unicode

Soti nan lòt kontanporen kodaj "Unicode" Gen yon stock fòmidab nan siy pou karaktè "chifreman". Lefèt ke chèf anvan l 'te gen 8 Bits, se sa ki te sipòte pa 28 karaktè, men desen an nouvo te deja 216 karaktè, ki te yon etap jeyan pou pi devan. Sa a pèmèt programme prèske tout alfabè yo ki deja egziste ak komen.

Avèk avenman a nan "Unicode" pa gen okenn ankò bezwen sèvi ak yon tab konvèsyon: kòm yon estanda sèl li jis négasion bezwen nan pou yo. Menm jan an tou, yo te koule nan oubli, ak "bavardaj" - yon estanda sèl te fè yo enposib, menm jan tou règ soti bezwen an yo kreye polis kopi.

devlopman nan Unicode

Natirèlman, pwogrè se pa nan plas, epi depi te prezantasyon an premye te pase pou 25 ane sa yo. Sepandan, charset "Unicode" t'ap fè tèt di kenbe pozisyon li nan mond lan. Nan plizyè fason sa a ki te fè posib gras a lefèt ke li te vin fasil aplike e li te gaye, ke yo te rekonèt devlopè nan propriétaires (peye) epi yo louvri lojisyèl sous.

Nou pa ta dwe kwè ke jodi a nou wè menm kòd "Unicode nan" kòm sezon an nan yon syèk de sa. Nan moman sa a, li te ranplase pa vèsyon 5.h.h, e li te ki kantite kode senbòl ogmante a 231. Sou posibilite pou lè l sèvi avèk yon maj pi gwo mak te refize toujou kenbe sipò pou Unicode-16 (kodaj, kote kantite maksimòm kantite limite yo 216). Depi kreyasyon li yo ak jiska vèsyon 2.0.0 "Creole an Unicode" a te vin ogmante kantite a nan karaktè ke li enkli prèske nan 2 fwa. opòtinite ak kwasans kontinye nan lanne k'ap vini. Pou vèsyon 4.0.0 deja gen yon bezwen ogmante estanda nan tèt li, ak sak te pase. Kòm yon rezilta, li te "Unicode" yo te jwenn fòm lan nan ki nou konnen li jodi a.

Ki lòt bagay se nan Unicode?

Anplis de sa nan vas a, toujou ap mete ajou ak ki kantite karaktè, "Unicode" -Encoding enfòmasyon tèks se yon lòt trè itil. Sa a se nòmalizasyon an sa yo rele. Olye ke woulo liv atravè pèsonaj la dokiman tout pa karaktè, ak ranplase ikon yo nan tablo a korespondans, sèvi ak youn nan algoritm yo nòmalizasyon ki egziste deja. Ki sa ki sa li ye?

Olye pou yo gaspiye resous yo nan òdinatè a sou yon chèk regilye nan karaktè a menm, ki ka menm jan an nan alfabè diferan, lè l sèvi avèk yon algorithm espesyal. Li pèmèt ou fè yon senbòl menm jan an separe tab kolòn Passage ak aplike deja yo, pa sou yo ak sou ankò nan verifye tout done yo.

algoritm sa yo devlope ak egzekite kat. Chak konvèsyon pran plas pa prensip entèdi definitif, diferan de lòt la, se konsa yo rele nenpòt youn nan yo se pa pi posib efikas la. Chak ki fèt pou bezwen espesifik, yo te entegre ak itilize avèk siksè.

estanda difizyon

Nan 25 ane sa yo nan istwa li kodaj "Unicode" Mwen te resevwa pwobableman pi toupatou a nan mond lan. Dapre sa a estanda yo ajiste kòm pwogram ak web-paj. lajè nan aplikasyon pouvwa endike ke Unicode kounye a itilize pa plis pase 60% nan resous entènèt.

Koulye a, ou konnen, lè "Unicode" estanda la te parèt. Ki sa ki li se, nou menm tou nou konnen epi yo dwe kapab apresye siyifikasyon an plen nan envansyon nan, te fèt pa yon gwoup ekspè Unicode Inc. Plis pase 25 ane de sa.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ht.birmiss.com. Theme powered by WordPress.