Компјутерите користат броеви. Луѓето користат букви и симболи. Ни треба мост. ASCII е тој мост. ASCII ја претвора секоја буква или симбол во број. Компјутерот го складира бројот. Кога читаме, компјутерот повторно ја прикажува буквата. Така функционира текстот во многу датотеки и апликации.
Компјутерот работи со електрична енергија. Тој гледа две состојби. Вклучена и Исклучена. Овие состојби ги нарекуваме битови . Битот е 0 или 1. Многу битови заедно прават поголеми броеви. Осум битови прават еден бајт . Со битови можеме да броиме. Со броење можеме да именуваме работи. ASCII го користи броењето за да именува букви и симболи.
Еден бит дава два избора. Два бита даваат четири избора. Во математиката, оваа идеја е прикажана како \(\;2^n\) . За \(n=7\) , добиваме \(2^7 = 128\) избора. За \(n=8\) , добиваме \(2^8 = 256\) избора. ASCII користи 7 бита. Тоа дава 128 именувани елементи. Луѓето подоцна направија 8-битни множества со 256 елементи. Тие се нарекуваат проширен ASCII .
ASCII е кратенка за Американски стандарден код за размена на информации . Започна во 1960-тите. Беше направен за раните печатачи, телетипови и компјутери. Им дава на секоја буква, број, празно место и на некои симболи број. Исто така, дава специјални броеви на дејства како што е внесување нов ред . Првата верзија користеше 7 бита, па затоа имаше броеви од 0 до 127.
Забележете нешто интересно. Малите букви се 32 повеќе од нивниот пар големи букви. На пример, \(\;97 - 65 = 32\) . Значи, „a“ е 32 повеќе од „A“. „b“ е 32 повеќе од „B“, и така натаму. Овој образец ги олеснува некои компјутерски задачи.
Кога ќе го притиснете копчето Enter, вашиот компјутер може да испрати LF или CR или и двете, во зависност од системот. Многу интернет алатки користат LF. Некои стари системи користеа CR и LF заедно.
Можеме да ги запишуваме броевите на различни начини. Децималниот систем е вообичаен начин на кој броиме, користејќи цифри од 0 до 9. Бинарниот систем користи само 0 и 1. Хексадецималниот систем користи од 0 до 9 и од A до F.
Како бинарниот систем прави 65 за „A“? Погледнете ги битовите во 01000001. Најлевиот бит е за 128. Потоа 64, 32, 16, 8, 4, 2, 1. Само 64 и 1 се вклучени. Значи \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .
Притиснете копче. Тастатурата испраќа код до компјутерот. Системот го претвора во број на знак. За многу копчиња, тој број е ASCII бројот. Апликацијата го складира бројот во меморијата. Кога го прикажува текстот, го бара бројот и ја црта буквата. Кога зачувувате, броевите влегуваат во датотеката.
Замислете ја пораката Здраво!. Буквите се H, i и !. Нивните ASCII броеви се 72, 105 и 33. Во бинарен код, тие се 01001000, 01101001 и 00100001. Мрежата ги испраќа овие битови. Другата страна ги чита битовите. Ги гледа броевите. Повторно ги прикажува H, i и !. Така се движат едноставните текстуални пораки.
Луѓето сакаа повеќе симболи. Сакаа букви како é, ñ и ø. Сакаа знаци за пари како €. 7-битниот сет имаше само 128 симболи. Значи, луѓето користеа 8 бита. Со 8 бита, добиваме \(2^8 = 256\) симболи. Горната половина, од 128 до 255, се користеше за дополнителни букви и симболи. Но, имаше проблем. Различни групи избираа различни броеви за тие дополнителни букви. Овие избори се нарекуваат кодни страници .
Бидејќи кодните страници се разликуваат, истиот број може да прикаже различен симбол на друг компјутер. Оваа збрка се нарекува mojibake . Изгледа како чудни знаци. Ова е една од причините зошто светот се префрли на Unicode.
Уникод е голем стандард кој може да прикажува многу јазици, математички симболи и емотикони. Има простор за повеќе од милион симболи. Постојат многу начини за складирање на Уникод. Еден популарен начин е UTF-8 .
Кај текст само во ASCII код, секој знак користи еден бајт. Значи, зборот „мачка “ користи 3 бајти. Фразата „здраво мамо“ има 6 знаци, вклучувајќи го и празното место, па затоа користи 6 бајти. Во едноставна математика, \(\textrm{ASCII бајти} = \textrm{број на знаци}\) .
Компјутерите често ги сортираат низите според нивните броеви на знаци. ASCII редоследот ги групира работите на одреден начин.
Ова значи дека Zoo доаѓа пред apple ако споредуваме едноставни ASCII вредности. Сортирањето е по броеви, а не по тоа како звучат зборовите.
Забележете дека амперсандот е &. Неговиот ASCII број е 38. Знакот плус + е 43. Знакот минус - е 45.
Луѓето прават слики користејќи само знаци. Ова се нарекува ASCII уметност . Еве едно мало лице направено со ASCII знаци.
:-) Едноставна насмевка
(^_^) Пријателско лице
o_O Изненаден
Секое лице е само знаци како две точки, цртичка и загради. Без бои или форми. Само текст.
ASCII произлезе од телетипови и рани компјутери. Во 1963 година, беше договорена првата верзија. Им помогна на многу различни машини да комуницираат едни со други. Со еден заеднички код, буквата како А значеше ист број насекаде. Ова го олесни испраќањето пораки и печатењето текст.
ASCII има само 128 елементи. Тоа не е доволно за сите јазици. Не може да прикажува кинески, хинди, арапски или многу други писма. Не може да прикажува емотикони. Исто така, не може да прикажува многу математички и музички симболи. За нив користиме Unicode. Unicode може да прикажува многу писма и симболи. UTF-8 е начин за нивно складирање. Добрата вест е дека целиот ASCII текст работи во UTF-8. Значи, современите системи можат лесно да го читаат стариот ASCII.
Повеќето апликации очекуваат UTF-8. Но, кога датотеката има само ASCII букви и симболи, таа изгледа исто и под UTF-8. На програмерите им се допаѓа ова бидејќи ги прави работите едноставни. Веб-страниците, API-јата и многу алатки користат UTF-8, кој вклучува ASCII без промени.
ASCII е 7-битен сет. Тоа значи до \(2^7 = 128\) различни знаци. Проширен сет со 8 бита има \(2^8 = 256\) елементи. Ако вашиот текст има само ASCII знаци и има \(n\) знаци, тогаш користи \(n\) бајти. Во мала порака како OK , \(n = 2\) . Значи, користи 2 бајти кога се складира како ASCII или UTF-8.
Некои ASCII елементи вршат дејства и не се печатат. Празното место се печати празно. Но, LF и CR го поместуваат курсорот. TAB скока. Кога отвораме датотека во специјален уредувач, може да се прикаже LF како \n. Тој симбол не е дел од самиот ASCII. Тоа е начин на кој уредувачот ви го прикажува прекинот на редот.
Замислете машина за етикети што печати имиња. Ги чита имињата како знаци. Секој знак го претвора во ASCII броеви. Ги складира тие броеви во меморијата. Ги печати буквите барајќи како да се нацрта секој број. Ако се исполни LF (10), се префрла на следниот ред пред да печати повеќе.
Погледнете го повторно знакот „!“. Можеме да го напишеме неговиот код на три начини. Децимален: 33. Бинарен: 00100001. Хексадецимален: 21. Во математичка форма, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Секоја форма има иста вредност. Апликациите ја избираат формата што им е потребна. Луѓето често читаат децимални броеви. Компјутерите го сакаат бинарниот систем. Хексадецималниот е краток начин за луѓето да читаат бинарни броеви.
ASCII е мал и јасен. Направен е рано. Многу алатки и протоколи се изградени врз него. Бидејќи првите 128 Unicode кодови се совпаѓаат со ASCII, планот сè уште функционира денес. Затоа можете да отворите многу стари текстуални датотеки на нов телефон или лаптоп и да ги видите истите букви.
Отворете датотека со текстот „Здраво“ . Бајтите се ASCII броевите 72 101 108 108 111. Во бинарен код, тоа се 01001000 01100101 01101100 01101100 01101111. Апликацијата го чита секој број и црта „Здраво“ на екранот. Ако следниот број е 10, се префрла на нов ред пред да црта повеќе текст. Толку е едноставен и стабилен процесот.
Помислете на бројот 10. Во бинарен систем, тоа е 00001010. Во децимален систем, тоа е десет. Во ASCII, 10 е LF, доводот на ред. Ова покажува како истиот број може да се прикаже на различни начини. Значењето доаѓа од тоа како го користиме бројот. Ако кажеме дека е код на знак, тогаш 10 значи LF. Ако кажеме дека е само број на јаболка, тогаш тоа се десет јаболка. Контекстот е важен.
Ќе го испратиме зборот Sun од еден уред на друг. Кодовите се „S“ 83, „u“ 117, „n“ 110. Во бинарен систем, 83 е 01010011, 117 е 01110101, 110 е 01101110. Битовите патуваат како сигнали за вклучување и исклучување. Другиот уред ги претвора битовите назад во броеви. Потоа ги претвора броевите во букви. Го прикажува зборот Sun. Ако следниот код е 32, тоа е празно место. Ако следниот е 33, тоа е „!“. Правилата остануваат исти секој пат. Тоа е моќта на споделениот код.