Google Play badge

ascii


ASCII: Како компјутерите складираат букви и симболи

Големата идеја

Компјутерите користат броеви. Луѓето користат букви и симболи. Ни треба мост. ASCII е тој мост. ASCII ја претвора секоја буква или симбол во број. Компјутерот го складира бројот. Кога читаме, компјутерот повторно ја прикажува буквата. Така функционира текстот во многу датотеки и апликации.

Зошто на компјутерите им е потребен код

Компјутерот работи со електрична енергија. Тој гледа две состојби. Вклучена и Исклучена. Овие состојби ги нарекуваме битови . Битот е 0 или 1. Многу битови заедно прават поголеми броеви. Осум битови прават еден бајт . Со битови можеме да броиме. Со броење можеме да именуваме работи. ASCII го користи броењето за да именува букви и симболи.

Еден бит дава два избора. Два бита даваат четири избора. Во математиката, оваа идеја е прикажана како \(\;2^n\) . За \(n=7\) , добиваме \(2^7 = 128\) избора. За \(n=8\) , добиваме \(2^8 = 256\) избора. ASCII користи 7 бита. Тоа дава 128 именувани елементи. Луѓето подоцна направија 8-битни множества со 256 елементи. Тие се нарекуваат проширен ASCII .

Што значи ASCII

ASCII е кратенка за Американски стандарден код за размена на информации . Започна во 1960-тите. Беше направен за раните печатачи, телетипови и компјутери. Им дава на секоја буква, број, празно место и на некои симболи број. Исто така, дава специјални броеви на дејства како што е внесување нов ред . Првата верзија користеше 7 бита, па затоа имаше броеви од 0 до 127.

Што е внатре во ASCII
Едноставни примери за мапи

Забележете нешто интересно. Малите букви се 32 повеќе од нивниот пар големи букви. На пример, \(\;97 - 65 = 32\) . Значи, „a“ е 32 повеќе од „A“. „b“ е 32 повеќе од „B“, и така натаму. Овој образец ги олеснува некои компјутерски задачи.

Контролни знаци со едноставни зборови

Кога ќе го притиснете копчето Enter, вашиот компјутер може да испрати LF или CR или и двете, во зависност од системот. Многу интернет алатки користат LF. Некои стари системи користеа CR и LF заедно.

Децимални, бинарни и хексадецимални прикази

Можеме да ги запишуваме броевите на различни начини. Децималниот систем е вообичаен начин на кој броиме, користејќи цифри од 0 до 9. Бинарниот систем користи само 0 и 1. Хексадецималниот систем користи од 0 до 9 и од A до F.

Како бинарниот систем прави 65 за „A“? Погледнете ги битовите во 01000001. Најлевиот бит е за 128. Потоа 64, 32, 16, 8, 4, 2, 1. Само 64 и 1 се вклучени. Значи \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .

Од тастатура до екран

Притиснете копче. Тастатурата испраќа код до компјутерот. Системот го претвора во број на знак. За многу копчиња, тој број е ASCII бројот. Апликацијата го складира бројот во меморијата. Кога го прикажува текстот, го бара бројот и ја црта буквата. Кога зачувувате, броевите влегуваат во датотеката.

Како текстот патува низ мрежа

Замислете ја пораката Здраво!. Буквите се H, i и !. Нивните ASCII броеви се 72, 105 и 33. Во бинарен код, тие се 01001000, 01101001 и 00100001. Мрежата ги испраќа овие битови. Другата страна ги чита битовите. Ги гледа броевите. Повторно ги прикажува H, i и !. Така се движат едноставните текстуални пораки.

Проширени ASCII и кодни страници

Луѓето сакаа повеќе симболи. Сакаа букви како é, ñ и ø. Сакаа знаци за пари како €. 7-битниот сет имаше само 128 симболи. Значи, луѓето користеа 8 бита. Со 8 бита, добиваме \(2^8 = 256\) симболи. Горната половина, од 128 до 255, се користеше за дополнителни букви и симболи. Но, имаше проблем. Различни групи избираа различни броеви за тие дополнителни букви. Овие избори се нарекуваат кодни страници .

Бидејќи кодните страници се разликуваат, истиот број може да прикаже различен симбол на друг компјутер. Оваа збрка се нарекува mojibake . Изгледа како чудни знаци. Ова е една од причините зошто светот се префрли на Unicode.

ASCII и Уникод

Уникод е голем стандард кој може да прикажува многу јазици, математички симболи и емотикони. Има простор за повеќе од милион симболи. Постојат многу начини за складирање на Уникод. Еден популарен начин е UTF-8 .

Колку бајти користи текстот

Кај текст само во ASCII код, секој знак користи еден бајт. Значи, зборот „мачка “ користи 3 бајти. Фразата „здраво мамо“ има 6 знаци, вклучувајќи го и празното место, па затоа користи 6 бајти. Во едноставна математика, \(\textrm{ASCII бајти} = \textrm{број на знаци}\) .

Редослед на сортирање со ASCII

Компјутерите често ги сортираат низите според нивните броеви на знаци. ASCII редоследот ги групира работите на одреден начин.

Ова значи дека Zoo доаѓа пред apple ако споредуваме едноставни ASCII вредности. Сортирањето е по броеви, а не по тоа како звучат зборовите.

Вообичаени ASCII кодови што треба да ги знаете

Забележете дека амперсандот е &. Неговиот ASCII број е 38. Знакот плус + е 43. Знакот минус - е 45.

Вистинска употреба во секојдневната технологија
ASCII шеми кои помагаат
Како можат да се направат слики со ASCII

Луѓето прават слики користејќи само знаци. Ова се нарекува ASCII уметност . Еве едно мало лице направено со ASCII знаци.

:-) Едноставна насмевка
(^_^) Пријателско лице
o_O Изненаден

Секое лице е само знаци како две точки, цртичка и загради. Без бои или форми. Само текст.

Историјата накратко, со едноставни зборови

ASCII произлезе од телетипови и рани компјутери. Во 1963 година, беше договорена првата верзија. Им помогна на многу различни машини да комуницираат едни со други. Со еден заеднички код, буквата како А значеше ист број насекаде. Ова го олесни испраќањето пораки и печатењето текст.

Кога ASCII не е доволен

ASCII има само 128 елементи. Тоа не е доволно за сите јазици. Не може да прикажува кинески, хинди, арапски или многу други писма. Не може да прикажува емотикони. Исто така, не може да прикажува многу математички и музички симболи. За нив користиме Unicode. Unicode може да прикажува многу писма и симболи. UTF-8 е начин за нивно складирање. Добрата вест е дека целиот ASCII текст работи во UTF-8. Значи, современите системи можат лесно да го читаат стариот ASCII.

Како апликациите се справуваат со ASCII денес

Повеќето апликации очекуваат UTF-8. Но, кога датотеката има само ASCII букви и симболи, таа изгледа исто и под UTF-8. На програмерите им се допаѓа ова бидејќи ги прави работите едноставни. Веб-страниците, API-јата и многу алатки користат UTF-8, кој вклучува ASCII без промени.

Факти за мали броеви и пријателска математика

ASCII е 7-битен сет. Тоа значи до \(2^7 = 128\) различни знаци. Проширен сет со 8 бита има \(2^8 = 256\) елементи. Ако вашиот текст има само ASCII знаци и има \(n\) знаци, тогаш користи \(n\) бајти. Во мала порака како OK , \(n = 2\) . Значи, користи 2 бајти кога се складира како ASCII или UTF-8.

Гледање скриени ликови

Некои ASCII елементи вршат дејства и не се печатат. Празното место се печати празно. Но, LF и CR го поместуваат курсорот. TAB скока. Кога отвораме датотека во специјален уредувач, може да се прикаже LF како \n. Тој симбол не е дел од самиот ASCII. Тоа е начин на кој уредувачот ви го прикажува прекинот на редот.

Обични примери што делуваат реалистично
Работи за кои треба да се внимава
Како уредите го користат ASCII во едноставни чекори

Замислете машина за етикети што печати имиња. Ги чита имињата како знаци. Секој знак го претвора во ASCII броеви. Ги складира тие броеви во меморијата. Ги печати буквите барајќи како да се нацрта секој број. Ако се исполни LF (10), се префрла на следниот ред пред да печати повеќе.

Споредување на три начини за пишување код за еден лик

Погледнете го повторно знакот „!“. Можеме да го напишеме неговиот код на три начини. Децимален: 33. Бинарен: 00100001. Хексадецимален: 21. Во математичка форма, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Секоја форма има иста вредност. Апликациите ја избираат формата што им е потребна. Луѓето често читаат децимални броеви. Компјутерите го сакаат бинарниот систем. Хексадецималниот е краток начин за луѓето да читаат бинарни броеви.

Зошто ASCII траеше толку долго

ASCII е мал и јасен. Направен е рано. Многу алатки и протоколи се изградени врз него. Бидејќи првите 128 Unicode кодови се совпаѓаат со ASCII, планот сè уште функционира денес. Затоа можете да отворите многу стари текстуални датотеки на нов телефон или лаптоп и да ги видите истите букви.

Мини водич: читање кратка датотека

Отворете датотека со текстот „Здраво“ . Бајтите се ASCII броевите 72 101 108 108 111. Во бинарен код, тоа се 01001000 01100101 01101100 01101100 01101111. Апликацијата го чита секој број и црта „Здраво“ на екранот. Ако следниот број е 10, се префрла на нов ред пред да црта повеќе текст. Толку е едноставен и стабилен процесот.

Кога да се избере само ASCII
Клучни симболи што луѓето често ги користат
Брза проверка на идеи за битови со мали броеви

Помислете на бројот 10. Во бинарен систем, тоа е 00001010. Во децимален систем, тоа е десет. Во ASCII, 10 е LF, доводот на ред. Ова покажува како истиот број може да се прикаже на различни начини. Значењето доаѓа од тоа како го користиме бројот. Ако кажеме дека е код на знак, тогаш 10 значи LF. Ако кажеме дека е само број на јаболка, тогаш тоа се десет јаболка. Контекстот е важен.

Спојување на сè со уште еден пример

Ќе го испратиме зборот Sun од еден уред на друг. Кодовите се „S“ 83, „u“ 117, „n“ 110. Во бинарен систем, 83 е 01010011, 117 е 01110101, 110 е 01101110. Битовите патуваат како сигнали за вклучување и исклучување. Другиот уред ги претвора битовите назад во броеви. Потоа ги претвора броевите во букви. Го прикажува зборот Sun. Ако следниот код е 32, тоа е празно место. Ако следниот е 33, тоа е „!“. Правилата остануваат исти секој пат. Тоа е моќта на споделениот код.

Download Primer to continue