Kompjuterët përdorin numra. Njerëzit përdorin shkronja dhe simbole. Ne kemi nevojë për një urë. ASCII është ajo urë. ASCII e kthen çdo shkronjë ose simbol në një numër. Kompjuteri e ruan numrin. Kur lexojmë, kompjuteri e shfaq përsëri shkronjën. Kështu funksionon teksti në shumë skedarë dhe aplikacione.
Një kompjuter punon me energji elektrike. Ai sheh dy gjendje. Ndezur dhe Fikur. Ne i quajmë këto gjendje bit . Një bit është një 0 ose një 1. Shumë bit së bashku krijojnë numra më të mëdhenj. Tetë bit krijojnë një bajt . Me bit, ne mund të numërojmë. Me numërim, ne mund të emërtojmë gjëra. ASCII përdor numërimin për të emërtuar shkronja dhe simbole.
Një bit bën dy zgjedhje. Dy bit bëjnë katër zgjedhje. Në matematikë, kjo ide tregohet si \(\;2^n\) . Për \(n=7\) , marrim \(2^7 = 128\) zgjedhje. Për \(n=8\) , marrim \(2^8 = 256\) zgjedhje. ASCII përdor 7 bit. Kjo jep 128 artikuj të emërtuar. Njerëzit më vonë krijuan grupe 8-bitëshe me 256 artikuj. Këto quhen ASCII të zgjeruar .
ASCII qëndron për Kodin Standard Amerikan për Shkëmbimin e Informacionit . Filloi në vitet 1960. U krijua për printerët e hershëm, teletipet dhe kompjuterët. I jep çdo shkronje, numri, hapësire dhe disa simboleve një numër. Gjithashtu u jep numra të veçantë veprimeve si krijimi i një rreshti të ri . Versioni i parë përdorte 7 bit, kështu që kishte numra nga 0 deri në 127.
Vini re diçka interesante. Shkronjat e vogla janë 32 herë më shumë se çifti i tyre i shkronjave të mëdha. Për shembull, \(\;97 - 65 = 32\) . Pra, 'a' është 32 herë më shumë se 'A'. 'b' është 32 herë më shumë se 'B', e kështu me radhë. Ky model i bën disa detyra kompjuterike të lehta.
Kur shtypni tastin Enter, kompjuteri juaj mund të dërgojë LF, ose CR, ose të dyja, në varësi të sistemit. Shumë mjete interneti përdorin LF. Disa sisteme të vjetra përdornin CR dhe LF së bashku.
Ne mund t’i shkruajmë numrat në mënyra të ndryshme. Numrat dhjetorë janë mënyra normale me të cilën numërojmë, duke përdorur shifrat nga 0 deri në 9. Numrat binarë përdorin vetëm 0 dhe 1. Numrat heksadecimalë përdorin nga 0 deri në 9 dhe nga A deri në F.
Si e bën binar 65 për 'A'? Shikoni bitët në 01000001. Biti më i majtë është për 128. Pastaj 64, 32, 16, 8, 4, 2, 1. Vetëm 64 dhe 1 janë të aktivizuar. Pra \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .
Shtypni një tast. Tastiera i dërgon një kod kompjuterit. Sistemi e shndërron atë në një numër karakteri. Për shumë taste, ai numër është numri ASCII. Aplikacioni e ruan numrin në memorie. Kur shfaq tekstin, ai e kërkon numrin dhe e vizaton shkronjën. Kur e ruani, numrat futen në skedar.
Mendoni për mesazhin Përshëndetje!. Shkronjat janë H, i dhe !. Numrat e tyre ASCII janë 72, 105 dhe 33. Në sistemin binar, ato janë 01001000, 01101001 dhe 00100001. Rrjeti i dërgon këto bit. Ana tjetër i lexon bit-et. I sheh numrat. Tregon përsëri H, i dhe !. Kështu lëvizin mesazhet e thjeshta me tekst.
Njerëzit donin më shumë simbole. Ata donin shkronja si é, ñ dhe ø. Ata donin shenja parash si €. Seti 7-bitësh kishte vetëm 128 simbole. Pra, njerëzit përdorën 8 bit. Me 8 bit, marrim simbole \(2^8 = 256\) . Gjysma e sipërme, nga 128 në 255, u përdor për shkronja dhe simbole shtesë. Por kishte një problem. Grupe të ndryshme zgjodhën numra të ndryshëm për ato shkronja shtesë. Këto zgjedhje quhen faqe kodi .
Meqenëse faqet e kodit ndryshojnë, i njëjti numër mund të shfaqë një simbol të ndryshëm në një kompjuter tjetër. Kjo ngatërrim quhet mojibake . Duket si karaktere të çuditshme. Kjo është një arsye pse bota kaloi në Unicode.
Unicode është një standard i madh që mund të shfaqë shumë gjuhë, simbole matematikore dhe emoji. Ka hapësirë për më shumë se një milion simbole. Ka shumë mënyra për të ruajtur Unicode-in. Një mënyrë popullore është UTF-8 .
Me tekst vetëm në ASCII, çdo karakter përdor një bajt. Pra, fjala "cat" përdor 3 bajt. Fraza "hi mom" ka 6 karaktere duke përfshirë hapësirën, kështu që përdor 6 bajt. Në matematikë të thjeshtë, \(\textrm{Bajtet ASCII} = \textrm{numri i karaktereve}\) .
Kompjuterët shpesh i rendisin vargjet sipas numrave të karaktereve. Renditja ASCII i grupon gjërat në një mënyrë të caktuar.
Kjo do të thotë që Zoo vjen para apple nëse krahasojmë vlerat e thjeshta ASCII. Renditja bëhet sipas numrave, jo sipas mënyrës se si tingëllojnë fjalët.
Vini re se simboli "sandi" është &. Numri i tij ASCII është 38. Shenja plus + është 43. Shenja minus - është 45.
Njerëzit krijojnë fotografi duke përdorur vetëm karaktere. Kjo quhet art ASCII . Ja një fytyrë e vogël e bërë me karaktere ASCII.
:-) Buzëqeshje e thjeshtë
(^_^) Fytyrë miqësore
o_O I habitur
Çdo fytyrë është thjesht karaktere si dy pika, vizë dhe kllapa. Pa ngjyra ose forma. Vetëm tekst.
ASCII u zhvillua nga teletipet dhe kompjuterët e hershëm. Në vitin 1963, u ra dakord për një version të parë. Ai ndihmoi shumë makina të ndryshme të komunikonin me njëra-tjetrën. Me një kod të përbashkët, një shkronjë si A nënkuptonte të njëjtin numër kudo. Kjo e bëri më të lehtë dërgimin e mesazheve dhe printimin e tekstit.
ASCII ka vetëm 128 elementë. Kjo nuk është e mjaftueshme për të gjitha gjuhët. Nuk mund të tregojë kinezishten, hindishten, arabishten ose shumë alfabetë të tjera. Nuk mund të tregojë emoji. Gjithashtu, nuk mund të tregojë shumë simbole matematikore dhe muzikore. Për këto, ne përdorim Unicode. Unicode mund të tregojë shumë alfabetë dhe simbole. UTF-8 është një mënyrë për t'i ruajtur ato. Lajmi i mirë është se i gjithë teksti ASCII funksionon brenda UTF-8. Pra, sistemet moderne mund ta lexojnë ASCII-në e vjetër lehtësisht.
Shumica e aplikacioneve presin UTF-8. Por kur një skedar ka vetëm shkronja dhe simbole ASCII, ai duket njësoj edhe nën UTF-8. Programuesve u pëlqen kjo sepse i mban gjërat të thjeshta. Faqet e internetit, API-të dhe shumë mjete përdorin UTF-8, i cili përfshin ASCII pa ndryshime.
ASCII është një bashkësi 7-bitëshe. Kjo do të thotë deri në \(2^7 = 128\) karaktere të ndryshme. Një bashkësi e zgjeruar me 8 bit ka \(2^8 = 256\) elementë. Nëse teksti juaj ka vetëm karaktere ASCII dhe ka \(n\) karaktere, atëherë ai përdor \(n\) bajt. Në një mesazh të vogël si OK , \(n = 2\) . Pra, përdor 2 bajt kur ruhet si ASCII ose UTF-8.
Disa elementë ASCII kryejnë veprime dhe nuk shtypen. Hapësira shtypet bosh. Por LF dhe CR lëvizin kursorin. TAB kërcen. Kur hapim një skedar në një redaktues special, ai mund ta shfaqë LF si \n. Ky simbol nuk është pjesë e vetë ASCII. Është një mënyrë që redaktuesi ju tregon ndërprerjen e rreshtit.
Imagjinoni një pajisje për krijimin e etiketave që shtyp emra. Ai i lexon emrat si karaktere. Ai i kthen çdo karakter në numra ASCII. Ai i ruan këto numra në memorie. Ai shtyp shkronjat duke kërkuar se si të vizatohet secili numër. Nëse plotëson LF (10), ai kalon në rreshtin tjetër përpara se të shtypë më shumë.
Shikoni përsëri karakterin '!'. Mund ta shkruajmë kodin e tij në tre mënyra. Decimal: 33. Binar: 00100001. Heksadecimal: 21. Në formën matematikore, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Çdo formë ka të njëjtën vlerë. Aplikacionet zgjedhin formën që u nevojitet. Njerëzit shpesh lexojnë numrat decimalë. Kompjuterët pëlqejnë numrat binarë. Heksadecimal është një mënyrë e shkurtër për njerëzit për të lexuar numrat binarë.
ASCII është i vogël dhe i qartë. U krijua herët. Shumë mjete dhe protokolle u ndërtuan mbi të. Meqenëse 128 kodet e para të Unicode përputhen me ASCII, plani funksionon edhe sot. Kjo është arsyeja pse mund të hapni skedarë teksti shumë të vjetër në një telefon ose laptop të ri dhe të shihni të njëjtat shkronja.
Hapni një skedar me tekstin Hello . Bajtet janë numrat ASCII 72 101 108 108 111. Në binar, ato janë 01001000 01100101 01101100 01101100 01101111. Aplikacioni lexon çdo numër dhe vizaton "Hello" në ekran. Nëse numri tjetër është 10, ai lëviz në një rresht të ri përpara se të vizatojë më shumë tekst. Ja sa i thjeshtë dhe i qëndrueshëm është procesi.
Mendoni për numrin 10. Në sistemin binar, ky është 00001010. Në sistemin decimal, është dhjetë. Në sistemin ASCII, 10 është LF, prerja e rreshtit. Kjo tregon se si i njëjti numër mund të shfaqet në mënyra të ndryshme. Kuptimi vjen nga mënyra se si e përdorim numrin. Nëse themi se është një kod karakteri, atëherë 10 do të thotë LF. Nëse themi se është vetëm një numërim mollësh, atëherë janë dhjetë mollë. Konteksti ka rëndësi.
Do ta dërgojmë fjalën Sun nga një pajisje në tjetrën. Kodet janë 'S' 83, 'u' 117, 'n' 110. Në sistemin binar, 83 është 01010011, 117 është 01110101, 110 është 01101110. Bitet udhëtojnë si sinjale On dhe Off. Pajisja tjetër i kthen bitet përsëri në numra. Pastaj i kthen numrat në shkronja. Tregon fjalën Sun. Nëse kodi tjetër është 32, kjo është një hapësirë. Nëse kodi tjetër është 33, kjo është '!'. Rregullat mbeten të njëjta çdo herë. Kjo është fuqia e një kodi të përbashkët.