Gumagamit ang mga computer ng mga numero. Gumagamit ang mga tao ng mga titik at simbolo. Kailangan natin ng tulay. ASCII ang tulay na iyon. Ginagawang numero ng ASCII ang bawat titik o simbolo. Iniimbak ng computer ang numero. Kapag nagbasa kami, ipinakita muli ng computer ang sulat. Ganito gumagana ang text sa maraming file at app.
Gumagana ang isang computer gamit ang kuryente. Nakikita nito ang dalawang estado. Naka-on at Naka-off. Tinatawag namin itong mga estado na bits . Ang bit ay 0 o 1. Maraming bit na magkakasama ay gumagawa ng mas malaking numero. Ang walong bit ay gumagawa ng isang byte . Sa bits, mabibilang natin. Sa pagbibilang, maaari nating pangalanan ang mga bagay. Gumagamit ang ASCII ng pagbibilang upang pangalanan ang mga titik at simbolo.
Ang isang bit ay gumagawa ng dalawang pagpipilian. Dalawang bit ay gumagawa ng apat na pagpipilian. Sa matematika, ang ideyang ito ay ipinapakita bilang \(\;2^n\) . Para sa \(n=7\) , nakakakuha kami \(2^7 = 128\) na mga pagpipilian. Para sa \(n=8\) , nakakakuha kami \(2^8 = 256\) na mga pagpipilian. Gumagamit ang ASCII ng 7 bits. Nagbibigay iyon ng 128 na pinangalanang item. Nang maglaon, gumawa ang mga tao ng 8-bit na set na may 256 na item. Ang mga iyon ay tinatawag na extended ASCII .
Ang ASCII ay kumakatawan sa American Standard Code for Information Interchange . Nagsimula ito noong 1960s. Ginawa ito para sa mga unang printer, teletype, at computer. Binibigyan nito ang bawat titik, numero, espasyo, at ilang simbolo ng numero. Nagbibigay din ito ng mga espesyal na numero sa mga aksyon tulad ng bagong linya . Ang unang bersyon ay gumamit ng 7 bits, kaya mayroon itong mga numero mula 0 hanggang 127.
Pansinin ang isang bagay na maayos. Ang mga maliliit na titik ay 32 higit pa sa kanilang malalaking pares. Halimbawa, \(\;97 - 65 = 32\) . Kaya't ang 'a' ay 32 higit pa sa 'A'. Ang 'b' ay 32 higit pa sa 'B', at iba pa. Pinapadali ng pattern na ito ang ilang gawain sa computer.
Kapag pinindot mo ang Enter key, maaaring magpadala ang iyong computer ng LF, o CR, o pareho, depende sa system. Maraming mga tool sa internet ang gumagamit ng LF. Ang ilang mga lumang sistema ay gumamit ng CR at LF nang magkasama.
Maaari tayong sumulat ng mga numero sa iba't ibang paraan. Ang desimal ay ang normal na paraan ng pagbibilang natin, gamit ang mga digit na 0 hanggang 9. Ang binary ay gumagamit lamang ng 0 at 1. Ang hex (hexadecimal) ay gumagamit ng 0 hanggang 9 at A hanggang F.
Paano ginagawa ng binary ang 65 para sa 'A'? Tingnan ang mga bit sa 01000001. Ang pinakakaliwang bit ay para sa 128. Pagkatapos ay 64, 32, 16, 8, 4, 2, 1. 64 at 1 lang ang naka-on. Kaya \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .
Pindutin ang isang key. Ang keyboard ay nagpapadala ng isang code sa computer. Ginagawa ito ng system bilang isang numero ng character. Para sa maraming key, ang numerong iyon ay ang numero ng ASCII. Iniimbak ng app ang numero sa memorya. Kapag ipinakita nito ang teksto, hinahanap nito ang numero at iguguhit ang titik. Kapag nag-save ka, mapupunta ang mga numero sa file.
Isipin ang mensahe Hi! . Ang mga titik ay H, i, at !. Ang kanilang mga numero ng ASCII ay 72, 105, at 33. Sa binary, ang mga ito ay 01001000, 01101001, at 00100001. Ang network ay nagpapadala ng mga bit na ito. Binabasa ng kabilang panig ang mga piraso. Nakikita nito ang mga numero. Ipinapakita nito ang H, i, at ! muli. Ganyan gumagalaw ang mga simpleng text message.
Gusto ng mga tao ng higit pang mga simbolo. Gusto nila ng mga titik tulad ng é, ñ, at ø. Gusto nila ng mga palatandaan ng pera tulad ng €. Ang 7-bit set ay mayroon lamang 128 na simbolo. Kaya gumamit ang mga tao ng 8 bits. Sa 8 bits, nakakakuha tayo \(2^8 = 256\) na mga simbolo. Ang nangungunang kalahati, mula 128 hanggang 255, ay ginamit para sa mga karagdagang titik at simbolo. Ngunit nagkaroon ng problema. Iba't ibang grupo ang pumili ng iba't ibang numero para sa mga karagdagang titik na iyon. Ang mga pagpipiliang ito ay tinatawag na mga pahina ng code .
Dahil magkaiba ang mga page ng code, ang parehong numero ay maaaring magpakita ng ibang simbolo sa ibang computer. Ang paghahalo na ito ay tinatawag na mojibake . Parang mga kakaibang karakter. Ito ang isang dahilan kung bakit lumipat ang mundo sa Unicode.
Ang Unicode ay isang malaking pamantayan na maaaring magpakita ng maraming wika, simbolo ng matematika, at emoji. Mayroon itong espasyo para sa higit sa isang milyong simbolo. Mayroong maraming mga paraan upang mag-imbak ng Unicode. Ang isang tanyag na paraan ay ang UTF-8 .
Sa ASCII-only text, ang bawat character ay gumagamit ng isang byte. Kaya ang salitang pusa ay gumagamit ng 3 bytes. Ang pariralang hi mom ay may 6 na character kasama ang space, kaya gumagamit ito ng 6 bytes. Sa simpleng matematika, \(\textrm{ASCII byte} = \textrm{bilang ng mga character}\) .
Ang mga computer ay madalas na nag-uuri ng mga string ayon sa kanilang mga numero ng character. Ang pagkakasunud-sunod ng ASCII ay nagpapangkat ng mga bagay sa isang tiyak na paraan.
Nangangahulugan ito na nauuna ang Zoo sa mansanas kung ihahambing natin ang mga simpleng halaga ng ASCII. Ang pag-uuri ay ayon sa mga numero, hindi sa pamamagitan ng tunog ng mga salita.
Pansinin ang ampersand ay &. Ang ASCII number nito ay 38. Ang plus sign + ay 43. Ang minus sign - ay 45.
Gumagawa lamang ng mga character ang mga tao. Ito ay tinatawag na ASCII art . Narito ang isang maliit na mukha na ginawa gamit ang mga character na ASCII.
:-) Simpleng ngiti
(^_^) Friendly na mukha
o_O Nagulat
Ang bawat mukha ay mga character lamang tulad ng tutuldok, gitling, at panaklong. Walang kulay o hugis. Text na lang.
Ang ASCII ay lumago mula sa mga teletype at maagang mga computer. Noong 1963, isang unang bersyon ang napagkasunduan. Nakatulong ito sa maraming iba't ibang makina na makipag-usap sa isa't isa. Sa isang nakabahaging code, ang isang titik tulad ng A ay nangangahulugan ng parehong numero sa lahat ng dako. Pinadali nito ang pagpapadala ng mga mensahe at pag-print ng teksto.
Ang ASCII ay mayroon lamang 128 na mga item. Iyan ay hindi sapat para sa lahat ng mga wika. Hindi ito maaaring magpakita ng Chinese, Hindi, Arabic, o marami pang ibang script. Hindi ito maaaring magpakita ng emoji. Hindi rin ito maaaring magpakita ng maraming simbolo ng matematika at musika. Para sa mga ito, ginagamit namin ang Unicode. Ang Unicode ay maaaring magpakita ng maraming mga script at simbolo. Ang UTF-8 ay isang paraan upang iimbak ang mga ito. Ang magandang balita ay gumagana ang lahat ng ASCII text sa loob ng UTF-8. Kaya madaling basahin ng mga modernong sistema ang lumang ASCII.
Inaasahan ng karamihan sa mga app ang UTF-8. Ngunit kapag ang isang file ay may lamang ASCII na mga titik at simbolo, ito ay mukhang pareho sa ilalim ng UTF-8. Gusto ito ng mga programmer dahil pinapanatili nitong simple ang mga bagay. Ang mga web page, API, at maraming tool ay gumagamit ng UTF-8, na kinabibilangan ng ASCII na walang pagbabago.
Ang ASCII ay isang 7-bit na set. Ibig sabihin, hanggang \(2^7 = 128\) iba't ibang character. Ang isang pinahabang set na may 8 bits ay mayroong \(2^8 = 256\) na mga item. Kung ang iyong teksto ay may mga ASCII na character lamang, at mayroon itong \(n\) na mga character, pagkatapos ay gumagamit ito ng \(n\) byte. Sa isang maliit na mensahe tulad ng OK , \(n = 2\) . Kaya ito ay gumagamit ng 2 byte kapag naka-imbak bilang ASCII o UTF-8.
Ang ilang mga item sa ASCII ay gumagawa ng mga aksyon at hindi nagpi-print. Blangko ang mga pag-print sa espasyo. Pero ginagalaw ng LF at CR ang cursor. Tumalon ang TAB. Kapag nagbukas kami ng file sa isang espesyal na editor, maaari itong magpakita ng LF bilang \n. Ang simbolo na iyon ay hindi bahagi ng ASCII mismo. Ito ay isang paraan na ipinapakita ng editor ang line break sa iyo.
Isipin ang isang gumagawa ng label na nagpi-print ng mga pangalan. Binabasa nito ang pangalan bilang mga character. Ginagawa nitong mga numero ng ASCII ang bawat karakter. Iniimbak nito ang mga numerong iyon sa memorya. Ito ay nagpi-print ng mga titik sa pamamagitan ng paghahanap kung paano gumuhit ng bawat numero. Kung nakakatugon ito sa LF (10), lilipat ito sa susunod na linya bago mag-print ng higit pa.
Tingnan ang karakter na '!' muli. Maaari nating isulat ang code nito sa tatlong paraan. Decimal: 33. Binary: 00100001. Hex: 21. Sa anyong matematika, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Ang bawat form ay pareho ang halaga. Pinipili ng mga app ang form na kailangan nila. Madalas basahin ng mga tao ang decimal. Mga computer tulad ng binary. Ang Hex ay isang maikling paraan para mabasa ng mga tao ang mga binary na numero.
Ang ASCII ay maliit at malinaw. Maaga itong ginawa. Maraming mga tool at protocol ang binuo dito. Dahil ang unang 128 Unicode code ay tumutugma sa ASCII, gumagana pa rin ang plano hanggang ngayon. Ito ang dahilan kung bakit maaari mong buksan ang mga lumang text file sa isang bagong telepono o laptop at makita ang parehong mga titik.
Magbukas ng file na may text na Hello . Ang mga byte ay ang mga numero ng ASCII 72 101 108 108 111. Sa binary, ang mga iyon ay 01001000 01100101 01101100 01101100 01101111. Binabasa ng app ang bawat numero at iginuhit ang H ello sa screen. Kung ang susunod na numero ay 10, lilipat ito sa isang bagong linya bago gumuhit ng higit pang teksto. Ganito kasimple at matatag ang proseso.
Isipin ang numero 10. Sa binary, iyon ay 00001010. Sa decimal, ito ay sampu. Sa ASCII, ang 10 ay LF, ang line feed. Ipinapakita nito kung paano maipapakita ang parehong numero sa iba't ibang paraan. Ang kahulugan ay nagmula sa kung paano natin ginagamit ang numero. Kung sasabihin natin na ito ay isang character code, ang ibig sabihin ng 10 ay LF. Kung sasabihin natin na ito ay isang bilang lamang ng mga mansanas, kung gayon ito ay sampung mansanas. Mahalaga ang konteksto.
Ipapadala namin ang salitang Sun mula sa isang device patungo sa isa pa. Ang mga code ay 'S' 83, 'u' 117, 'n' 110. Sa binary, 83 ay 01010011, 117 ay 01110101, 110 ay 01101110. Ang mga bit ay naglalakbay bilang On at Off signal. Ibinabalik ng ibang device ang mga bit sa mga numero. Pagkatapos ay ginagawang mga titik ang mga numero. Ipinapakita nito ang salitang Araw . Kung ang susunod na code ay 32, iyon ay isang puwang. Kung ang susunod ay 33, iyon ay '!'. Ang mga patakaran ay nananatiling pareho sa bawat oras. Iyan ang kapangyarihan ng isang nakabahaging code.