Kompyuterlar raqamlardan foydalanadi. Odamlar harflar va belgilardan foydalanadilar. Bizga ko'prik kerak. ASCII bu ko'prikdir. ASCII har bir harf yoki belgini raqamga aylantiradi. Kompyuter raqamni saqlaydi. Biz o'qiganimizda, kompyuter yana xatni ko'rsatadi. Ko'pgina fayllar va ilovalarda matn shunday ishlaydi.
Kompyuter elektr toki bilan ishlaydi. U ikkita holatni ko'radi. Yoqish va o'chirish. Biz bu holatlarni bit deb ataymiz. Bit - 0 yoki 1. Ko'p bitlar birgalikda kattaroq raqamlarni hosil qiladi. Sakkiz bit bayt hosil qiladi. Bitlar bilan biz hisoblashimiz mumkin. Hisoblash orqali biz narsalarni nomlashimiz mumkin. ASCII harflar va belgilarni nomlash uchun hisoblashdan foydalanadi.
Bitta bit ikkita tanlovni amalga oshiradi. Ikki bit to'rtta tanlovni amalga oshiradi. Matematikada bu fikr \(\;2^n\) sifatida ko'rsatilgan. \(n=7\) uchun biz \(2^7 = 128\) tanlovni olamiz. \(n=8\) uchun biz \(2^8 = 256\) tanlovni olamiz. ASCII 7 bitdan foydalanadi. Bu 128 ta nomdagi narsalarni beradi. Keyinchalik odamlar 256 ta elementdan iborat 8 bitli to'plamlarni yaratdilar. Ular kengaytirilgan ASCII deb ataladi.
ASCII ma'lumot almashish uchun Amerika standart kodini anglatadi. Bu 1960-yillarda boshlangan. U dastlabki printerlar, teletayplar va kompyuterlar uchun yaratilgan. U har bir harf, raqam, bo'sh joy va ba'zi belgilarga raqam beradi. Bundan tashqari, yangi qator kabi harakatlarga maxsus raqamlar beradi. Birinchi versiyada 7 bit ishlatilgan, shuning uchun u 0 dan 127 gacha raqamlarga ega edi.
Biror narsaga e'tibor bering. Kichik harflar katta harflardan 32 taga ko'p. Masalan, \(\;97 - 65 = 32\) . Demak, "a" "A" dan 32 ga ko'p. "b" "B" dan 32 ga ko'p va hokazo. Ushbu naqsh ba'zi kompyuter vazifalarini osonlashtiradi.
Enter tugmasini bosganingizda, kompyuteringiz tizimga qarab LF yoki CR yoki ikkalasini ham yuborishi mumkin. Ko'pgina internet vositalari LF dan foydalanadi. Ba'zi eski tizimlar CR va LFni birgalikda ishlatgan.
Biz raqamlarni turli yo'llar bilan yozishimiz mumkin. O'nlik bu biz hisoblashning odatiy usuli bo'lib, 0 dan 9 gacha bo'lgan raqamlardan foydalanadi. Binary faqat 0 va 1 dan foydalanadi. Hex (on oltilik) 0 dan 9 gacha va A dan F gacha.
Ikkilik qanday qilib "A" uchun 65 ni tashkil qiladi? 01000001-dagi bitlarga qarang. Eng chap bit 128 uchun. Keyin 64, 32, 16, 8, 4, 2, 1. Faqat 64 va 1 yoniq. Shunday qilib \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .
Bir tugmani bosing. Klaviatura kompyuterga kod yuboradi. Tizim uni belgi raqamiga aylantiradi. Ko'pgina kalitlar uchun bu raqam ASCII raqamidir. Ilova raqamni xotirada saqlaydi. Matnni ko'rsatganda, u raqamni qidiradi va harfni chizadi. Saqlaganingizda raqamlar faylga kiradi.
Xabarni o'ylab ko'ring Salom! . Harflar H, i va !. Ularning ASCII raqamlari 72, 105 va 33. Ikkilik tizimda ular 01001000, 01101001 va 00100001. Tarmoq bu bitlarni yuboradi. Boshqa tomon bitlarni o'qiydi. Bu raqamlarni ko'radi. Bu H, i va ni ko'rsatadi! yana. Oddiy matnli xabarlar shunday siljiydi.
Odamlar ko'proq belgilarni xohlashdi. Ular é, ñ va ø kabi harflarni xohlashdi. Ular € kabi pul belgilarini xohlashdi. 7-bitli to'plamda faqat 128 ta belgi bor edi. Shunday qilib, odamlar 8 bitdan foydalandilar. 8 bit bilan biz \(2^8 = 256\) belgilarini olamiz. 128 dan 255 gacha bo'lgan yuqori yarmi qo'shimcha harflar va belgilar uchun ishlatilgan. Lekin muammo bor edi. Turli guruhlar ushbu qo'shimcha harflar uchun turli raqamlarni tanladilar. Ushbu tanlovlar kod sahifalari deb ataladi.
Kod sahifalari har xil bo'lganligi sababli, bir xil raqam boshqa kompyuterda boshqa belgini ko'rsatishi mumkin. Ushbu aralash mojibake deb ataladi. Bu g'alati belgilarga o'xshaydi. Bu dunyoning Unicode-ga o'tishining sabablaridan biri.
Unicode ko'plab tillar, matematik belgilar va emojilarni ko'rsatishi mumkin bo'lgan katta standartdir. Unda milliondan ortiq belgilar uchun joy mavjud. Unicode-ni saqlashning ko'plab usullari mavjud. Mashhur usullardan biri UTF-8 .
Faqat ASCII matni bilan har bir belgi bir baytdan foydalanadi. Shunday qilib, mushuk so'zi 3 baytdan foydalanadi. Salom onam iborasi bo'sh joy bilan birga 6 ta belgidan iborat, shuning uchun u 6 baytdan foydalanadi. Oddiy matematikada \(\textrm{ASCII baytlari} = \textrm{belgilar soni}\) .
Kompyuterlar ko'pincha satrlarni belgilar raqamlari bo'yicha saralaydi. ASCII tartibi narsalarni ma'lum bir tarzda guruhlaydi.
Bu shuni anglatadiki, agar oddiy ASCII qiymatlarini solishtirsak, Zoo olmadan oldin keladi. Saralash so'zlarning ovoziga qarab emas, balki raqamlar bo'yicha.
E'tibor bering , ampersand &. Uning ASCII raqami 38. Plyus belgisi + 43. Minus belgisi - 45.
Odamlar faqat belgilar yordamida rasm yaratadilar. Bu ASCII san'ati deb ataladi. Mana, ASCII belgilar bilan yaratilgan kichkina yuz.
:-) Oddiy tabassum
(^_^) Do'stona yuz
o_O hayron
Har bir yuz ikki nuqta, tire va qavs kabi belgilardir. Ranglar yoki shakllar yo'q. Faqat matn.
ASCII teletayplar va dastlabki kompyuterlardan paydo bo'lgan. 1963 yilda birinchi versiya kelishib olindi. Bu turli xil mashinalarning bir-biri bilan gaplashishiga yordam berdi. Bitta umumiy kod bilan A kabi harf hamma joyda bir xil raqamni anglatadi. Bu xabarlarni yuborish va matnni chop etishni osonlashtirdi.
ASCII faqat 128 ta elementga ega. Bu hamma tillar uchun yetarli emas. U xitoy, hind, arab yoki boshqa koʻplab yozuvlarni koʻrsata olmaydi. U kulgichlarni ko‘rsata olmaydi. Shuningdek, u ko'plab matematik va musiqa belgilarini ko'rsata olmaydi. Buning uchun biz Unicode-dan foydalanamiz. Unicode ko'plab skriptlar va belgilarni ko'rsatishi mumkin. UTF-8 ularni saqlash usulidir. Yaxshi xabar shundaki, barcha ASCII matnlari UTF-8 ichida ishlaydi. Shunday qilib, zamonaviy tizimlar eski ASCII-ni osongina o'qiy oladi.
Aksariyat ilovalar UTF-8 ni kutadi. Ammo faylda faqat ASCII harflari va belgilari bo'lsa, u UTF-8 ostida bir xil ko'rinadi. Dasturchilar buni yaxshi ko'radilar, chunki u oddiy narsalarni saqlaydi. Veb-sahifalar, API-lar va ko'plab vositalar o'zgarishsiz ASCII-ni o'z ichiga olgan UTF-8 dan foydalanadi.
ASCII - bu 7 bitli to'plam. Bu \(2^7 = 128\) gacha turli belgilarni bildiradi. 8 bitli kengaytirilgan to'plamda \(2^8 = 256\) elementlar mavjud. Agar matningizda faqat ASCII belgilar bo'lsa va unda \(n\) belgilar bo'lsa, u \(n\) baytdan foydalanadi. OK kabi kichik xabarda \(n = 2\) . Shunday qilib, u ASCII yoki UTF-8 sifatida saqlanganida 2 baytdan foydalanadi.
Ba'zi ASCII elementlari amal qiladi va chop etilmaydi. Bo'sh joy bo'sh chop etadi. Lekin LF va CR kursorni harakatga keltiradi. TAB sakrab o'tadi. Faylni maxsus muharrirda ochganimizda, u LF ni \n sifatida ko'rsatishi mumkin. Bu belgi ASCII ning o'zi emas. Bu muharrir sizga qator uzilishini ko'rsatadigan usul.
Nomlarni chop etadigan yorliq ishlab chiqaruvchisini tasavvur qiling. U ismni belgilar sifatida o'qiydi. U har bir belgini ASCII raqamlariga aylantiradi. U ushbu raqamlarni xotirada saqlaydi. Har bir raqamni qanday chizish kerakligini qidirib, harflarni chop etadi. Agar u LF (10) ga to'g'ri kelsa, u ko'proq chop etishdan oldin keyingi qatorga o'tadi.
Qahramonga qarang! yana. Biz uning kodini uchta usulda yozishimiz mumkin. O'nlik: 33. Ikkilik: 00100001. O'n oltilik: 21. Matematik shaklda, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Har bir shakl bir xil qiymatga ega. Ilovalar kerakli shaklni tanlaydi. Odamlar ko'pincha kasrni o'qiydilar. Ikkilik kabi kompyuterlar. Hex - bu odamlar uchun ikkilik raqamlarni o'qishning qisqa usuli.
ASCII kichik va aniq. Bu erta qilingan. Unga ko'plab vositalar va protokollar qurilgan. Birinchi 128 ta Unicode kodlari ASCIIga mos kelganligi sababli, reja bugungi kunda ham ishlaydi. Shuning uchun siz yangi telefon yoki noutbukda juda eski matnli fayllarni ochishingiz va bir xil harflarni ko'rishingiz mumkin.
Salom matni bilan faylni oching. Baytlar ASCII raqamlari 72 101 108 108 111. Ikkilik tizimda ular 01001000 01100101 01101100 01101100 01101111. Ilova har bir raqamni oʻqiydi va ekranda H elloni chizadi. Agar keyingi raqam 10 bo'lsa, u ko'proq matn chizishdan oldin yangi qatorga o'tadi. Bu jarayon qanchalik sodda va barqaror.
10 raqamini o'ylab ko'ring. Ikkilik tizimda, ya'ni 00001010. O'nli tizimda bu o'nta. ASCIIda 10 - LF, chiziq tasmasi. Bu bir xil raqamni turli yo'llar bilan qanday ko'rsatish mumkinligini ko'rsatadi. Ma'nosi raqamni qanday ishlatishimizdan kelib chiqadi. Agar bu belgilar kodi desak, 10 LF degan ma'noni anglatadi. Agar bu faqat olma hisobi desak, bu o'nta olma. Kontekst muhim.
Quyosh so'zini bir qurilmadan boshqa qurilmaga yuboramiz. Kodlar 'S' 83, 'u' 117, 'n' 110. Ikkilik tizimda 83 - 01010011, 117 - 01110101, 110 - 01101110. Bitlar Yoqish va O'chirish signallari sifatida harakatlanadi. Boshqa qurilma bitlarni yana raqamlarga aylantiradi. Keyin raqamlarni harflarga aylantiradi. U Quyosh so'zini ko'rsatadi. Agar keyingi kod 32 bo'lsa, bu bo'sh joy. Agar keyingi raqam 33 bo'lsa, bu "!". Qoidalar har safar bir xil bo'lib qoladi. Bu umumiy kodning kuchi.