Google Play badge

ascii


ASCII: Kompyuterlar harflar va belgilarni qanday saqlaydi

Katta fikr

Kompyuterlar raqamlardan foydalanadi. Odamlar harflar va belgilardan foydalanadilar. Bizga ko'prik kerak. ASCII bu ko'prikdir. ASCII har bir harf yoki belgini raqamga aylantiradi. Kompyuter raqamni saqlaydi. Biz o'qiganimizda, kompyuter yana xatni ko'rsatadi. Ko'pgina fayllar va ilovalarda matn shunday ishlaydi.

Nima uchun kompyuterlarga kod kerak

Kompyuter elektr toki bilan ishlaydi. U ikkita holatni ko'radi. Yoqish va o'chirish. Biz bu holatlarni bit deb ataymiz. Bit - 0 yoki 1. Ko'p bitlar birgalikda kattaroq raqamlarni hosil qiladi. Sakkiz bit bayt hosil qiladi. Bitlar bilan biz hisoblashimiz mumkin. Hisoblash orqali biz narsalarni nomlashimiz mumkin. ASCII harflar va belgilarni nomlash uchun hisoblashdan foydalanadi.

Bitta bit ikkita tanlovni amalga oshiradi. Ikki bit to'rtta tanlovni amalga oshiradi. Matematikada bu fikr \(\;2^n\) sifatida ko'rsatilgan. \(n=7\) uchun biz \(2^7 = 128\) tanlovni olamiz. \(n=8\) uchun biz \(2^8 = 256\) tanlovni olamiz. ASCII 7 bitdan foydalanadi. Bu 128 ta nomdagi narsalarni beradi. Keyinchalik odamlar 256 ta elementdan iborat 8 bitli to'plamlarni yaratdilar. Ular kengaytirilgan ASCII deb ataladi.

ASCII nimani anglatadi

ASCII ma'lumot almashish uchun Amerika standart kodini anglatadi. Bu 1960-yillarda boshlangan. U dastlabki printerlar, teletayplar va kompyuterlar uchun yaratilgan. U har bir harf, raqam, bo'sh joy va ba'zi belgilarga raqam beradi. Bundan tashqari, yangi qator kabi harakatlarga maxsus raqamlar beradi. Birinchi versiyada 7 bit ishlatilgan, shuning uchun u 0 dan 127 gacha raqamlarga ega edi.

ASCII ichida nima bor
Oddiy xarita misollar

Biror narsaga e'tibor bering. Kichik harflar katta harflardan 32 taga ko'p. Masalan, \(\;97 - 65 = 32\) . Demak, "a" "A" dan 32 ga ko'p. "b" "B" dan 32 ga ko'p va hokazo. Ushbu naqsh ba'zi kompyuter vazifalarini osonlashtiradi.

Oddiy so'zlardagi belgilarni boshqarish

Enter tugmasini bosganingizda, kompyuteringiz tizimga qarab LF yoki CR yoki ikkalasini ham yuborishi mumkin. Ko'pgina internet vositalari LF dan foydalanadi. Ba'zi eski tizimlar CR va LFni birgalikda ishlatgan.

O'nlik, ikkilik va olti burchakli ko'rinishlar

Biz raqamlarni turli yo'llar bilan yozishimiz mumkin. O'nlik bu biz hisoblashning odatiy usuli bo'lib, 0 dan 9 gacha bo'lgan raqamlardan foydalanadi. Binary faqat 0 va 1 dan foydalanadi. Hex (on oltilik) 0 dan 9 gacha va A dan F gacha.

Ikkilik qanday qilib "A" uchun 65 ni tashkil qiladi? 01000001-dagi bitlarga qarang. Eng chap bit 128 uchun. Keyin 64, 32, 16, 8, 4, 2, 1. Faqat 64 va 1 yoniq. Shunday qilib \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .

Klaviaturadan ekrangacha

Bir tugmani bosing. Klaviatura kompyuterga kod yuboradi. Tizim uni belgi raqamiga aylantiradi. Ko'pgina kalitlar uchun bu raqam ASCII raqamidir. Ilova raqamni xotirada saqlaydi. Matnni ko'rsatganda, u raqamni qidiradi va harfni chizadi. Saqlaganingizda raqamlar faylga kiradi.

Matn tarmoq bo'ylab qanday tarqaladi

Xabarni o'ylab ko'ring Salom! . Harflar H, i va !. Ularning ASCII raqamlari 72, 105 va 33. Ikkilik tizimda ular 01001000, 01101001 va 00100001. Tarmoq bu bitlarni yuboradi. Boshqa tomon bitlarni o'qiydi. Bu raqamlarni ko'radi. Bu H, i va ni ko'rsatadi! yana. Oddiy matnli xabarlar shunday siljiydi.

Kengaytirilgan ASCII va kod sahifalari

Odamlar ko'proq belgilarni xohlashdi. Ular é, ñ va ø kabi harflarni xohlashdi. Ular € kabi pul belgilarini xohlashdi. 7-bitli to'plamda faqat 128 ta belgi bor edi. Shunday qilib, odamlar 8 bitdan foydalandilar. 8 bit bilan biz \(2^8 = 256\) belgilarini olamiz. 128 dan 255 gacha bo'lgan yuqori yarmi qo'shimcha harflar va belgilar uchun ishlatilgan. Lekin muammo bor edi. Turli guruhlar ushbu qo'shimcha harflar uchun turli raqamlarni tanladilar. Ushbu tanlovlar kod sahifalari deb ataladi.

Kod sahifalari har xil bo'lganligi sababli, bir xil raqam boshqa kompyuterda boshqa belgini ko'rsatishi mumkin. Ushbu aralash mojibake deb ataladi. Bu g'alati belgilarga o'xshaydi. Bu dunyoning Unicode-ga o'tishining sabablaridan biri.

ASCII va Unicode

Unicode ko'plab tillar, matematik belgilar va emojilarni ko'rsatishi mumkin bo'lgan katta standartdir. Unda milliondan ortiq belgilar uchun joy mavjud. Unicode-ni saqlashning ko'plab usullari mavjud. Mashhur usullardan biri UTF-8 .

Matn necha baytdan foydalanadi

Faqat ASCII matni bilan har bir belgi bir baytdan foydalanadi. Shunday qilib, mushuk so'zi 3 baytdan foydalanadi. Salom onam iborasi bo'sh joy bilan birga 6 ta belgidan iborat, shuning uchun u 6 baytdan foydalanadi. Oddiy matematikada \(\textrm{ASCII baytlari} = \textrm{belgilar soni}\) .

ASCII yordamida tartiblash tartibi

Kompyuterlar ko'pincha satrlarni belgilar raqamlari bo'yicha saralaydi. ASCII tartibi narsalarni ma'lum bir tarzda guruhlaydi.

Bu shuni anglatadiki, agar oddiy ASCII qiymatlarini solishtirsak, Zoo olmadan oldin keladi. Saralash so'zlarning ovoziga qarab emas, balki raqamlar bo'yicha.

Bilish uchun umumiy ASCII kodlari

E'tibor bering , ampersand &. Uning ASCII raqami 38. Plyus belgisi + 43. Minus belgisi - 45.

Kundalik texnikada haqiqiy foydalanish
Yordam beradigan ASCII naqshlari
ASCII yordamida rasmlarni qanday qilish mumkin

Odamlar faqat belgilar yordamida rasm yaratadilar. Bu ASCII san'ati deb ataladi. Mana, ASCII belgilar bilan yaratilgan kichkina yuz.

:-) Oddiy tabassum
(^_^) Do'stona yuz
o_O hayron

Har bir yuz ikki nuqta, tire va qavs kabi belgilardir. Ranglar yoki shakllar yo'q. Faqat matn.

Qisqasi, oddiy so'zlar bilan aytganda tarix

ASCII teletayplar va dastlabki kompyuterlardan paydo bo'lgan. 1963 yilda birinchi versiya kelishib olindi. Bu turli xil mashinalarning bir-biri bilan gaplashishiga yordam berdi. Bitta umumiy kod bilan A kabi harf hamma joyda bir xil raqamni anglatadi. Bu xabarlarni yuborish va matnni chop etishni osonlashtirdi.

ASCII etarli bo'lmaganda

ASCII faqat 128 ta elementga ega. Bu hamma tillar uchun yetarli emas. U xitoy, hind, arab yoki boshqa koʻplab yozuvlarni koʻrsata olmaydi. U kulgichlarni ko‘rsata olmaydi. Shuningdek, u ko'plab matematik va musiqa belgilarini ko'rsata olmaydi. Buning uchun biz Unicode-dan foydalanamiz. Unicode ko'plab skriptlar va belgilarni ko'rsatishi mumkin. UTF-8 ularni saqlash usulidir. Yaxshi xabar shundaki, barcha ASCII matnlari UTF-8 ichida ishlaydi. Shunday qilib, zamonaviy tizimlar eski ASCII-ni osongina o'qiy oladi.

Ilovalar bugungi kunda ASCII-ni qanday ishlatadi

Aksariyat ilovalar UTF-8 ni kutadi. Ammo faylda faqat ASCII harflari va belgilari bo'lsa, u UTF-8 ostida bir xil ko'rinadi. Dasturchilar buni yaxshi ko'radilar, chunki u oddiy narsalarni saqlaydi. Veb-sahifalar, API-lar va ko'plab vositalar o'zgarishsiz ASCII-ni o'z ichiga olgan UTF-8 dan foydalanadi.

Kichik sonli faktlar va do'stona matematika

ASCII - bu 7 bitli to'plam. Bu \(2^7 = 128\) gacha turli belgilarni bildiradi. 8 bitli kengaytirilgan to'plamda \(2^8 = 256\) elementlar mavjud. Agar matningizda faqat ASCII belgilar bo'lsa va unda \(n\) belgilar bo'lsa, u \(n\) baytdan foydalanadi. OK kabi kichik xabarda \(n = 2\) . Shunday qilib, u ASCII yoki UTF-8 sifatida saqlanganida 2 baytdan foydalanadi.

Yashirin belgilarni ko'rish

Ba'zi ASCII elementlari amal qiladi va chop etilmaydi. Bo'sh joy bo'sh chop etadi. Lekin LF va CR kursorni harakatga keltiradi. TAB sakrab o'tadi. Faylni maxsus muharrirda ochganimizda, u LF ni \n sifatida ko'rsatishi mumkin. Bu belgi ASCII ning o'zi emas. Bu muharrir sizga qator uzilishini ko'rsatadigan usul.

Haqiqiy his qiladigan oddiy misollar
Kuzatiladigan narsalar
Qanday qilib qurilmalar ASCII dan oddiy qadamlarda foydalanadi

Nomlarni chop etadigan yorliq ishlab chiqaruvchisini tasavvur qiling. U ismni belgilar sifatida o'qiydi. U har bir belgini ASCII raqamlariga aylantiradi. U ushbu raqamlarni xotirada saqlaydi. Har bir raqamni qanday chizish kerakligini qidirib, harflarni chop etadi. Agar u LF (10) ga to'g'ri kelsa, u ko'proq chop etishdan oldin keyingi qatorga o'tadi.

Bitta belgi kodini yozishning uchta usulini solishtirish

Qahramonga qarang! yana. Biz uning kodini uchta usulda yozishimiz mumkin. O'nlik: 33. Ikkilik: 00100001. O'n oltilik: 21. Matematik shaklda, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Har bir shakl bir xil qiymatga ega. Ilovalar kerakli shaklni tanlaydi. Odamlar ko'pincha kasrni o'qiydilar. Ikkilik kabi kompyuterlar. Hex - bu odamlar uchun ikkilik raqamlarni o'qishning qisqa usuli.

Nima uchun ASCII uzoq davom etdi

ASCII kichik va aniq. Bu erta qilingan. Unga ko'plab vositalar va protokollar qurilgan. Birinchi 128 ta Unicode kodlari ASCIIga mos kelganligi sababli, reja bugungi kunda ham ishlaydi. Shuning uchun siz yangi telefon yoki noutbukda juda eski matnli fayllarni ochishingiz va bir xil harflarni ko'rishingiz mumkin.

Mini o'tish: qisqa faylni o'qish

Salom matni bilan faylni oching. Baytlar ASCII raqamlari 72 101 108 108 111. Ikkilik tizimda ular 01001000 01100101 01101100 01101100 01101111. Ilova har bir raqamni oʻqiydi va ekranda H elloni chizadi. Agar keyingi raqam 10 bo'lsa, u ko'proq matn chizishdan oldin yangi qatorga o'tadi. Bu jarayon qanchalik sodda va barqaror.

Faqat ASCII uchun qachon tanlash kerak
Odamlar tez-tez foydalanadigan asosiy belgilar
Kichik raqamlar bilan bit g'oyalarini tezkor tekshirish

10 raqamini o'ylab ko'ring. Ikkilik tizimda, ya'ni 00001010. O'nli tizimda bu o'nta. ASCIIda 10 - LF, chiziq tasmasi. Bu bir xil raqamni turli yo'llar bilan qanday ko'rsatish mumkinligini ko'rsatadi. Ma'nosi raqamni qanday ishlatishimizdan kelib chiqadi. Agar bu belgilar kodi desak, 10 LF degan ma'noni anglatadi. Agar bu faqat olma hisobi desak, bu o'nta olma. Kontekst muhim.

Bularning barchasini yana bir misol bilan keltiramiz

Quyosh so'zini bir qurilmadan boshqa qurilmaga yuboramiz. Kodlar 'S' 83, 'u' 117, 'n' 110. Ikkilik tizimda 83 - 01010011, 117 - 01110101, 110 - 01101110. Bitlar Yoqish va O'chirish signallari sifatida harakatlanadi. Boshqa qurilma bitlarni yana raqamlarga aylantiradi. Keyin raqamlarni harflarga aylantiradi. U Quyosh so'zini ko'rsatadi. Agar keyingi kod 32 bo'lsa, bu bo'sh joy. Agar keyingi raqam 33 bo'lsa, bu "!". Qoidalar har safar bir xil bo'lib qoladi. Bu umumiy kodning kuchi.

Download Primer to continue