Google Play badge

ascii


ASCII: Kompüterlər hərfləri və simvolları necə saxlayır

Böyük fikir

Kompüterlər nömrələrdən istifadə edirlər. İnsanlar hərflərdən və simvollardan istifadə edirlər. Bizə körpü lazımdır. ASCII həmin körpüdür. ASCII hər hərfi və ya simvolu rəqəmə çevirir. Kompüter nömrəni saxlayır. Biz oxuyanda kompüter yenə məktubu göstərir. Mətn bir çox fayl və proqramda belə işləyir.

Niyə kompüterlərə kod lazımdır

Kompüter elektriklə işləyir. İki dövlət görür. Yandır və Söndür. Biz bu vəziyyətləri bit adlandırırıq. Bit 0 və ya 1-dir. Bir çox bit birlikdə daha böyük ədədlər yaradır. Səkkiz bit bir bayt təşkil edir. Bitlərlə saya bilərik. Saymaqla, biz şeyləri adlandıra bilərik. ASCII hərfləri və simvolları adlandırmaq üçün hesablamadan istifadə edir.

Bir bit iki seçim edir. İki bit dörd seçim edir. Riyaziyyatda bu fikir \(\;2^n\) kimi göstərilir. \(n=7\) üçün \(2^7 = 128\) seçim alırıq. \(n=8\) üçün \(2^8 = 256\) seçim alırıq. ASCII 7 bit istifadə edir. Bu, 128 adlandırılmış element verir. İnsanlar daha sonra 256 elementdən ibarət 8 bitlik dəstlər yaratdılar. Bunlara uzadılmış ASCII deyilir.

ASCII nə deməkdir

ASCII, Məlumat Mübadiləsi üçün Amerika Standart Kodunu ifadə edir. 1960-cı illərdə başlamışdır. İlkin printerlər, teletayplar və kompüterlər üçün hazırlanmışdır. O, hər hərf, rəqəm, boşluq və bəzi simvollara bir nömrə verir. O, həmçinin yeni xətt kimi hərəkətlərə xüsusi nömrələr verir. Birinci versiya 7 bitdən istifadə edirdi, ona görə də 0-dan 127-yə qədər rəqəmlər var idi.

ASCII daxilində nə var
Sadə xəritə nümunələri

Səliqəli bir şeyə diqqət yetirin. Kiçik hərflər böyük hərflərdən 32 ədəd çoxdur. Məsələn, \(\;97 - 65 = 32\) . Beləliklə, 'a' 'A'dan 32 çoxdur. 'b' 'B'dən 32 çoxdur və s. Bu nümunə bəzi kompüter tapşırıqlarını asanlaşdırır.

Simvolları sadə sözlərlə idarə edin

Enter düyməsini basdığınız zaman kompüteriniz sistemdən asılı olaraq LF və ya CR və ya hər ikisini göndərə bilər. Bir çox internet alətləri LF-dən istifadə edir. Bəzi köhnə sistemlər CR və LF-dən birlikdə istifadə edirdilər.

Onluq, ikilik və onaltılıq görünüşlər

Rəqəmləri müxtəlif yollarla yaza bilərik. Ondalıq 0-dan 9-a qədər rəqəmlərdən istifadə edərək saydığımız normal üsuldur. Binary yalnız 0 və 1-dən istifadə edir. Hex (onaltılıq) 0-dan 9-a və A-dan F-ə qədər istifadə edir.

İkilik 'A' üçün 65-i necə edir? 01000001-dəki bitlərə baxın. Ən soldakı bit 128 üçündür. Sonra 64, 32, 16, 8, 4, 2, 1. Yalnız 64 və 1 aktivdir. Beləliklə, \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .

Klaviaturadan ekrana

Bir düyməni basın. Klaviatura kompüterə kod göndərir. Sistem onu ​​simvol nömrəsinə çevirir. Bir çox düymələr üçün bu nömrə ASCII nömrəsidir. Proqram nömrəni yaddaşda saxlayır. Mətni göstərəndə nömrəyə baxır və hərfi çəkir. Yadda saxladığınız zaman nömrələr fayla daxil olur.

Mətn şəbəkədə necə yayılır

Salam mesajını düşünün! . Hərflər H, i və !. Onların ASCII nömrələri 72, 105 və 33-dür. Binar sistemdə onlar 01001000, 01101001 və 00100001-dir. Şəbəkə bu bitləri göndərir. Qarşı tərəf bitləri oxuyur. Rəqəmləri görür. H, i və ! yenə. Sadə mətn mesajları belə hərəkət edir.

Genişləndirilmiş ASCII və kod səhifələri

İnsanlar daha çox simvol istəyirdilər. Onlar é, ñ və ø kimi hərflər istəyirdilər. € kimi pul nişanları istədilər. 7 bitlik dəstdə cəmi 128 simvol var idi. Beləliklə, insanlar 8 bit istifadə etdilər. 8 bit ilə \(2^8 = 256\) simvolları alırıq. Üst yarısı, 128-dən 255-ə qədər, əlavə hərflər və simvollar üçün istifadə edilmişdir. Amma problem var idi. Fərqli qruplar bu əlavə hərflər üçün fərqli nömrələr seçdilər. Bu seçimlərə kod səhifələri deyilir.

Kod səhifələri fərqli olduğundan, eyni nömrə başqa bir kompüterdə fərqli simvol göstərə bilər. Bu qarışıqlığa mojibake deyilir. Qəribə personajlara bənzəyir. Dünyanın Unicode-a keçməsinin bir səbəbi də budur.

ASCII və Unicode

Unicode bir çox dilləri, riyazi simvolları və emojiləri göstərə bilən böyük standartdır. Bir milyondan çox simvol üçün yer var. Unicode saxlamağın bir çox yolu var. Məşhur yollardan biri UTF-8- dir.

Mətn neçə baytdan istifadə edir

Yalnız ASCII mətni ilə hər simvol bir baytdan istifadə edir. Beləliklə, pişik sözü 3 baytdan istifadə edir. Salam ana ifadəsi boşluq daxil olmaqla 6 simvoldan ibarətdir, ona görə də 6 bayt istifadə edir. Sadə riyaziyyatda \(\textrm{ASCII baytları} = \textrm{simvolların sayı}\) .

ASCII ilə çeşidləmə sırası

Kompüterlər çox vaxt sətirləri simvol nömrələrinə görə çeşidləyirlər. ASCII sifarişi şeyləri müəyyən bir şəkildə qruplaşdırır.

Bu o deməkdir ki, sadə ASCII dəyərlərini müqayisə etsək Zoo almadan əvvəl gəlir. Sıralama sözlərin səslənməsinə görə deyil, rəqəmlərə görədir.

Bilmək üçün ümumi ASCII kodları

Diqqət yetirin ki, ampersand &. Onun ASCII nömrəsi 38-dir. Artı işarəsi + 43-dür. Mənfi işarəsi - 45-dir.

Gündəlik texnologiyada real istifadələr
Kömək edən ASCII nümunələri
ASCII ilə necə şəkillər çəkmək olar

İnsanlar yalnız simvollardan istifadə edərək şəkillər çəkirlər. Buna ASCII sənəti deyilir. Budur ASCII simvolları ilə hazırlanmış kiçik bir üz.

:-) Sadə təbəssüm
(^_^) Dost üz
o_O təəccübləndim

Hər bir üz iki nöqtə, tire və mötərizə kimi simvollardan ibarətdir. Rəng və ya forma yoxdur. Sadəcə mətn.

Qısaca, sadə sözlə tarix

ASCII teletayplardan və ilk kompüterlərdən yaranmışdır. 1963-cü ildə ilk versiya razılaşdırıldı. Bu, bir çox müxtəlif maşınların bir-biri ilə danışmasına kömək etdi. Bir paylaşılan kodla A kimi hərf hər yerdə eyni nömrə demək idi. Bu, mesaj göndərməyi və mətni çap etməyi asanlaşdırdı.

ASCII kifayət etmədikdə

ASCII-də cəmi 128 element var. Bütün dillər üçün bu kifayət deyil. Çin, hindi, ərəb və ya bir çox başqa yazıları göstərə bilməz. Emoji göstərə bilməz. O, həmçinin bir çox riyaziyyat və musiqi simvollarını göstərə bilməz. Bunun üçün biz Unicode istifadə edirik. Unicode bir çox skript və simvol göstərə bilər. UTF-8 onları saxlamaq üçün bir yoldur. Yaxşı xəbər odur ki, bütün ASCII mətnləri UTF-8 daxilində işləyir. Beləliklə, müasir sistemlər köhnə ASCII-ni asanlıqla oxuya bilir.

Bu gün tətbiqlər ASCII-ni necə idarə edir

Əksər proqramlar UTF-8-i gözləyir. Ancaq faylda yalnız ASCII hərfləri və simvolları olduqda, UTF-8 altında eyni görünür. Proqramçılar bunu bəyənirlər, çünki o, hər şeyi sadələşdirir. Veb səhifələr, API-lər və bir çox alətlər ASCII-nin daxil olduğu UTF-8-dən heç bir dəyişiklik olmadan istifadə edir.

Kiçik sayda faktlar və dostluq riyaziyyatı

ASCII 7 bitlik dəstdir. Bu \(2^7 = 128\) qədər müxtəlif simvol deməkdir. 8 bitli genişləndirilmiş dəstdə \(2^8 = 256\) element var. Əgər mətninizdə yalnız ASCII simvolları varsa və \(n\) simvolları varsa, o zaman \(n\) baytlardan istifadə edir. OK kimi kiçik bir mesajda \(n = 2\) . Beləliklə, ASCII və ya UTF-8 kimi saxlandıqda 2 bayt istifadə edir.

Gizli personajları görmək

Bəzi ASCII elementləri fəaliyyət göstərir və çap etmir. Boşluq boş çap edir. Lakin LF və CR kursoru hərəkət etdirir. TAB tullanır. Faylı xüsusi redaktorda açdığımız zaman o, LF-ni \n kimi göstərə bilər. Bu simvol ASCII-nin özünün bir hissəsi deyil. Bu, redaktorun sizə sətir fasiləsini göstərdiyi bir üsuldur.

Həqiqi hiss edən sadə nümunələr
Diqqət edilməli şeylər
Cihazların sadə addımlarla ASCII-dən necə istifadə etməsi

Adları çap edən etiket istehsalçısını təsəvvür edin. O, adı simvol kimi oxuyur. Hər simvolu ASCII nömrələrinə çevirir. Həmin nömrələri yaddaşda saxlayır. O, hər bir nömrənin necə çəkiləcəyini axtararaq hərfləri çap edir. LF (10) ilə uyğun gəlirsə, daha çox çap etməzdən əvvəl növbəti sətirə keçir.

Bir simvolun kodunu yazmağın üç yolunun müqayisəsi

Xarakterə baxın '!' yenə. Onun kodunu üç şəkildə yaza bilərik. Onluq: 33. İkilik: 00100001. Hex: 21. Riyaziyyat şəklində, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Hər forma eyni dəyərdir. Proqramlar lazım olan formanı seçirlər. İnsanlar tez-tez onluq oxuyurlar. Binar kimi kompüterlər. Hex insanların ikili ədədləri oxuması üçün qısa bir yoldur.

ASCII niyə bu qədər uzun sürdü

ASCII kiçik və aydındır. Erkən hazırlanmışdır. Onun üzərində çoxlu alətlər və protokollar quruldu. İlk 128 Unicode kodu ASCII-yə uyğun gəldiyi üçün plan bu gün də işləyir. Buna görə çox köhnə mətn fayllarını yeni telefonda və ya noutbukda aça və eyni hərfləri görə bilərsiniz.

Mini gəzinti: qısa faylı oxumaq

Salam mətni olan faylı açın. Baytlar ASCII rəqəmləridir 72 101 108 108 111. Binar sistemdə bunlar 01001000 01100101 01101100 01101100 01101111-dir. Proqram hər nömrəni oxuyur və ekranda Hello çəkir. Növbəti nömrə 10 olarsa, daha çox mətn çəkməzdən əvvəl yeni sətirə keçir. Bu proses nə qədər sadə və davamlıdır.

Yalnız ASCII üçün nə vaxt seçilməlidir
İnsanların tez-tez istifadə etdiyi əsas simvollar
Kiçik nömrələrlə bit ideyalarının sürətli yoxlanılması

10 rəqəmini düşünün. İkilik sistemdə, yəni 00001010. Onluq sistemdə ondur. ASCII-də 10 LF, xətt axınıdır. Bu, eyni nömrənin müxtəlif yollarla necə göstərilə biləcəyini göstərir. Məna rəqəmdən necə istifadə etdiyimizdən gəlir. Əgər simvol kodudur desək, 10 LF deməkdir. Sadəcə alma sayıdır desək, on almadır. Kontekst məsələləri.

Bütün bunları daha bir misalla bir araya gətirək

Günəş sözünü bir cihazdan digərinə göndərəcəyik. Kodlar 'S' 83, 'u' 117, 'n' 110. Binar sistemdə 83 01010011, 117 01110101, 110 01101110. Bitlər On və Off siqnalları kimi hərəkət edir. Digər cihaz bitləri yenidən rəqəmlərə çevirir. Sonra rəqəmləri hərflərə çevirir. Günəş sözünü göstərir. Növbəti kod 32-dirsə, bu boşluqdur. Növbəti 33-dürsə, bu '!' deməkdir. Qaydalar hər dəfə eyni qalır. Bu, paylaşılan kodun gücüdür.

Download Primer to continue