Kompüterlər nömrələrdən istifadə edirlər. İnsanlar hərflərdən və simvollardan istifadə edirlər. Bizə körpü lazımdır. ASCII həmin körpüdür. ASCII hər hərfi və ya simvolu rəqəmə çevirir. Kompüter nömrəni saxlayır. Biz oxuyanda kompüter yenə məktubu göstərir. Mətn bir çox fayl və proqramda belə işləyir.
Kompüter elektriklə işləyir. İki dövlət görür. Yandır və Söndür. Biz bu vəziyyətləri bit adlandırırıq. Bit 0 və ya 1-dir. Bir çox bit birlikdə daha böyük ədədlər yaradır. Səkkiz bit bir bayt təşkil edir. Bitlərlə saya bilərik. Saymaqla, biz şeyləri adlandıra bilərik. ASCII hərfləri və simvolları adlandırmaq üçün hesablamadan istifadə edir.
Bir bit iki seçim edir. İki bit dörd seçim edir. Riyaziyyatda bu fikir \(\;2^n\) kimi göstərilir. \(n=7\) üçün \(2^7 = 128\) seçim alırıq. \(n=8\) üçün \(2^8 = 256\) seçim alırıq. ASCII 7 bit istifadə edir. Bu, 128 adlandırılmış element verir. İnsanlar daha sonra 256 elementdən ibarət 8 bitlik dəstlər yaratdılar. Bunlara uzadılmış ASCII deyilir.
ASCII, Məlumat Mübadiləsi üçün Amerika Standart Kodunu ifadə edir. 1960-cı illərdə başlamışdır. İlkin printerlər, teletayplar və kompüterlər üçün hazırlanmışdır. O, hər hərf, rəqəm, boşluq və bəzi simvollara bir nömrə verir. O, həmçinin yeni xətt kimi hərəkətlərə xüsusi nömrələr verir. Birinci versiya 7 bitdən istifadə edirdi, ona görə də 0-dan 127-yə qədər rəqəmlər var idi.
Səliqəli bir şeyə diqqət yetirin. Kiçik hərflər böyük hərflərdən 32 ədəd çoxdur. Məsələn, \(\;97 - 65 = 32\) . Beləliklə, 'a' 'A'dan 32 çoxdur. 'b' 'B'dən 32 çoxdur və s. Bu nümunə bəzi kompüter tapşırıqlarını asanlaşdırır.
Enter düyməsini basdığınız zaman kompüteriniz sistemdən asılı olaraq LF və ya CR və ya hər ikisini göndərə bilər. Bir çox internet alətləri LF-dən istifadə edir. Bəzi köhnə sistemlər CR və LF-dən birlikdə istifadə edirdilər.
Rəqəmləri müxtəlif yollarla yaza bilərik. Ondalıq 0-dan 9-a qədər rəqəmlərdən istifadə edərək saydığımız normal üsuldur. Binary yalnız 0 və 1-dən istifadə edir. Hex (onaltılıq) 0-dan 9-a və A-dan F-ə qədər istifadə edir.
İkilik 'A' üçün 65-i necə edir? 01000001-dəki bitlərə baxın. Ən soldakı bit 128 üçündür. Sonra 64, 32, 16, 8, 4, 2, 1. Yalnız 64 və 1 aktivdir. Beləliklə, \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .
Bir düyməni basın. Klaviatura kompüterə kod göndərir. Sistem onu simvol nömrəsinə çevirir. Bir çox düymələr üçün bu nömrə ASCII nömrəsidir. Proqram nömrəni yaddaşda saxlayır. Mətni göstərəndə nömrəyə baxır və hərfi çəkir. Yadda saxladığınız zaman nömrələr fayla daxil olur.
Salam mesajını düşünün! . Hərflər H, i və !. Onların ASCII nömrələri 72, 105 və 33-dür. Binar sistemdə onlar 01001000, 01101001 və 00100001-dir. Şəbəkə bu bitləri göndərir. Qarşı tərəf bitləri oxuyur. Rəqəmləri görür. H, i və ! yenə. Sadə mətn mesajları belə hərəkət edir.
İnsanlar daha çox simvol istəyirdilər. Onlar é, ñ və ø kimi hərflər istəyirdilər. € kimi pul nişanları istədilər. 7 bitlik dəstdə cəmi 128 simvol var idi. Beləliklə, insanlar 8 bit istifadə etdilər. 8 bit ilə \(2^8 = 256\) simvolları alırıq. Üst yarısı, 128-dən 255-ə qədər, əlavə hərflər və simvollar üçün istifadə edilmişdir. Amma problem var idi. Fərqli qruplar bu əlavə hərflər üçün fərqli nömrələr seçdilər. Bu seçimlərə kod səhifələri deyilir.
Kod səhifələri fərqli olduğundan, eyni nömrə başqa bir kompüterdə fərqli simvol göstərə bilər. Bu qarışıqlığa mojibake deyilir. Qəribə personajlara bənzəyir. Dünyanın Unicode-a keçməsinin bir səbəbi də budur.
Unicode bir çox dilləri, riyazi simvolları və emojiləri göstərə bilən böyük standartdır. Bir milyondan çox simvol üçün yer var. Unicode saxlamağın bir çox yolu var. Məşhur yollardan biri UTF-8- dir.
Yalnız ASCII mətni ilə hər simvol bir baytdan istifadə edir. Beləliklə, pişik sözü 3 baytdan istifadə edir. Salam ana ifadəsi boşluq daxil olmaqla 6 simvoldan ibarətdir, ona görə də 6 bayt istifadə edir. Sadə riyaziyyatda \(\textrm{ASCII baytları} = \textrm{simvolların sayı}\) .
Kompüterlər çox vaxt sətirləri simvol nömrələrinə görə çeşidləyirlər. ASCII sifarişi şeyləri müəyyən bir şəkildə qruplaşdırır.
Bu o deməkdir ki, sadə ASCII dəyərlərini müqayisə etsək Zoo almadan əvvəl gəlir. Sıralama sözlərin səslənməsinə görə deyil, rəqəmlərə görədir.
Diqqət yetirin ki, ampersand &. Onun ASCII nömrəsi 38-dir. Artı işarəsi + 43-dür. Mənfi işarəsi - 45-dir.
İnsanlar yalnız simvollardan istifadə edərək şəkillər çəkirlər. Buna ASCII sənəti deyilir. Budur ASCII simvolları ilə hazırlanmış kiçik bir üz.
:-) Sadə təbəssüm
(^_^) Dost üz
o_O təəccübləndim
Hər bir üz iki nöqtə, tire və mötərizə kimi simvollardan ibarətdir. Rəng və ya forma yoxdur. Sadəcə mətn.
ASCII teletayplardan və ilk kompüterlərdən yaranmışdır. 1963-cü ildə ilk versiya razılaşdırıldı. Bu, bir çox müxtəlif maşınların bir-biri ilə danışmasına kömək etdi. Bir paylaşılan kodla A kimi hərf hər yerdə eyni nömrə demək idi. Bu, mesaj göndərməyi və mətni çap etməyi asanlaşdırdı.
ASCII-də cəmi 128 element var. Bütün dillər üçün bu kifayət deyil. Çin, hindi, ərəb və ya bir çox başqa yazıları göstərə bilməz. Emoji göstərə bilməz. O, həmçinin bir çox riyaziyyat və musiqi simvollarını göstərə bilməz. Bunun üçün biz Unicode istifadə edirik. Unicode bir çox skript və simvol göstərə bilər. UTF-8 onları saxlamaq üçün bir yoldur. Yaxşı xəbər odur ki, bütün ASCII mətnləri UTF-8 daxilində işləyir. Beləliklə, müasir sistemlər köhnə ASCII-ni asanlıqla oxuya bilir.
Əksər proqramlar UTF-8-i gözləyir. Ancaq faylda yalnız ASCII hərfləri və simvolları olduqda, UTF-8 altında eyni görünür. Proqramçılar bunu bəyənirlər, çünki o, hər şeyi sadələşdirir. Veb səhifələr, API-lər və bir çox alətlər ASCII-nin daxil olduğu UTF-8-dən heç bir dəyişiklik olmadan istifadə edir.
ASCII 7 bitlik dəstdir. Bu \(2^7 = 128\) qədər müxtəlif simvol deməkdir. 8 bitli genişləndirilmiş dəstdə \(2^8 = 256\) element var. Əgər mətninizdə yalnız ASCII simvolları varsa və \(n\) simvolları varsa, o zaman \(n\) baytlardan istifadə edir. OK kimi kiçik bir mesajda \(n = 2\) . Beləliklə, ASCII və ya UTF-8 kimi saxlandıqda 2 bayt istifadə edir.
Bəzi ASCII elementləri fəaliyyət göstərir və çap etmir. Boşluq boş çap edir. Lakin LF və CR kursoru hərəkət etdirir. TAB tullanır. Faylı xüsusi redaktorda açdığımız zaman o, LF-ni \n kimi göstərə bilər. Bu simvol ASCII-nin özünün bir hissəsi deyil. Bu, redaktorun sizə sətir fasiləsini göstərdiyi bir üsuldur.
Adları çap edən etiket istehsalçısını təsəvvür edin. O, adı simvol kimi oxuyur. Hər simvolu ASCII nömrələrinə çevirir. Həmin nömrələri yaddaşda saxlayır. O, hər bir nömrənin necə çəkiləcəyini axtararaq hərfləri çap edir. LF (10) ilə uyğun gəlirsə, daha çox çap etməzdən əvvəl növbəti sətirə keçir.
Xarakterə baxın '!' yenə. Onun kodunu üç şəkildə yaza bilərik. Onluq: 33. İkilik: 00100001. Hex: 21. Riyaziyyat şəklində, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Hər forma eyni dəyərdir. Proqramlar lazım olan formanı seçirlər. İnsanlar tez-tez onluq oxuyurlar. Binar kimi kompüterlər. Hex insanların ikili ədədləri oxuması üçün qısa bir yoldur.
ASCII kiçik və aydındır. Erkən hazırlanmışdır. Onun üzərində çoxlu alətlər və protokollar quruldu. İlk 128 Unicode kodu ASCII-yə uyğun gəldiyi üçün plan bu gün də işləyir. Buna görə çox köhnə mətn fayllarını yeni telefonda və ya noutbukda aça və eyni hərfləri görə bilərsiniz.
Salam mətni olan faylı açın. Baytlar ASCII rəqəmləridir 72 101 108 108 111. Binar sistemdə bunlar 01001000 01100101 01101100 01101100 01101111-dir. Proqram hər nömrəni oxuyur və ekranda Hello çəkir. Növbəti nömrə 10 olarsa, daha çox mətn çəkməzdən əvvəl yeni sətirə keçir. Bu proses nə qədər sadə və davamlıdır.
10 rəqəmini düşünün. İkilik sistemdə, yəni 00001010. Onluq sistemdə ondur. ASCII-də 10 LF, xətt axınıdır. Bu, eyni nömrənin müxtəlif yollarla necə göstərilə biləcəyini göstərir. Məna rəqəmdən necə istifadə etdiyimizdən gəlir. Əgər simvol kodudur desək, 10 LF deməkdir. Sadəcə alma sayıdır desək, on almadır. Kontekst məsələləri.
Günəş sözünü bir cihazdan digərinə göndərəcəyik. Kodlar 'S' 83, 'u' 117, 'n' 110. Binar sistemdə 83 01010011, 117 01110101, 110 01101110. Bitlər On və Off siqnalları kimi hərəkət edir. Digər cihaz bitləri yenidən rəqəmlərə çevirir. Sonra rəqəmləri hərflərə çevirir. Günəş sözünü göstərir. Növbəti kod 32-dirsə, bu boşluqdur. Növbəti 33-dürsə, bu '!' deməkdir. Qaydalar hər dəfə eyni qalır. Bu, paylaşılan kodun gücüdür.