Google Play badge

ascii


ASCII: Компьютерууд үсэг, тэмдгийг хэрхэн хадгалдаг вэ?

Том санаа

Компьютер тоо ашигладаг. Хүмүүс үсэг, тэмдэгт ашигладаг. Бидэнд гүүр хэрэгтэй. ASCII бол тэр гүүр юм. ASCII үсэг, тэмдэг бүрийг тоо болгон хувиргадаг. Компьютер энэ дугаарыг хадгалдаг. Биднийг уншихад компьютер дахин захидал харуулдаг. Текст олон файл, програмд ​​ингэж ажилладаг.

Яагаад компьютерт код хэрэгтэй вэ?

Компьютер нь цахилгаанаар ажилладаг. Энэ нь хоёр төлөвийг хардаг. Асаах, унтраах. Бид эдгээр төлөвүүдийг бит гэж нэрлэдэг. Бит нь 0 эсвэл 1. Олон битүүд нийлээд том тоонуудыг үүсгэдэг. Найман бит нь байт болгодог. Битийн тусламжтайгаар бид тоолж чадна. Тооцооллын тусламжтайгаар бид зүйлийг нэрлэж болно. ASCII нь үсэг, тэмдгийг нэрлэхийн тулд тоолох аргыг ашигладаг.

Нэг бит хоёр сонголт хийдэг. Хоёр бит дөрвөн сонголт хийдэг. Математикийн хувьд энэ санааг \(\;2^n\) хэлбэрээр харуулдаг. \(n=7\) -ын хувьд бид \(2^7 = 128\) сонголтыг авна. \(n=8\) -ийн хувьд бид \(2^8 = 256\) сонголтыг авна. ASCII нь 7 бит ашигладаг. Энэ нь нэрлэсэн 128 зүйлийг өгдөг. Хүмүүс дараа нь 256 зүйлтэй 8 битийн багц хийсэн. Тэдгээрийг өргөтгөсөн ASCII гэж нэрлэдэг.

ASCII гэж юу гэсэн үг вэ?

ASCII нь мэдээлэл солилцох Америкийн стандарт код гэсэн үг юм. Энэ нь 1960-аад оноос эхэлсэн. Энэ нь анхны хэвлэгч, телетайп, компьютерт зориулагдсан байв. Энэ нь үсэг, тоо, зай, зарим тэмдэгт бүрт тоо өгдөг. Энэ нь мөн шинэ мөр гэх мэт үйлдэлд тусгай дугаар өгдөг. Эхний хувилбар нь 7 бит ашигласан тул 0-ээс 127 хүртэлх тоотой байв.

ASCII дотор юу байна
Газрын зургийн энгийн жишээ

Ямар нэг сайхан зүйлийг анзаараарай. Жижиг үсэг нь том үсгээсээ 32-оор их байна. Жишээлбэл, \(\;97 - 65 = 32\) . Тэгэхээр 'a' нь 'A'-аас 32-оор их байна. 'b' нь 'B'-ээс 32-оор их, гэх мэт. Энэ загвар нь зарим компьютерийн ажлыг хөнгөвчилдөг.

Энгийн үгээр тэмдэгтүүдийг удирдах

Та Enter товчийг дарахад таны компьютер системээс хамааран LF эсвэл CR эсвэл хоёуланг нь илгээж болно. Олон тооны интернет хэрэгслүүд LF ашигладаг. Зарим хуучин системүүд CR болон LF-ийг хамтад нь ашигладаг байсан.

Аравтын, хоёртын болон зургаан өнцөгт харагдац

Бид тоонуудыг янз бүрийн аргаар бичиж болно. Аравтын тоо нь 0-ээс 9 хүртэлх цифрүүдийг ашиглан тоолох ердийн арга юм. Хоёртын тоо нь зөвхөн 0 ба 1-ийг ашигладаг. Hex (hexadecimal) нь 0-ээс 9-ийг, A-аас F хүртэлх тоог ашигладаг.

Хоёртын тоо нь 'A'-г хэрхэн 65 болгодог вэ? 01000001 дэх битүүдийг хараарай. Хамгийн зүүн талын бит нь 128. Дараа нь 64, 32, 16, 8, 4, 2, 1. Зөвхөн 64 ба 1 нь асаалттай байна. Тэгэхээр \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .

Гараас дэлгэц хүртэл

Товчлуур дарна уу. Гар нь компьютерт код илгээдэг. Систем үүнийг тэмдэгтийн дугаар болгон хувиргадаг. Олон товчлуурын хувьд энэ тоо нь ASCII тоо юм. Уг програм нь тухайн дугаарыг санах ойд хадгалдаг. Энэ нь текстийг харуулах үед энэ нь дугаарыг хайж, үсгийг зурдаг. Хадгалах үед тоонууд файлд орно.

Текст сүлжээгээр хэрхэн дамждаг

Сайн байна уу гэсэн мессежийг бодоорой! . Үсгүүд нь H, i, болон !. Тэдний ASCII тоонууд нь 72, 105, 33. Хоёртын системд 01001000, 01101001, 00100001. Сүлжээ нь эдгээр битүүдийг илгээдэг. Нөгөө тал нь битүүдийг уншдаг. Энэ нь тоонуудыг хардаг. Энэ нь H, i, ба! дахин. Энгийн мессежүүд ингэж хөдөлдөг.

Өргөтгөсөн ASCII болон кодын хуудас

Хүмүүс илүү олон тэмдэгтийг хүсч байсан. Тэд é, ñ, ø гэх мэт үсэг авахыг хүссэн. Тэд € гэх мэт мөнгөний тэмдгийг авахыг хүссэн. 7 битийн багц нь зөвхөн 128 тэмдэгтэй байсан. Тиймээс хүмүүс 8 бит ашигласан. 8 биттэй бол бид \(2^8 = 256\) тэмдгийг авна. 128-аас 255 хүртэлх дээд тал нь нэмэлт үсэг, тэмдэгтүүдэд ашиглагддаг. Гэхдээ асуудал гарсан. Өөр өөр бүлгүүд эдгээр нэмэлт үсгүүдэд өөр өөр тоо сонгосон. Эдгээр сонголтыг кодын хуудас гэж нэрлэдэг.

Кодын хуудсууд өөр өөр байдаг тул ижил тоо нь өөр компьютер дээр өөр тэмдэг харуулж болно. Энэ хольцыг mojibake гэж нэрлэдэг. Энэ нь хачин дүрүүд шиг харагдаж байна. Энэ бол дэлхий Юникод руу шилжих нэг шалтгаан юм.

ASCII болон Юникод

Юникод бол олон хэл, математикийн тэмдэг, эможи харуулах боломжтой том стандарт юм. Энэ нь сая гаруй тэмдэгтийн зайтай. Юникод хадгалах олон арга бий. Нэг алдартай арга бол UTF-8 юм.

Текст хэдэн байт ашигладаг вэ

Зөвхөн ASCII тексттэй бол тэмдэгт бүр нэг байт ашигладаг. Тэгэхээр муур гэдэг үг 3 байт ашигладаг. Сайн уу ээж гэсэн хэллэг нь зайг оруулаад 6 тэмдэгттэй тул 6 байт ашигладаг. Энгийн математикийн хувьд \(\textrm{ASCII байт} = \textrm{тэмдэгтүүдийн тоо}\) .

ASCII ашиглан эрэмбэлэх

Компьютерууд ихэвчлэн тэмдэгтийн дугаараар тэмдэгтүүдийг ангилдаг. ASCII захиалга юмсыг тодорхой байдлаар бүлэглэдэг.

Энэ нь энгийн ASCII утгыг харьцуулж үзвэл Zoo алимны өмнө ирдэг гэсэн үг юм. Үгийн дуугаралтаар бус тоогоор нь ангилдаг.

Мэдэх нийтлэг ASCII кодууд

Амперсанд & гэдгийг анхаарна уу. Түүний ASCII тоо нь 38. нэмэх тэмдэг + нь 43. Хасах тэмдэг нь 45.

Өдөр тутмын технологийн бодит хэрэглээ
Туслах ASCII загварууд
ASCII ашиглан хэрхэн зураг хийх боломжтой

Хүмүүс зөвхөн дүрийг ашиглан зураг хийдэг. Үүнийг ASCII урлаг гэж нэрлэдэг. Энд ASCII тэмдэгтүүдээр хийсэн бяцхан царай байна.

:-) Энгийн инээмсэглэл
(^_^) Найрсаг царай
o_O гайхсан

Нүүр бүр нь хоёр цэг, зураас, хаалт зэрэг зүгээр л тэмдэгтүүд юм. Өнгө, хэлбэр байхгүй. Зүгээр л бичнэ үү.

Товчхондоо, энгийн үгээр бол түүх

ASCII нь телетайп болон анхны компьютеруудаас үүссэн. 1963 онд анхны хувилбар дээр тохиролцсон. Энэ нь олон янзын машинууд хоорондоо ярихад тусалсан. Нэг хуваалцсан кодтой бол А шиг үсэг нь хаа сайгүй ижил тоог илэрхийлдэг. Энэ нь мессеж илгээх, текст хэвлэхэд хялбар болгосон.

ASCII хангалтгүй үед

ASCII нь ердөө 128 зүйлтэй. Энэ нь бүх хэлэнд хангалттай биш юм. Энэ нь хятад, хинди, араб болон бусад олон бичвэрийг харуулах боломжгүй. Энэ нь эможи харуулах боломжгүй. Энэ нь математик, хөгжмийн олон тэмдэгтийг харуулах боломжгүй юм. Эдгээрийн хувьд бид Юникод ашигладаг. Юникод нь олон скрипт, тэмдэгтүүдийг харуулах боломжтой. UTF-8 бол тэдгээрийг хадгалах арга юм. Сайн мэдээ гэвэл бүх ASCII текст UTF-8 дотор ажилладаг. Тиймээс орчин үеийн системүүд хуучин ASCII-г хялбархан уншиж чаддаг.

Өнөөдөр програмууд ASCII-ийг хэрхэн зохицуулдаг

Ихэнх програмууд UTF-8 гэж хүлээж байдаг. Гэхдээ файл нь зөвхөн ASCII үсэг, тэмдэгтүүдтэй бол UTF-8-д адилхан харагдана. Программистууд үүнд дуртай байдаг, учир нь энэ нь бүх зүйлийг энгийн байлгадаг. Вэб хуудас, API болон олон хэрэгслүүд UTF-8-г ашигладаг бөгөөд үүнд ASCII өөрчлөлт оруулалгүй ордог.

Цөөн тооны баримт, нөхөрсөг математик

ASCII нь 7 битийн багц юм. Энэ нь \(2^7 = 128\) хүртэл өөр тэмдэгт гэсэн үг. 8 бит бүхий өргөтгөсөн багц нь \(2^8 = 256\) зүйлтэй. Хэрэв таны текст зөвхөн ASCII тэмдэгттэй бөгөөд \(n\) тэмдэгттэй бол \(n\) байт ашигладаг. OK гэх мэт жижиг зурваст \(n = 2\) . Тиймээс ASCII эсвэл UTF-8 хэлбэрээр хадгалахдаа 2 байт ашигладаг.

Нуугдсан дүрүүдийг харах

Зарим ASCII зүйлүүд үйлдэл хийдэг бөгөөд хэвлэдэггүй. Зай хоосон хэвлэнэ. Гэхдээ LF болон CR нь курсорыг хөдөлгөдөг. TAB үсрэлт. Бид файлыг тусгай засварлагчаар нээх үед энэ нь LF-г \n хэлбэрээр харуулж болно. Энэ тэмдэг нь ASCII-ийн нэг хэсэг биш юм. Энэ нь редактор танд мөр таслахыг харуулах арга юм.

Бодит мэдрэмж төрүүлдэг энгийн жишээнүүд
Анхаарах зүйлс
Төхөөрөмжүүд ASCII-ийг энгийн алхамаар хэрхэн ашигладаг

Нэрс хэвлэдэг шошго үйлдвэрлэгчийг төсөөлөөд үз дээ. Энэ нь нэрийг тэмдэгт болгон уншдаг. Энэ нь тэмдэгт бүрийг ASCII тоо болгон хувиргадаг. Энэ нь эдгээр тоонуудыг санах ойд хадгалдаг. Энэ нь тоо бүрийг хэрхэн зурах талаар хайж олох замаар үсгүүдийг хэвлэдэг. Хэрэв энэ нь LF (10) -тай тохирч байвал илүү ихийг хэвлэхийн өмнө дараагийн мөрөнд шилжинэ.

Нэг тэмдэгтийн код бичих гурван аргыг харьцуулах

'!' гэсэн дүрийг хараарай. дахин. Бид түүний кодыг гурван аргаар бичиж болно. Аравтын тоо: 33. Хоёртын тоо: 00100001. Hex: 21. Математик хэлбэрээр \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Маягт бүр ижил утгатай байна. Аппликешн нь өөрт хэрэгтэй маягтыг сонгоно. Хүмүүс ихэвчлэн аравтын бутархай уншдаг. Хоёртын файлд дуртай компьютерууд. Hex бол хүмүүст хоёртын тоог унших богино арга юм.

Яагаад ASCII ийм удаан үргэлжилсэн бэ?

ASCII нь жижиг бөгөөд ойлгомжтой. Энэ нь эрт хийгдсэн. Үүн дээр олон арга хэрэгсэл, протоколууд баригдсан. Эхний 128 Юникод код нь ASCII-тэй таарч байгаа тул төлөвлөгөө өнөөдрийг хүртэл ажилласаар байна. Тиймээс та шинэ утас эсвэл зөөврийн компьютер дээр маш хуучин текст файлуудыг нээж, ижил үсгүүдийг харах боломжтой.

Бяцхан алхалт: богино файл унших

Сайн байна уу гэсэн тексттэй файлыг нээнэ үү. Байтууд нь ASCII тоонууд 72 101 108 108 111. Хоёртын системд эдгээр нь 01001000 01100101 01101100 01101100 01101111. Апп нь тоо бүрийг уншиж, дэлгэцэн дээр H ello гэж зурдаг. Дараагийн тоо нь 10 байвал илүү текст зурахаас өмнө шинэ мөрөнд шилжинэ. Энэ бол үйл явц нь маш энгийн бөгөөд тогтвортой юм.

Зөвхөн ASCII-г хэзээ сонгох вэ
Хүмүүсийн ихэвчлэн ашигладаг гол тэмдэг
Жижиг тоогоор битийн санаануудыг хурдан шалгах

10-ын тоог бодоорой. Хоёртын системд 00001010. Аравтын тоогоор арав байна. ASCII дээр 10 нь LF, шугамын тэжээл юм. Энэ нь ижил тоог хэрхэн янз бүрээр харуулахыг харуулж байна. Утга нь бид тоог хэрхэн ашиглаж байгаагаас үүдэлтэй. Хэрэв бид үүнийг тэмдэгтийн код гэж хэлбэл 10 нь LF гэсэн үг юм. Хэрэв бид зүгээр л алимны тоо гэж хэлбэл арван алим болно. Контекст чухал.

Энэ бүгдийг нэг жишээгээр нэгтгэж өгье

Бид нар гэдэг үгийг нэг төхөөрөмжөөс нөгөө төхөөрөмж рүү илгээх болно. Кодууд нь 'S' 83, 'u' 117, 'n' 110. Хоёртын системд 83 нь 01010011, 117 нь 01110101, 110 нь 01101110. Битүүд нь On болон Off дохиогоор дамждаг. Нөгөө төхөөрөмж нь битүүдийг дахин тоо болгон хувиргадаг. Дараа нь тоонуудыг үсэг болгон хувиргадаг. Энэ нь Нар гэдэг үгийг харуулж байна. Хэрэв дараагийн код нь 32 бол хоосон зай болно. Хэрэв дараагийнх нь 33 бол '!' болно. Тэр болгонд дүрэм ижил хэвээр байна. Энэ бол хуваалцсан кодын хүч юм.

Download Primer to continue