Primer lesson: เอสกี

ASCII: คอมพิวเตอร์จัดเก็บตัวอักษรและสัญลักษณ์อย่างไร

ความคิดที่ยิ่งใหญ่

คอมพิวเตอร์ใช้ตัวเลข มนุษย์ใช้ตัวอักษรและสัญลักษณ์ เราต้องการสะพานเชื่อม ASCII ก็คือสะพานเชื่อมนั้น ASCII เปลี่ยนตัวอักษรหรือสัญลักษณ์แต่ละตัวให้เป็นตัวเลข คอมพิวเตอร์จะเก็บตัวเลขไว้ เมื่อเราอ่าน คอมพิวเตอร์จะแสดงตัวอักษรนั้นอีกครั้ง นี่คือวิธีที่ข้อความทำงานในหลายไฟล์และแอปพลิเคชัน

ทำไมคอมพิวเตอร์จึงต้องการโค้ด

คอมพิวเตอร์ทำงานด้วยไฟฟ้า โดยมองเห็นสองสถานะ คือ เปิด และ ปิด เราเรียกสถานะเหล่านี้ว่า บิต บิตคือ 0 หรือ 1 เมื่อนำบิตจำนวนมากมารวมกันจะได้ตัวเลขที่ใหญ่ขึ้น แปดบิตจะรวมกันเป็นหนึ่ง ไบต์ ด้วยบิต เราสามารถนับได้ ด้วยการนับ เราสามารถตั้งชื่อสิ่งต่างๆ ได้ ASCII ใช้การนับเพื่อตั้งชื่อตัวอักษรและสัญลักษณ์

หนึ่งบิตทำให้มีสองตัวเลือก สองบิตทำให้มีสี่ตัวเลือก ในทางคณิตศาสตร์ แนวคิดนี้แสดงเป็น \(\;2^n\) สำหรับ \(n=7\) เราจะได้ \(2^7 = 128\) ตัวเลือก สำหรับ \(n=8\) เราจะได้ \(2^8 = 256\) ตัวเลือก ASCII ใช้ 7 บิต ซึ่งทำให้ได้รายการที่มีชื่อ 128 รายการ ต่อมาผู้คนได้สร้างชุด 8 บิตที่มี 256 รายการ ซึ่งเรียกว่า ASCII แบบขยาย

ASCII หมายถึงอะไร

ASCII ย่อมาจาก American Standard Code for Information Interchange (รหัสมาตรฐานอเมริกันสำหรับการแลกเปลี่ยนข้อมูล ) เริ่มต้นขึ้นในช่วงทศวรรษ 1960 สร้างขึ้นสำหรับเครื่องพิมพ์ โทรพิมพ์ และคอมพิวเตอร์ในยุคแรกๆ โดยกำหนดตัวเลขให้กับตัวอักษร ตัวเลข ช่องว่าง และสัญลักษณ์บางชนิด นอกจากนี้ยังกำหนดหมายเลขพิเศษให้กับการกระทำต่างๆ เช่น การขึ้นบรรทัดใหม่ เวอร์ชันแรกใช้ 7 บิต ดังนั้นจึงมีตัวเลขตั้งแต่ 0 ถึง 127

ภายใน ASCII มีอะไรอยู่

ตัวอักษรพิมพ์ใหญ่ : A ถึง Z ใช้ตัวเลข 65 ถึง 90
ตัวอักษรพิมพ์เล็ก : a ถึง z ใช้ตัวเลข 97 ถึง 122
ตัวเลข : 0 ถึง 9 ใช้ตัวเลข 48 ถึง 57
ช่องว่าง : ช่องว่างค่ะ เป็นหมายเลข 32
เครื่องหมายวรรคตอน : ! , . ? : ; ' " ( ) และอื่นๆ ตัวอย่างเช่น ! คือ 33, จุลภาคคือ 44, จุดคือ 46, เครื่องหมายคำถามคือ 63
อักขระควบคุม : ทำหน้าที่ต่างๆ ได้แก่ ตัวเลข 0 ถึง 31 และ 127 เช่น ขึ้นบรรทัดใหม่ กดกริ่ง หรือเลื่อนเคอร์เซอร์

ตัวอย่างแผนที่แบบง่าย

เอ คือ 65.
'บี' คือ 66.
'Z' คือ 90
'a' คือ 97
'z' คือ 122
'0' คือ 48
'9' คือ 57.
' ' (ช่องว่าง) คือ 32.
'!' คือ 33.

ลองสังเกตสิ่งที่น่าสนใจดูสิ ตัวอักษรพิมพ์เล็กมีค่ามากกว่าคู่ตัวอักษรพิมพ์ใหญ่ 32 ตัว ตัวอย่างเช่น \(\;97 - 65 = 32\) ดังนั้น 'a' จึงมีค่ามากกว่า 'A' 32 ตัว 'b' ก็มีค่ามากกว่า 'B' 32 ตัว เป็นต้น รูปแบบนี้ทำให้การทำงานคอมพิวเตอร์บางอย่างง่ายขึ้น

ควบคุมอักขระด้วยคำธรรมดา

NUL (0): มันไม่มีความหมายอะไรเลย มันเป็นจุดสิ้นสุดในระบบเก่าบางระบบ
BEL (7): สามารถส่งเสียงบี๊บได้ ลองนึกถึงเสียงเตือนเบาๆ ดู
BS Backspace (8): ถอยหลังหนึ่งก้าว
แท็บ (9): ข้ามไปยังแท็บสต็อปถัดไป ซึ่งช่วยให้ทุกอย่างเรียงกัน
LF Line Feed (10): เลื่อนลงไปยังบรรทัดใหม่
CR Carriage Return (13): เลื่อนกลับไปที่จุดเริ่มต้นของบรรทัด ในเครื่องพิมพ์ดีดรุ่นเก่า แคร่จะเลื่อนกลับไปทางซ้าย ซึ่ง CR ก็ทำแบบนั้น
ESC Escape (27): เริ่มคำสั่งพิเศษสำหรับหน้าจอหรือเครื่องพิมพ์เก่า
DEL Delete (127): ทำเครื่องหมายบางสิ่งบางอย่างว่าถูกลบไปแล้วในระบบเก่ามาก

เมื่อคุณกดปุ่ม Enter คอมพิวเตอร์ของคุณอาจส่ง LF หรือ CR หรือทั้งสองอย่าง ขึ้นอยู่กับระบบ เครื่องมืออินเทอร์เน็ตจำนวนมากใช้ LF ระบบเก่าบางระบบใช้ CR และ LF ร่วมกัน

มุมมองทศนิยม ไบนารี และเลขฐานสิบหก

เราสามารถเขียนตัวเลขได้หลายวิธี เลขทศนิยม เป็นวิธีปกติในการนับเลขโดยใช้ตัวเลข 0 ถึง 9 เลขฐานสอง ใช้เพียง 0 และ 1 เลขฐานสิบหกใช้เลข 0 ถึง 9 และ เลขฐานสิบหกใช้เลข 0 ถึง 9 และเลขฐานสิบหก (A ถึง F)

'A' : ทศนิยม 65, เลขฐานสอง 01000001, เลขฐานสิบหก 41 ในรูปแบบคณิตศาสตร์: \(65_{(10)} = 01000001_{(2)} = 41_{(16)}\) .
'a' : ทศนิยม 97, ไบนารี 01100001, เลขฐานสิบหก 61 นั่นคือ \(97_{(10)} = 01100001_{(2)} = 61_{(16)}\)
'0' : ทศนิยม 48, ไบนารี 00110000, เลขฐานสิบหก 30 นั่นคือ \(48_{(10)} = 00110000_{(2)} = 30_{(16)}\)
ช่องว่าง : ทศนิยม 32, ฐานสอง 00100000, ฐานสิบหก 20 นั่นคือ \(32_{(10)} = 00100000_{(2)} = 20_{(16)}\)
บรรทัดใหม่ (LF) : เลขฐานสิบ 10, เลขฐานสอง 00001010, เลขฐานสิบหก 0A นั่นคือ \(10_{(10)} = 00001010_{(2)} = 0A_{(16)}\)

เลขฐานสองทำให้ 'A' เป็น 65 ได้อย่างไร? ลองดูบิตใน 01000001 บิตซ้ายสุดคือ 128 จากนั้น 64, 32, 16, 8, 4, 2, 1 มีเพียง 64 และ 1 เท่านั้นที่อยู่บน ดังนั้น \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\)

จากแป้นพิมพ์สู่หน้าจอ

กดปุ่ม แป้นพิมพ์จะส่งรหัสไปยังคอมพิวเตอร์ ระบบจะแปลงรหัสเป็นตัวเลขอักขระ สำหรับปุ่มจำนวนมาก ตัวเลขนั้นคือเลข ASCII แอปพลิเคชันจะเก็บตัวเลขไว้ในหน่วยความจำ เมื่อแสดงข้อความ แอปพลิเคชันจะค้นหาตัวเลขและวาดตัวอักษร เมื่อคุณบันทึก ตัวเลขจะถูกบันทึกลงในไฟล์

ข้อความเดินทางผ่านเครือข่ายอย่างไร

ลองนึกถึงข้อความ Hi! ตัวอักษรคือ H, i และ ! ตัวเลข ASCII ของพวกมันคือ 72, 105 และ 33 ในระบบเลขฐานสองคือ 01001000, 01101001 และ 00100001 เครือข่ายจะส่งบิตเหล่านี้ อีกฝ่ายหนึ่งอ่านบิตเหล่านั้น มองเห็นตัวเลข และแสดง H, i และ ! อีกครั้ง นี่คือวิธีการส่งข้อความแบบง่ายๆ

ASCII และหน้าโค้ดที่ขยาย

ผู้คนต้องการสัญลักษณ์เพิ่มเติม พวกเขาต้องการตัวอักษรเช่น é, ñ และ ø พวกเขาต้องการสัญลักษณ์เงินเช่น € ชุด 7 บิตมีสัญลักษณ์เพียง 128 ตัว ดังนั้นผู้คนจึงใช้ 8 บิต เมื่อ 8 บิต เราได้สัญลักษณ์ \(2^8 = 256\) ครึ่งบนตั้งแต่ 128 ถึง 255 ใช้สำหรับตัวอักษรและสัญลักษณ์เพิ่มเติม แต่มีปัญหาอยู่อย่างหนึ่ง กลุ่มต่างๆ เลือกตัวเลขที่แตกต่างกันสำหรับตัวอักษรเพิ่มเติมเหล่านี้ ตัวเลือกเหล่านี้เรียกว่า โค้ดเพจ

ISO-8859-1 (ละติน-1) เป็นชุดตัวอักษรยุโรปตะวันตกที่ใช้กันทั่วไป โดยกำหนดให้ é อยู่ที่ 233
Windows-1252 ใกล้เคียงกับ Latin-1 มาก แต่ใช้จุด 128 ถึง 159 สำหรับเครื่องหมายวรรคตอน เช่น "เครื่องหมายคำพูดอัจฉริยะ"

เนื่องจากโค้ดเพจต่างกัน ตัวเลขเดียวกันจึงอาจแสดงสัญลักษณ์ที่แตกต่างกันบนคอมพิวเตอร์เครื่องอื่นได้ ความผิดพลาดนี้เรียกว่า mojibake มีลักษณะเป็นอักขระแปลกๆ นี่เป็นเหตุผลหนึ่งที่โลกเปลี่ยนมาใช้ Unicode

ASCII และ Unicode

Unicode เป็นมาตรฐานขนาดใหญ่ที่สามารถแสดงภาษา สัญลักษณ์ทางคณิตศาสตร์ และอิโมจิได้หลากหลาย Unicode มีพื้นที่สำหรับสัญลักษณ์มากกว่าหนึ่งล้านตัว มีหลายวิธีในการจัดเก็บ Unicode วิธีหนึ่งที่นิยมคือ UTF-8

ASCII เป็นส่วนเล็กๆ ของ Unicode รหัส Unicode 128 ตัวแรกตรงกับ ASCII พอดี
ใน UTF-8 อักขระ ASCII ทั้งหมดจะใช้หนึ่งไบต์และมีค่าเท่ากันตั้งแต่ 0 ถึง 127 ดังนั้นข้อความ ASCII ใดๆ ก็ตามจึงถือเป็น UTF-8 ที่ถูกต้องแล้ว
ตัวอักษรที่เกินกว่า ASCII จะใช้พื้นที่สองไบต์หรือมากกว่าในรูปแบบ UTF-8 ตัวอย่างเช่น é ในรูปแบบ UTF-8 จะใช้พื้นที่สองไบต์ คุณไม่จำเป็นต้องจำไบต์เหล่านี้ คอมพิวเตอร์จะจัดการให้เอง

ข้อความใช้กี่ไบต์

สำหรับข้อความแบบ ASCII อย่างเดียว อักขระแต่ละตัวจะใช้หนึ่งไบต์ ดังนั้นคำว่า cat จึงใช้ 3 ไบต์ วลี hi mom มี 6 อักขระรวมช่องว่าง ดังนั้นจึงใช้ 6 ไบต์ ในการคำนวณอย่างง่าย \(\textrm{ไบต์ ASCII} = \textrm{จำนวนตัวอักษร}\)

การเรียงลำดับด้วย ASCII

คอมพิวเตอร์มักจะเรียงลำดับสตริงตามหมายเลขอักขระ การเรียงลำดับแบบ ASCII จะจัดกลุ่มสิ่งต่างๆ ในลักษณะเฉพาะ

ตัวเลข 0 ถึง 9 มาก่อนตัวอักษรเนื่องจาก 48 ถึง 57 น้อยกว่า 65 และ 97
ตัวอักษรพิมพ์ใหญ่ A ถึง Z จะอยู่ก่อนตัวอักษรพิมพ์เล็ก a ถึง z เนื่องจากตัวเลข 65 ถึง 90 น้อยกว่าตัวเลข 97 ถึง 122

ซึ่งหมายความว่า Zoo มาก่อน Apple หากเราเปรียบเทียบค่า ASCII แบบง่าย การเรียงลำดับจะเรียงตามตัวเลข ไม่ใช่ตามเสียงของคำ

รหัส ASCII ทั่วไปที่ควรรู้

พื้นที่ : 32
อุทาน ! : 33
เครื่องหมายจุลภาค , : 44
ช่วงเวลา : 46
สแลช / : 47
หลัก 0..9 : 48..57
ลำไส้ใหญ่ : : 58
เครื่องหมายอัฒภาค ; : 59
เครื่องหมายคำถาม ? : 63
ที่ป้าย @ : 64
ตัวพิมพ์ใหญ่ A..Z : 65..90
วงเล็บเหลี่ยมซ้าย [ : 91
แบ็กสแลช \ : 92
วงเล็บเหลี่ยมขวา ] : 93
ตัวพิมพ์เล็ก a..z : 97..122
วงเล็บปีกกา { } : 123 และ 125
ทิลดา ~ : 126

สังเกตว่าเครื่องหมาย แอมเพอร์แซนด์ คือ & เลข ASCII คือ 38 เครื่องหมายบวก + คือ 43 เครื่องหมายลบ - คือ 45

การใช้งานจริงในเทคโนโลยีในชีวิตประจำวัน

ไฟล์ข้อความธรรมดา (.txt): บันทึกย่อแบบเรียบง่ายจำนวนมากใช้เฉพาะ ASCII เท่านั้น
การเขียนโปรแกรม : ตัวอักษร ตัวเลข และสัญลักษณ์ในรหัสมักมาจาก ASCII ตัวอย่างเช่น คำสั่ง if จะใช้ตัวอักษร if และวงเล็บปีกกา { } จาก ASCII
ไฟล์ CSV : ตารางข้อมูลจำนวนมากที่บันทึกเป็นค่าที่คั่นด้วยจุลภาคจะใช้เครื่องหมายจุลภาคและตัวเลข ASCII
พื้นฐานอีเมลและเว็บ : ระบบอีเมลเก่าใช้ ASCII 7 บิต ที่อยู่เว็บและคำสั่งโปรโตคอลหลายรายการใช้ตัวอักษรและตัวเลข ASCII
บันทึกและการตั้งค่า : บันทึกระบบและไฟล์การกำหนดค่ามักจะยึดตาม ASCII เพื่อให้สามารถอ่านได้ง่ายทุกที่

รูปแบบ ASCII ที่ช่วย

จากบนลงล่าง : อักษรตัวเล็กจะมากกว่าอักษรตัวใหญ่สำหรับตัวอักษรเดียวกัน 32 ตัว \(\;97 - 65 = 32\) , \(\;98 - 66 = 32\) และอื่นๆ
ตัวเลข : ตัวเลข '0' คือ 48, '1' คือ 49, ตัวเลข '9' คือ 57 ตัวเลขสำหรับตัวเลขคือ \(48 + \textrm{ค่าตัวเลข}\) ตัวอย่างเช่น \(48 + 7 = 55\) ดังนั้น '7' คือ 55

การสร้างภาพด้วย ASCII ทำได้อย่างไรบ้าง

ผู้คนสร้างภาพโดยใช้เฉพาะตัวอักษร นี่เรียกว่า ASCII art นี่คือภาพใบหน้าเล็กๆ ที่สร้างด้วยตัวอักษร ASCII

:-) ยิ้มง่ายๆ
(^_^) ใบหน้าที่เป็นมิตร
o_O ประหลาดใจ

แต่ละหน้าเป็นเพียงตัวอักษร เช่น เครื่องหมายโคลอน เครื่องหมายขีด และเครื่องหมายวงเล็บ ไม่มีสีหรือรูปทรง มีแต่ข้อความ

ประวัติศาสตร์โดยย่อๆ พูดง่ายๆ

ASCII พัฒนามาจากโทรพิมพ์และคอมพิวเตอร์ยุคแรกๆ ในปี พ.ศ. 2506 ได้มีการตกลงกันถึงมาตรฐาน ASCII เวอร์ชันแรก ซึ่งช่วยให้เครื่องต่างๆ มากมายสื่อสารถึงกันได้ ด้วยรหัสร่วมหนึ่งเดียว ตัวอักษรอย่าง A จึงหมายถึงตัวเลขเดียวกันในทุกที่ ทำให้การส่งข้อความและการพิมพ์ข้อความทำได้ง่ายขึ้น

เมื่อ ASCII ไม่เพียงพอ

ASCII มีรายการเพียง 128 รายการ ซึ่งไม่เพียงพอสำหรับทุกภาษา ไม่สามารถแสดงภาษาจีน ฮินดี อาหรับ หรือสคริปต์อื่นๆ ได้ ไม่สามารถแสดงอิโมจิ และไม่สามารถแสดงสัญลักษณ์ทางคณิตศาสตร์และดนตรีจำนวนมากได้ เราใช้ Unicode ซึ่ง Unicode สามารถแสดงสคริปต์และสัญลักษณ์ได้มากมาย UTF-8 เป็นวิธีหนึ่งในการจัดเก็บข้อมูลเหล่านี้ ข่าวดีก็คือข้อความ ASCII ทั้งหมดทำงานภายใน UTF-8 ดังนั้นระบบสมัยใหม่จึงสามารถอ่าน ASCII แบบเก่าได้อย่างง่ายดาย

แอปจัดการ ASCII ในปัจจุบันอย่างไร

แอปส่วนใหญ่รองรับ UTF-8 แต่เมื่อไฟล์มีเฉพาะตัวอักษรและสัญลักษณ์ ASCII ก็จะมีลักษณะเดียวกันภายใต้ UTF-8 โปรแกรมเมอร์นิยมใช้รูปแบบนี้เพราะทำให้ทุกอย่างเรียบง่าย หน้าเว็บ API และเครื่องมือต่างๆ มากมายใช้ UTF-8 ซึ่งมี ASCII อยู่ด้วยโดยไม่มีการเปลี่ยนแปลงใดๆ

ข้อเท็จจริงเกี่ยวกับตัวเลขเล็กๆ น้อยๆ และคณิตศาสตร์ที่เป็นมิตร

ASCII เป็นชุดข้อมูลขนาด 7 บิต ซึ่งหมายความว่ามีอักขระที่แตกต่างกันได้สูงสุด \(2^7 = 128\) ตัว ชุดข้อมูลแบบขยายที่มี 8 บิตจะมี \(2^8 = 256\) ตัว หากข้อความของคุณมีแต่อักขระ ASCII และมี \(n\) อักขระ จะใช้ \(n\) ไบต์ ในข้อความขนาดเล็กเช่น OK , \(n = 2\) ดังนั้นจึงใช้ 2 ไบต์เมื่อจัดเก็บในรูปแบบ ASCII หรือ UTF-8

การเห็นตัวละครที่ซ่อนอยู่

รายการ ASCII บางตัวมีการทำงานแต่ไม่พิมพ์ ช่องว่างจะพิมพ์ว่างเปล่า แต่ LF และ CR จะเลื่อนเคอร์เซอร์ TAB จะกระโดด เมื่อเราเปิดไฟล์ในโปรแกรมแก้ไขพิเศษ LF อาจแสดงเป็น \n สัญลักษณ์นี้ไม่ได้เป็นส่วนหนึ่งของ ASCII แต่เป็นวิธีที่โปรแกรมแก้ไขแสดงการแบ่งบรรทัดให้คุณเห็น

ตัวอย่างธรรมดาที่รู้สึกเหมือนจริง

การพิมพ์รหัสผ่าน Wi-Fi ด้วยตัวอักษรและตัวเลขจะใช้รหัส ASCII แทนสัญลักษณ์เหล่านั้น เราเตอร์และโทรศัพท์จะตกลงกันในตัวเลขเหล่านี้
การตั้งชื่อไฟล์โดยใช้เพียง A ถึง Z, a ถึง z, 0 ถึง 9 และสัญลักษณ์เช่น - และ _ ช่วยให้เรียบง่ายและปลอดภัยในหลายระบบ
การเขียนหัวเรื่องอีเมลโดยใช้เฉพาะตัวอักษรมาตรฐานและเครื่องหมายวรรคตอนจะช่วยให้เซิร์ฟเวอร์รุ่นเก่าสามารถส่งต่ออีเมลได้

สิ่งที่ต้องระวัง

เครื่องหมายคำพูดแบบหยิก เทียบกับ เครื่องหมายคำพูดแบบตรง : ข้อความจากบรรณาธิการมืออาชีพอาจใช้ “ ” แทน “ “ เครื่องหมายคำพูดแบบตรงเป็น ASCII ส่วนเครื่องหมายคำพูดแบบหยิกไม่ใช่ ซึ่งอาจแสดงผลไม่ถูกต้องในเครื่องมือรุ่นเก่า
หน้าโค้ดที่แตกต่างกัน : ไฟล์ที่บันทึกเป็น Windows-1252 อาจแสดงผลไม่ถูกต้องในระบบที่คาดหวัง ISO-8859-1 หรือในทางกลับกัน ควรใช้ UTF-8 เพื่อหลีกเลี่ยงปัญหานี้ ข้อความ ASCII อย่างเดียวก็ใช้ได้ไม่ว่าจะใช้วิธีใดก็ตาม
ความแตกต่างที่มองไม่เห็น : ช่องว่าง (32) และแท็บ (9) ดูเหมือนช่องว่าง แต่จริงๆ แล้วเป็นอักขระที่ต่างกัน เรื่องนี้สำคัญในการเขียนโปรแกรมและไฟล์ข้อมูล

อุปกรณ์ใช้ ASCII ได้อย่างไรในขั้นตอนง่ายๆ

ลองนึกภาพเครื่องพิมพ์ฉลากที่พิมพ์ชื่อ โดยอ่านชื่อเป็นอักขระ แล้วแปลงอักขระแต่ละตัวเป็นเลข ASCII แล้วจัดเก็บตัวเลขเหล่านั้นไว้ในหน่วยความจำ เครื่องพิมพ์จะพิมพ์ตัวอักษรโดยการค้นหาวิธีวาดตัวเลขแต่ละตัว หากตรงกับ LF (10) เครื่องพิมพ์จะเลื่อนไปยังบรรทัดถัดไปก่อนที่จะพิมพ์เพิ่ม

การเปรียบเทียบสามวิธีในการเขียนโค้ดอักขระหนึ่งตัว

ลองดูอักขระ '!' อีกครั้ง เราสามารถเขียนโค้ดได้สามวิธี เลขฐานสิบ: 33 เลขฐานสอง: 00100001 เลขฐานสิบหก: 21 ในรูปแบบคณิตศาสตร์ \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) แต่ละรูปแบบมีค่าเท่ากัน แอปพลิเคชันจะเลือกรูปแบบที่ต้องการ ผู้คนมักอ่านเลขฐานสิบ คอมพิวเตอร์ชอบเลขฐานสอง เลขฐานสิบหกเป็นวิธีย่อๆ ที่ผู้คนใช้ในการอ่านเลขฐานสอง

เหตุใด ASCII จึงอยู่ได้นานนัก

ASCII มีขนาดเล็กและชัดเจน ถูกสร้างขึ้นตั้งแต่ยุคแรกๆ มีเครื่องมือและโปรโตคอลมากมายที่สร้างขึ้นบน ASCII เนื่องจากรหัส Unicode 128 ตัวแรกตรงกับ ASCII แผนนี้จึงยังคงใช้งานได้ในปัจจุบัน นี่คือเหตุผลที่คุณสามารถเปิดไฟล์ข้อความเก่าๆ บนโทรศัพท์หรือแล็ปท็อปเครื่องใหม่แล้วเห็นตัวอักษรเดิมได้

มินิวอล์คทรู: การอ่านไฟล์สั้น

เปิดไฟล์ที่มีข้อความ Hello ไบต์คือตัวเลข ASCII 72 101 108 108 111 ในระบบเลขฐานสอง ตัวเลขเหล่านี้คือ 01001000 01100101 01101100 01101100 01101111 แอปจะอ่านตัวเลขแต่ละตัวและวาด Hello บนหน้าจอ หากตัวเลขถัดไปคือ 10 ระบบจะเลื่อนขึ้นบรรทัดใหม่ก่อนที่จะเขียนข้อความเพิ่ม นี่คือความง่ายและเสถียรของกระบวนการนี้

เมื่อใดควรเลือก ASCII-only

เมื่อคุณต้องการการสนับสนุนพื้นฐานที่กว้างขวางที่สุดสำหรับเครื่องมือเก่าและอุปกรณ์ธรรมดาๆ
เมื่อคุณจัดเก็บ ID ชื่อไฟล์ หรือรหัสที่ใช้เฉพาะตัวอักษร ตัวเลข เครื่องหมายขีด และเครื่องหมายขีดล่างเท่านั้น
เมื่อคุณสร้างบันทึกง่ายๆ และข้อความจากเครื่องถึงเครื่องที่ไม่จำเป็นต้องมีสำเนียงหรืออีโมจิ

สัญลักษณ์สำคัญที่ผู้คนมักใช้

Dash - คือ 45 เครื่องหมายขีดล่าง _ คือ 95 ช่วยสร้างชื่อไฟล์ที่เรียบร้อย
บวก + เท่ากับ 43 เท่ากับ = เท่ากับ 61 มี URL และสูตรต่างๆ มากมายที่ใช้ค่านี้
เครื่องหมายแอมเพอร์แซนด์ & คือ 38 แบบฟอร์มเว็บและสตริงคิวรีมักใช้เครื่องหมายนี้
เครื่องหมายโคลอน : คือ 58 เวลาประมาณ 12:30 น. ครับ
เครื่องหมาย @ คือ 64 อีเมล user@example.com ใช้เครื่องหมายนี้

ตรวจสอบไอเดียเล็กๆ น้อยๆ อย่างรวดเร็วด้วยตัวเลขเล็กๆ

ลองนึกถึงเลข 10 ในระบบฐานสองคือ 00001010 ในระบบฐานสิบคือสิบ ในระบบ ASCII เลข 10 คือ LF ซึ่งเป็นตัวป้อนบรรทัด นี่แสดงให้เห็นว่าตัวเลขเดียวกันสามารถแสดงได้หลายแบบ ความหมายมาจากวิธีที่เราใช้ตัวเลขนั้น ถ้าเราบอกว่ามันเป็นรหัสอักขระ เลข 10 ก็หมายถึง LF ถ้าเราบอกว่ามันเป็นแค่จำนวนแอปเปิล ก็หมายถึงแอปเปิลสิบลูก บริบทจึงสำคัญ

นำทุกสิ่งมารวมกันด้วยตัวอย่างอีกตัวอย่างหนึ่ง

ไทย เราจะส่งคำว่า Sun จากอุปกรณ์หนึ่งไปยังอีกอุปกรณ์หนึ่ง รหัสคือ 'S' 83, 'u' 117, 'n' 110 ในเลขฐานสอง 83 คือ 01010011, 117 คือ 01110101, 110 คือ 01101110 บิตเดินทางเป็นสัญญาณเปิดและปิด อุปกรณ์อีกตัวเปลี่ยนบิตกลับเป็นตัวเลข จากนั้นจึงเปลี่ยนตัวเลขเป็นตัวอักษร แสดงคำว่า Sun หากรหัสถัดไปคือ 32 นั่นคือช่องว่าง หากรหัสถัดไปคือ 33 นั่นคือ '!' กฎยังคงเหมือนเดิมทุกครั้ง นั่นคือพลังของรหัสที่ใช้ร่วมกัน

เอสกี