Primer lesson: أسكي

ASCII: كيف تخزن أجهزة الكمبيوتر الحروف والرموز

الفكرة الكبيرة

تستخدم الحواسيب الأرقام، بينما يستخدم الناس الحروف والرموز. نحتاج إلى جسر. ASCII هو ذلك الجسر. يُحوّل ASCII كل حرف أو رمز إلى رقم. يخزّن الحاسوب الرقم. عند القراءة، يُظهر الحاسوب الحرف مرة أخرى. هكذا يعمل النص في العديد من الملفات والتطبيقات.

لماذا تحتاج أجهزة الكمبيوتر إلى الكود؟

يعمل الحاسوب بالكهرباء. لديه حالتان: تشغيل وإيقاف. نسمي هاتين الحالتين بتات . البت هو 0 أو 1. تُكوّن عدة بتات معًا أرقامًا أكبر. ثمانية بتات تُكوّن بايتًا . باستخدام البتات، يُمكننا العد. باستخدام العد، يُمكننا تسمية الأشياء. يستخدم ASCII العد لتسمية الحروف والرموز.

بت واحد يُعطي خيارين. بتّان يُعطيان أربعة خيارات. في الرياضيات، تُوضّح هذه الفكرة بالشكل: \(\;2^n\) . بالنسبة إلى \(n=7\) ، نحصل على \(2^7 = 128\) خيارًا. بالنسبة إلى \(n=8\) ، نحصل على \(2^8 = 256\) خيارًا. يستخدم نظام ASCII سبعة بتات، ما يُنتج 128 عنصرًا مُسمّى. لاحقًا، أنشأ الناس مجموعات من 8 بتات تحتوي على 256 عنصرًا. تُسمى هذه المجموعات ASCII الموسّعة .

ماذا يعني ASCII

ASCII هو اختصار لـ American Standard Code for Information Interchange (الرمز القياسي الأمريكي لتبادل المعلومات) . بدأ استخدامه في ستينيات القرن الماضي، وصُمم للطابعات القديمة، وأجهزة التلكس، وأجهزة الكمبيوتر. يُعطي كل حرف، ورقم، ومسافة، وبعض الرموز رقمًا. كما يُعطي أرقامًا خاصة لإجراءات مثل سطر جديد . استخدم الإصدار الأول 7 بتات، لذا كان يحتوي على أرقام من 0 إلى 127.

ما هو الموجود داخل ASCII

الأحرف الكبيرة : من A إلى Z. وتستخدم الأرقام من 65 إلى 90.
الأحرف الصغيرة : من a إلى z. تُستخدم الأرقام من 97 إلى 122.
الأرقام : من 0 إلى 9. يستخدمون الأرقام من 48 إلى 57.
الفراغ : مساحة فارغة. الرقم ٣٢.
علامات الترقيم : !، .؟ :؛ ' " ( ) وغيرها. على سبيل المثال، ! = 33، الفاصلة = 44، النقطة = 46، علامة الاستفهام = 63.
أحرف التحكم : هذه الأحرف تؤدي وظائف. وهي الأرقام من ٠ إلى ٣١ و١٢٧. لها وظائف مثل بدء سطر جديد، أو رنين جرس، أو تحريك المؤشر.

أمثلة على الخرائط البسيطة

"أ" هو 65.
"ب" هو 66.
"Z" هو 90.
"أ" هو 97.
'z' هو 122.
'0' هو 48.
"9" هو 57.
' ' (المسافة) هي 32.
'!' هو 33.

لاحظ شيئًا رائعًا. الأحرف الصغيرة أكبر بـ 32 من أزواجها الكبيرة. على سبيل المثال، \(\;97 - 65 = 32\) . لذا، الحرف "a" أكبر بـ 32 من "A". والحرف "b" أكبر بـ 32 من "B"، وهكذا. هذا النمط يُسهّل بعض مهام الحاسوب.

أحرف التحكم في الكلمات البسيطة

NUL (0): لا يعني شيئًا. يُشير إلى نهاية بعض الأنظمة القديمة.
بيل (7): يُمكنه إصدار صوت صفير. فكّر في تنبيه لطيف.
BS Backspace (8): يتحرك خطوة واحدة إلى الوراء.
علامة تبويب (9): تنتقل إلى علامة التبويب التالية. هذا يساعد على تنظيم الأمور.
تغذية السطر LF (10): ينتقل إلى الأسفل إلى سطر جديد.
عودة عربة CR (13): تعود العربة إلى بداية السطر. في الآلات الكاتبة القديمة، كانت العربة تعود إلى اليسار. CR يفعل ذلك.
ESC Escape (27): يبدأ أمرًا خاصًا للشاشات أو الطابعات القديمة.
DEL Delete (127): يقوم بوضع علامة على شيء ما على أنه محذوف في الأنظمة القديمة جدًا.

عند الضغط على مفتاح الإدخال، قد يُرسل جهاز الكمبيوتر LF أو CR أو كليهما، حسب النظام. تستخدم العديد من أدوات الإنترنت LF. بعض الأنظمة القديمة استخدمت CR وLF معًا.

عرض الأرقام العشرية والثنائية والسداسية

يمكننا كتابة الأرقام بطرق مختلفة. النظام العشري هو الطريقة المعتادة للعد، باستخدام الأرقام من ٠ إلى ٩. النظام الثنائي يستخدم ٠ و١ فقط. النظام السداسي عشر يستخدم الأرقام من ٠ إلى ٩، والأرقام من A إلى F.

'أ' : العدد العشري 65، والثنائي 01000001، والسداسي عشري 41. في الشكل الرياضي: \(65_{(10)} = 01000001_{(2)} = 41_{(16)}\) .
'a' : العدد العشري 97، والثنائي 01100001، والسداسي عشري 61. وهذا هو \(97_{(10)} = 01100001_{(2)} = 61_{(16)}\) .
'0' : العدد العشري 48، والثنائي 00110000، والسداسي عشري 30. وهذا هو \(48_{(10)} = 00110000_{(2)} = 30_{(16)}\) .
المساحة : عشري 32، ثنائي 00100000، سداسي عشري 20. وهذا هو \(32_{(10)} = 00100000_{(2)} = 20_{(16)}\) .
سطر جديد (LF) : عشري ١٠، ثنائي ٠٠٠٠١٠١٠، سداسي عشري ٠A. أي \(10_{(10)} = 00001010_{(2)} = 0A_{(16)}\) .

كيف يُعطي النظام الثنائي القيمة 65 للعدد 'A'؟ انظر إلى البتات في 01000001. البت الأيسر هو 128. ثم 64، 32، 16، 8، 4، 2، 1. فقط 64 و1 هما المُشغّلان. إذًا \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .

من لوحة المفاتيح إلى الشاشة

اضغط على أي مفتاح. تُرسل لوحة المفاتيح رمزًا إلى الحاسوب. يُحوّله النظام إلى رقم حرفي. بالنسبة للعديد من المفاتيح، يكون هذا الرقم هو رقم ASCII. يُخزّن التطبيق الرقم في الذاكرة. عندما يُظهر النص، يبحث عن الرقم ويرسم الحرف. عند الحفظ، تُحفظ الأرقام في الملف.

كيف ينتقل النص عبر الشبكة

فكّر في رسالة "مرحبًا!" . الأحرف هي H وi و!. أرقامها بنظام ASCII هي 72 و105 و33. في النظام الثنائي، هي 01001000 و01101001 و00100001. تُرسل الشبكة هذه البتات. يقرأ الطرف الآخر البتات، ويرى الأرقام. يُظهر H وi و! مرة أخرى. هكذا تنتقل الرسائل النصية البسيطة.

صفحات ASCII والرموز الموسعة

أراد الناس رموزًا أكثر. أرادوا حروفًا مثل é وñ وø. وأرادوا رموزًا نقدية مثل €. احتوت المجموعة المكونة من 7 بتات على 128 رمزًا فقط. لذا استخدم الناس 8 بتات. باستخدام 8 بتات، نحصل على \(2^8 = 256\) رمزًا. استُخدم النصف العلوي، من 128 إلى 255، للحروف والرموز الإضافية. ولكن كانت هناك مشكلة. اختارت مجموعات مختلفة أرقامًا مختلفة لتلك الأحرف الإضافية. تُسمى هذه الخيارات صفحات الرموز .

ISO-8859-1 (Latin-1) هي مجموعة شائعة لأحرف أوروبا الغربية. وتضع حرف é عند 233.
Windows-1252 قريب جدًا من Latin-1، ولكنه يستخدم بعض النقاط من 128 إلى 159 للعلامات الترقيمية مثل "علامات الاقتباس الذكية".

نظرًا لاختلاف صفحات الرموز، قد يُظهر الرقم نفسه رمزًا مختلفًا على جهاز كمبيوتر آخر. يُسمى هذا الخلل "موجي بيك" . يبدو وكأنه أحرف غريبة. وهذا أحد أسباب انتقال العالم إلى يونيكود.

ASCII وUnicode

يونيكود معيارٌ أساسيٌّ يُتيح عرض العديد من اللغات ورموز الرياضيات والرموز التعبيرية. يتسع لأكثر من مليون رمز. هناك طرقٌ عديدةٌ لتخزين يونيكود، ومن أشهرها UTF-8 .

ASCII هو جزء صغير من Unicode. أول ١٢٨ رمزًا من رموز Unicode تتطابق تمامًا مع ASCII.
في UTF-8 ، تستخدم جميع أحرف ASCII بايتًا واحدًا ولها نفس القيم من 0 إلى 127. لذا فإن أي نص ASCII يكون بالفعل صالحًا لـ UTF-8.
الحروف التي تتجاوز ASCII تشغل بايتين أو أكثر في UTF-8. على سبيل المثال، حرف é في UTF-8 يحتل بايتين. لستَ بحاجة إلى حفظ هذه البايتات، فالحاسوب يتولى الأمر نيابةً عنك.

كم بايت يستخدم النص؟

في النصوص المكتوبة بنظام ASCII فقط، يستخدم كل حرف بايتًا واحدًا. لذا، كلمة "قطة" تستخدم 3 بايتات. أما عبارة "مرحبًا يا أمي" فتتكون من 6 أحرف شاملة المسافة، أي أنها تستخدم 6 بايتات. وبحساب بسيط، \(\textrm{بايتات ASCII} = \textrm{عدد الأحرف}\) .

ترتيب الفرز باستخدام ASCII

عادةً ما تُصنّف أجهزة الكمبيوتر السلاسل حسب أرقام أحرفها. يُجمّع نظام ASCII الأشياء بطريقة مُعيّنة.

الأرقام من 0 إلى 9 تأتي قبل الحروف لأن الأرقام من 48 إلى 57 أقل من 65 و97.
تأتي الأحرف الكبيرة من A إلى Z قبل الأحرف الصغيرة من a إلى z لأن 65 إلى 90 أقل من 97 إلى 122.

هذا يعني أن كلمة "Zoo" تأتي قبل "Apple" عند مقارنة قيم ASCII البسيطة. يتم الترتيب حسب الأرقام، وليس حسب نطق الكلمات.

رموز ASCII الشائعة التي يجب معرفتها

المساحة : 32
تعجب ! : 33
فاصلة ، : 44
الفترة . : 46
مائل / : 47
الأرقام 0..9 : 48..57
القولون : : 58
فاصلة منقوطة ؛ : 59
علامة استفهام ؟ : 63
عند الإشارة @ : 64
أحرف كبيرة من A..Z : 65..90
قوس مربع أيسر [ : 91
الشرطة المائلة للخلف \ : 92
قوس مربع أيمن ] : 93
أحرف صغيرة a..z : 97..122
الأقواس المتعرجة { } : 123 و 125
تيلدا ~ : 126

لاحظ أن الرمز "و" هو &. رقمه في نظام ASCII هو 38. علامة الجمع "+" هي 43. علامة الطرح "-" هي 45.

استخدامات حقيقية للتكنولوجيا في حياتنا اليومية

ملفات النص العادي (.txt): تستخدم العديد من الملاحظات البسيطة نظام ASCII فقط.
البرمجة : غالبًا ما تأتي الأحرف والأرقام والرموز في الشيفرة البرمجية من نظام ASCII. على سبيل المثال، تستخدم عبارات if الأحرف if والأقواس المعقوفة { } من نظام ASCII.
ملفات CSV : تستخدم العديد من جداول البيانات المحفوظة كقيم مفصولة بفاصلات فواصل وأرقام ASCII.
أساسيات البريد الإلكتروني والويب : كانت أنظمة البريد الإلكتروني القديمة تستخدم نظام ASCII ذي السبعة بتات. أما عناوين الويب والعديد من أوامر البروتوكول، فتستخدم أحرف وأرقام ASCII.
السجلات والإعدادات : غالبًا ما تلتزم سجلات النظام وملفات التكوين بتنسيق ASCII حتى يسهل قراءتها في كل مكان.

أنماط ASCII التي تساعد

من الأعلى إلى الأسفل : الأحرف الصغيرة أكثر من الأحرف الكبيرة بـ 32 بالنسبة لنفس الحرف. \(\;97 - 65 = 32\) ، \(\;98 - 66 = 32\) ، وهكذا.
الأرقام : الرقم 0 يساوي 48، والرقم 1 يساوي 49، وصولًا إلى الرقم 9 الذي يساوي 57. قيمة كل رقم هي \(48 + \textrm{القيمة الرقمية}\) . على سبيل المثال، \(48 + 7 = 55\) . إذن، 7 يساوي 55.

كيف يمكن إنشاء الصور باستخدام ASCII

يصنع الناس صورًا باستخدام الأحرف فقط. يُسمى هذا فن ASCII . إليكم وجهًا صغيرًا مُصممًا باستخدام أحرف ASCII.

:-) ابتسامة بسيطة
(^_^) وجه ودود
o_O مندهش

كل وجه عبارة عن حروف مثل النقطتين والشرطة والأقواس. لا ألوان ولا أشكال، فقط نص.

التاريخ باختصار وبكلمات بسيطة

نشأت لغة ASCII من آلات التلغراف وأجهزة الحاسوب المبكرة. في عام ١٩٦٣، تم الاتفاق على أول نسخة منها. ساعدت هذه اللغة العديد من الأجهزة المختلفة على التواصل مع بعضها البعض. باستخدام رمز واحد مشترك، كان حرف مثل A يعني الرقم نفسه في كل مكان. هذا سهّل إرسال الرسائل وطباعة النصوص.

عندما لا يكون ASCII كافيا

يحتوي نظام ASCII على ١٢٨ عنصرًا فقط. هذا لا يكفي لجميع اللغات. فهو لا يعرض النصوص الصينية أو الهندية أو العربية أو العديد من النصوص الأخرى. كما لا يعرض الرموز التعبيرية. كما لا يعرض العديد من رموز الرياضيات والموسيقى. نستخدم Unicode لهذه الرموز. يمكن لـ Unicode عرض العديد من النصوص والرموز. UTF-8 هو وسيلة تخزينها. والخبر السار هو أن جميع نصوص ASCII تعمل داخل UTF-8، لذا تستطيع الأنظمة الحديثة قراءة ASCII القديم بسهولة.

كيف تتعامل التطبيقات مع ASCII اليوم

تتوقع معظم التطبيقات ترميز UTF-8. ولكن عندما يحتوي الملف على أحرف ورموز ASCII فقط، فإنه يبدو كما هو تحت UTF-8. يُفضل المبرمجون هذا لأنه يُبسط الأمور. تستخدم صفحات الويب وواجهات برمجة التطبيقات والعديد من الأدوات ترميز UTF-8، الذي يتضمن ASCII دون أي تغييرات.

حقائق الأعداد الصغيرة والرياضيات الودية

ASCII هي مجموعة مكونة من 7 بتات. هذا يعني ما يصل إلى \(2^7 = 128\) حرفًا مختلفًا. المجموعة الموسعة المكونة من 8 بتات تحتوي \(2^8 = 256\) عنصرًا. إذا كان نصك يحتوي على أحرف ASCII فقط، وكان يحتوي على \(n\) حرف، فإنه يستخدم \(n\) بايت. في رسالة صغيرة مثل OK ، \(n = 2\) لذا، فإنه يستخدم بايتين عند تخزينه بتنسيق ASCII أو UTF-8.

رؤية الشخصيات المخفية

بعض عناصر ASCII تُنفّذ إجراءات ولا تُطبع. يُطبع الفراغ فارغًا. لكن LF وCR يُحرّكان المؤشر. ينتقل TAB. عند فتح ملف في مُحرّر خاص، قد يُظهر LF كـ \n. هذا الرمز ليس جزءًا من ASCII نفسه، بل هو طريقة يُظهر بها المُحرّر فواصل الأسطر.

أمثلة واضحة تبدو حقيقية

كتابة كلمة مرور Wi-Fi بالأحرف والأرقام باستخدام نظام ASCII. يتوافق جهاز التوجيه والهاتف على هذه الأرقام.
إن تسمية الملف باستخدام الحروف من A إلى Z، ومن a إلى z، ومن 0 إلى 9، والرموز مثل - و_ تجعله بسيطًا وآمنًا عبر العديد من الأنظمة.
إن كتابة موضوع البريد الإلكتروني باستخدام الأحرف والعلامات الترقيمية القياسية فقط يضمن أن يتمكن الخوادم القديمة من تمريره.

أشياء يجب الانتباه لها

علامات الاقتباس المنحنية مقابل علامات الاقتباس المستقيمة : قد تستخدم النصوص في برامج التحرير المتطورة " " بدلاً من " . علامات الاقتباس المستقيمة هي ASCII. علامات الاقتباس المنحنية ليست كذلك، وقد لا تظهر بشكل صحيح في الأدوات القديمة.
صفحات ترميز مختلفة : قد يظهر ملف محفوظ بتنسيق Windows-1252 بشكل خاطئ على نظام يتوقع ISO-8859-1، أو العكس. استخدم UTF-8 لتجنب ذلك. النص بترميز ASCII فقط سيكون مناسبًا في كلتا الحالتين.
فروق خفية : المسافة (32) وعلامة الجدولة (9) تبدوان كفجوات. لكنهما حرفان مختلفان. هذا مهم في البرمجة وملفات البيانات.

كيف تستخدم الأجهزة ASCII في خطوات بسيطة

تخيل جهازًا لطباعة الأسماء. يقرأ الجهاز الاسم كحروف، ويحوّل كل حرف إلى أرقام ASCII. يخزن هذه الأرقام في الذاكرة. يطبع الأحرف بالبحث عن كيفية رسم كل رقم. إذا حقق الشرط LF (10)، ينتقل إلى السطر التالي قبل طباعة المزيد.

مقارنة ثلاث طرق لكتابة كود حرف واحد

انظر إلى الرمز '!' مرة أخرى. يمكننا كتابة شفرته بثلاث طرق: عشري: 33. ثنائي: 00100001. سداسي عشري: 21. في الصيغة الرياضية، \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . كل شكل له القيمة نفسها. تختار التطبيقات الشكل الذي تحتاجه. غالبًا ما يقرأ الناس الأعداد العشرية. أجهزة الكمبيوتر تُفضل الأعداد الثنائية. السداسي عشري هو اختصار لقراءة الأعداد الثنائية.

لماذا استمر نظام ASCII لفترة طويلة؟

نظام ASCII صغير وواضح. وُضع مبكرًا، وبُنيت عليه العديد من الأدوات والبروتوكولات. ولأن أول ١٢٨ رمزًا من رموز Unicode تتطابق مع ASCII، لا يزال النظام قائمًا حتى اليوم. ولهذا السبب، يمكنك فتح ملفات نصية قديمة جدًا على هاتف أو كمبيوتر محمول جديد ورؤية الأحرف نفسها.

جولة قصيرة: قراءة ملف قصير

افتح ملفًا يحتوي على كلمة "مرحبًا" . البايتات هي أرقام ASCII 72 101 108 108 111. في النظام الثنائي، تكون هذه الأرقام 01001000 01100101 01101100 01101100 01101111. يقرأ التطبيق كل رقم ويرسم كلمة "مرحبًا" على الشاشة. إذا كان الرقم التالي 10، ينتقل إلى سطر جديد قبل رسم المزيد من النص. هذه هي بساطة العملية وثباتها.

متى تختار ASCII فقط

عندما تحتاج إلى أوسع نطاق من الدعم الأساسي للأدوات القديمة والأجهزة البسيطة.
عند تخزين معرفات أو أسماء ملفات أو رموز تستخدم فقط أحرفًا وأرقامًا وشرطات وعلامات سفلية.
عندما تقوم بإنشاء سجلات بسيطة ورسائل من جهاز إلى جهاز لا تحتاج إلى لهجات أو رموز تعبيرية.

الرموز الرئيسية التي يستخدمها الناس غالبًا

Dash - يساوي 45. Underscore _ يساوي 95. يساعدان في إنشاء أسماء ملفات أنيقة.
زائد + يساوي 43. يساوي = يساوي 61. تستخدم العديد من عناوين URL والصيغ هذه العلامات.
& هو 38. غالبًا ما تستخدمه نماذج الويب وسلاسل الاستعلام.
القولون : هو 58. الوقت مثل 12:30 يستخدمه.
عند العلامة @ يكون الرقم 64. يستخدم البريد الإلكتروني user@example.com هذه العلامة.

فحص سريع لأفكار البت ذات الأرقام الصغيرة

تخيل الرقم 10. في النظام الثنائي، هو 00001010. وفي النظام العشري، هو 10. في نظام ASCII، 10 هو LF، أي تغذية السطر. هذا يوضح كيف يمكن عرض الرقم نفسه بطرق مختلفة. ينبع المعنى من كيفية استخدامنا للرقم. إذا قلنا إنه رمز حرفي، فإن 10 يعني LF. إذا قلنا إنه مجرد عدد من التفاحات، فهو عشر تفاحات. السياق مهم.

جمع كل ذلك معًا بمثال آخر

سنرسل كلمة "شمس" من جهاز إلى آخر. الرموز هي 'S' 83، 'u' 117، 'n' 110. في النظام الثنائي، 83 هو 01010011، 117 هو 01110101، 110 هو 01101110. تنتقل البتات كإشارات تشغيل وإيقاف. يُحوّل الجهاز الآخر البتات إلى أرقام، ثم يُحوّل الأرقام إلى أحرف. يُظهر كلمة "شمس" . إذا كان الرمز التالي 32، فهو مسافة. إذا كان التالي 33، فهو '!'. تبقى القواعد كما هي في كل مرة. هذه هي قوة الرمز المشترك.

أسكي