कम्प्युटरहरूले संख्याहरू प्रयोग गर्छन्। मानिसहरूले अक्षरहरू र प्रतीकहरू प्रयोग गर्छन्। हामीलाई एउटा पुल चाहिन्छ। ASCII त्यो पुल हो। ASCII ले प्रत्येक अक्षर वा प्रतीकलाई संख्यामा परिणत गर्छ। कम्प्युटरले संख्या भण्डारण गर्छ। जब हामी पढ्छौं, कम्प्युटरले फेरि अक्षर देखाउँछ। धेरै फाइलहरू र एपहरूमा पाठले यसरी काम गर्छ।
कम्प्युटरले बिजुलीबाट काम गर्छ। यसले दुई अवस्था देख्छ। अन र अफ। हामी यी अवस्थाहरूलाई बिट्स भन्छौं। बिट भनेको ० वा १ हो। धेरै बिटहरू मिलेर ठूला संख्याहरू बनाउँछन्। आठ बिटहरूले बाइट बनाउँछन्। बिटहरू प्रयोग गरेर हामी गणना गर्न सक्छौं। गणना गरेर, हामी चीजहरूको नामकरण गर्न सक्छौं। ASCII ले अक्षरहरू र प्रतीकहरूको नामकरण गर्न गणना प्रयोग गर्दछ।
एउटा बिटले दुई विकल्प बनाउँछ। दुई बिटले चार विकल्प बनाउँछ। गणितमा, यो विचार \(\;2^n\) को रूपमा देखाइएको छ। \(n=7\) को लागि, हामीले \(2^7 = 128\) विकल्पहरू पाउँछौं। \(n=8\) को लागि, हामीले \(2^8 = 256\) विकल्पहरू पाउँछौं। ASCII ले ७ बिटहरू प्रयोग गर्दछ। यसले १२८ नाम दिइएको वस्तुहरू दिन्छ। पछि मानिसहरूले २५६ वस्तुहरू सहित ८-बिट सेटहरू बनाए। तिनीहरूलाई विस्तारित ASCII भनिन्छ।
ASCII भनेको अमेरिकी मानक कोड फर इन्फरमेसन इन्टरचेन्ज हो। यो १९६० को दशकमा सुरु भएको थियो। यो प्रारम्भिक प्रिन्टर, टेलिटाइप र कम्प्युटरहरूको लागि बनाइएको थियो। यसले प्रत्येक अक्षर, संख्या, ठाउँ र केही प्रतीकहरूलाई संख्या दिन्छ। यसले नयाँ लाइन जस्ता कार्यहरूलाई विशेष संख्याहरू पनि दिन्छ। पहिलो संस्करणमा ७ बिटहरू प्रयोग गरिएको थियो, त्यसैले यसमा ० देखि १२७ सम्मका संख्याहरू थिए।
केही राम्रो कुरा याद गर्नुहोस्। साना अक्षरहरू तिनीहरूको ठूलो अक्षर जोडी भन्दा ३२ बढी छन्। उदाहरणका लागि, \(\;97 - 65 = 32\) । त्यसैले 'a' 'A' भन्दा ३२ बढी छ। 'b' 'B' भन्दा ३२ बढी छ, र यस्तै। यो ढाँचाले केही कम्प्युटर कार्यहरू सजिलो बनाउँछ।
जब तपाईंले इन्टर कुञ्जी थिच्नुहुन्छ, तपाईंको कम्प्युटरले प्रणालीमा निर्भर गर्दै LF, वा CR, वा दुवै पठाउन सक्छ। धेरै इन्टरनेट उपकरणहरूले LF प्रयोग गर्छन्। केही पुराना प्रणालीहरूले CR र LF सँगै प्रयोग गर्थे।
हामी संख्याहरू विभिन्न तरिकाले लेख्न सक्छौं। दशमलव भनेको हामीले गणना गर्ने सामान्य तरिका हो, ० देखि ९ सम्मका अंकहरू प्रयोग गरेर । बाइनरीले ० र १ मात्र प्रयोग गर्छ। हेक्स (हेक्साडेसिमल) ले ० देखि ९ र A देखि F सम्म प्रयोग गर्छ।
बाइनरीले 'A' को लागि ६५ कसरी बनाउँछ? ०१०००००१ मा बिटहरू हेर्नुहोस्। सबैभन्दा बायाँ बिट १२८ को लागि हो। त्यसपछि ६४, ३२, १६, ८, ४, २, १। केवल ६४ र १ मात्र सक्रिय छन्। त्यसैले \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) ।
एउटा कि थिच्नुहोस्। किबोर्डले कम्प्युटरमा कोड पठाउँछ। प्रणालीले यसलाई क्यारेक्टर नम्बरमा परिणत गर्छ। धेरै किहरूको लागि, त्यो नम्बर ASCII नम्बर हो। एपले नम्बरलाई मेमोरीमा भण्डारण गर्छ। जब यसले पाठ देखाउँछ, यसले नम्बर खोज्छ र अक्षर कोर्छ। जब तपाईंले बचत गर्नुहुन्छ, नम्बरहरू फाइलमा जान्छन्।
सन्देश Hi! लाई विचार गर्नुहोस्। अक्षरहरू H, i, र ! हुन्। तिनीहरूको ASCII संख्याहरू 72, 105, र 33 हुन्। बाइनरीमा, तिनीहरू 01001000, 01101001, र 00100001 हुन्। नेटवर्कले यी बिटहरू पठाउँछ। अर्को पक्षले बिटहरू पढ्छ। यसले संख्याहरू देख्छ। यसले फेरि H, i, र ! देखाउँछ। साधारण पाठ सन्देशहरू यसरी सर्छन्।
मानिसहरूले धेरै प्रतीकहरू चाहन्थे। उनीहरू é, ñ, र ø जस्ता अक्षरहरू चाहन्थे। उनीहरू € जस्ता पैसा चिन्हहरू चाहन्थे। ७-बिट सेटमा केवल १२८ प्रतीकहरू थिए। त्यसैले मानिसहरूले ८ बिटहरू प्रयोग गर्थे। ८ बिटहरूसँग, हामीले \(2^8 = 256\) प्रतीकहरू पाउँछौं। १२८ देखि २५५ सम्मको माथिल्लो आधा, अतिरिक्त अक्षरहरू र प्रतीकहरूको लागि प्रयोग गरिएको थियो। तर एउटा समस्या थियो। विभिन्न समूहहरूले ती अतिरिक्त अक्षरहरूको लागि फरक-फरक संख्याहरू छनौट गरे। यी विकल्पहरूलाई कोड पृष्ठहरू भनिन्छ।
कोड पृष्ठहरू फरक हुने भएकाले, एउटै संख्याले अर्को कम्प्युटरमा फरक प्रतीक देखाउन सक्छ। यो मिश्रणलाई मोजिबेक भनिन्छ। यो अनौठो वर्णहरू जस्तो देखिन्छ। यो संसार युनिकोडमा सर्नुको एउटा कारण हो।
युनिकोड एउटा ठूलो मानक हो जसले धेरै भाषाहरू, गणितीय प्रतीकहरू र इमोजीहरू देखाउन सक्छ। यसमा दस लाखभन्दा बढी प्रतीकहरूको लागि ठाउँ छ। युनिकोड भण्डारण गर्ने धेरै तरिकाहरू छन्। एउटा लोकप्रिय तरिका UTF-8 हो।
ASCII-मात्र पाठको साथ, प्रत्येक वर्णले एक बाइट प्रयोग गर्दछ। त्यसैले cat शब्दले ३ बाइट प्रयोग गर्दछ। वाक्यांश hi mom मा स्पेस सहित ६ वर्णहरू छन्, त्यसैले यसले ६ बाइटहरू प्रयोग गर्दछ। साधारण गणितमा, \(\textrm{ASCII बाइटहरू} = \textrm{वर्णहरूको संख्या}\) ।
कम्प्युटरहरूले प्रायः स्ट्रिङहरूलाई तिनीहरूको क्यारेक्टर नम्बरहरूद्वारा क्रमबद्ध गर्छन्। ASCII अर्डरले चीजहरूलाई निश्चित तरिकाले समूहबद्ध गर्दछ।
यसको अर्थ यदि हामीले साधारण ASCII मानहरू तुलना गर्छौं भने Zoo एप्पलभन्दा पहिले आउँछ। क्रमबद्धता संख्याहरूद्वारा गरिन्छ, शब्दहरू कसरी सुनिन्छन् भन्ने आधारमा होइन।
ध्यान दिनुहोस् कि एम्परस्यान्ड & हो। यसको ASCII नम्बर ३८ हो। प्लस चिन्ह + ४३ हो। माइनस चिन्ह - ४५ हो।
मानिसहरूले केवल अक्षरहरू प्रयोग गरेर चित्रहरू बनाउँछन्। यसलाई ASCII कला भनिन्छ। यहाँ ASCII अक्षरहरू प्रयोग गरेर बनाइएको सानो अनुहार छ।
:-) साधारण मुस्कान
(^_^) मिलनसार अनुहार
o_O छक्क परेँ
प्रत्येक अनुहार केवल कोलोन, ड्यास र कोष्ठक जस्ता वर्णहरू हुन्। कुनै रङ वा आकारहरू छैनन्। केवल पाठ।
ASCII टेलिटाइप र प्रारम्भिक कम्प्युटरहरूबाट विकसित भयो। १९६३ मा, पहिलो संस्करणमा सहमति भयो। यसले धेरै फरक मेसिनहरूलाई एकअर्कासँग कुरा गर्न मद्दत गर्यो। एउटै साझा कोडको साथ, A जस्तो अक्षरको अर्थ जताततै एउटै संख्या थियो। यसले सन्देशहरू पठाउन र पाठ छाप्न सजिलो बनायो।
ASCII मा केवल १२८ वटा वस्तुहरू छन्। त्यो सबै भाषाहरूको लागि पर्याप्त छैन। यसले चिनियाँ, हिन्दी, अरबी, वा अन्य धेरै लिपिहरू देखाउन सक्दैन। यसले इमोजी देखाउन सक्दैन। यसले धेरै गणित र संगीत प्रतीकहरू पनि देखाउन सक्दैन। यीका लागि, हामी युनिकोड प्रयोग गर्छौं। युनिकोडले धेरै लिपिहरू र प्रतीकहरू देखाउन सक्छ। UTF-8 तिनीहरूलाई भण्डारण गर्ने तरिका हो। राम्रो खबर यो हो कि सबै ASCII पाठ UTF-8 भित्र काम गर्दछ। त्यसैले आधुनिक प्रणालीहरूले पुरानो ASCII सजिलै पढ्न सक्छन्।
धेरैजसो एपहरूले UTF-8 को अपेक्षा गर्छन्। तर जब कुनै फाइलमा ASCII अक्षर र प्रतीकहरू मात्र हुन्छन्, यो UTF-8 अन्तर्गत उस्तै देखिन्छ। प्रोग्रामरहरूलाई यो मन पर्छ किनभने यसले चीजहरूलाई सरल राख्छ। वेब पृष्ठहरू, API हरू, र धेरै उपकरणहरूले UTF-8 प्रयोग गर्छन्, जसमा परिवर्तन बिना ASCII समावेश छ।
ASCII ७-बिट सेट हो। यसको अर्थ \(2^7 = 128\) सम्म फरक क्यारेक्टरहरू हुन्छन्। ८ बिट भएको विस्तारित सेटमा \(2^8 = 256\) वस्तुहरू हुन्छन्। यदि तपाईंको पाठमा ASCII क्यारेक्टरहरू मात्र छन्, र यसमा \(n\) क्यारेक्टरहरू छन् भने, यसले \(n\) बाइटहरू प्रयोग गर्दछ। OK जस्तो सानो सन्देशमा, \(n = 2\) । त्यसैले ASCII वा UTF-8 को रूपमा भण्डारण गर्दा यसले २ बाइटहरू प्रयोग गर्दछ।
केही ASCII वस्तुहरूले कार्यहरू गर्छन् र छाप्दैनन्। स्पेसले खाली छाप्छ। तर LF र CR ले कर्सर सार्छ। TAB जम्प गर्छ। जब हामी विशेष सम्पादकमा फाइल खोल्छौं, यसले LF लाई \n को रूपमा देखाउन सक्छ। त्यो प्रतीक ASCII को भाग होइन। यो सम्पादकले तपाईंलाई लाइन ब्रेक देखाउने तरिका हो।
एउटा लेबल निर्माताको कल्पना गर्नुहोस् जसले नामहरू छाप्छ। यसले नामलाई अक्षरहरूको रूपमा पढ्छ। यसले प्रत्येक वर्णलाई ASCII संख्याहरूमा परिणत गर्छ। यसले ती संख्याहरूलाई मेमोरीमा भण्डारण गर्छ। यसले प्रत्येक संख्या कसरी कोर्ने भनेर हेरेर अक्षरहरू छाप्छ। यदि यसले LF (१०) लाई भेट्छ भने, यो थप छाप्नु अघि अर्को रेखामा सर्छ।
'!' अक्षरलाई फेरि हेर्नुहोस्। हामी यसको कोड तीन तरिकाले लेख्न सक्छौं। दशमलव: ३३। बाइनरी: ००१०००१। हेक्स: २१। गणितीय रूपमा, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) । प्रत्येक फारमको मान एउटै हुन्छ। एपहरूले आफूलाई चाहिने फारम छान्छन्। मानिसहरू प्रायः दशमलव पढ्छन्। कम्प्युटरहरूले बाइनरी मन पराउँछन्। हेक्स मानिसहरूलाई बाइनरी संख्याहरू पढ्नको लागि छोटो तरिका हो।
ASCII सानो र स्पष्ट छ। यो पहिले नै बनाइएको थियो। यसमा धेरै उपकरणहरू र प्रोटोकलहरू बनाइएका थिए। पहिलो १२८ युनिकोड कोडहरू ASCII सँग मेल खाने भएकाले, यो योजना आज पनि काम गर्छ। यसैकारण तपाईंले नयाँ फोन वा ल्यापटपमा धेरै पुराना पाठ फाइलहरू खोल्न सक्नुहुन्छ र उही अक्षरहरू देख्न सक्नुहुन्छ।
Hello लेखिएको फाइल खोल्नुहोस्। बाइटहरू ASCII नम्बरहरू 72 101 108 108 111 हुन्। बाइनरीमा, ती 01001000 01100101 01101100 01101100 01101111 हुन्। एपले प्रत्येक नम्बर पढ्छ र स्क्रिनमा H ello कोर्छ। यदि अर्को नम्बर 10 हो भने, यो थप पाठ कोर्नु अघि नयाँ रेखामा सर्छ। यो प्रक्रिया कति सरल र स्थिर छ भन्ने कुरा हो।
१० नम्बरलाई विचार गर्नुहोस्। बाइनरीमा, त्यो ००००१०१० हो। दशमलवमा, यो दस हो। ASCII मा, १० LF हो, लाइन फिड। यसले देखाउँछ कि एउटै संख्यालाई कसरी फरक तरिकाले देखाउन सकिन्छ। अर्थ हामीले संख्या कसरी प्रयोग गर्छौं भन्ने कुराबाट आउँछ। यदि हामीले यो क्यारेक्टर कोड हो भन्यौं भने, १० को अर्थ LF हो। यदि हामीले यो केवल स्याउको गणना हो भन्यौं भने, यो दस स्याउ हो। सन्दर्भले अर्थ राख्छ।
हामी एउटा उपकरणबाट अर्को उपकरणमा सूर्य शब्द पठाउनेछौं। कोडहरू 'S' 83, 'u' 117, 'n' 110 हुन्। बाइनरीमा, 83 01010011 हो, 117 01110101 हो, 110 01101110 हो। बिटहरू अन र अफ संकेतहरूको रूपमा यात्रा गर्छन्। अर्को उपकरणले बिटहरूलाई संख्यामा परिणत गर्दछ। त्यसपछि यसले संख्याहरूलाई अक्षरहरूमा परिणत गर्दछ। यसले सूर्य शब्द देखाउँछ। यदि अर्को कोड 32 हो भने, त्यो स्पेस हो। यदि अर्को 33 हो भने, त्यो '!' हो। नियमहरू प्रत्येक पटक उस्तै रहन्छन्। त्यो साझा कोडको शक्ति हो।