Komputer menggunakan angka. Manusia menggunakan huruf dan simbol. Kita membutuhkan jembatan. ASCII adalah jembatan itu. ASCII mengubah setiap huruf atau simbol menjadi angka. Komputer menyimpan angka tersebut. Saat kita membaca, komputer menampilkan huruf tersebut lagi. Beginilah cara teks bekerja di banyak berkas dan aplikasi.
Komputer bekerja dengan listrik. Ia melihat dua kondisi: On dan Off. Kondisi ini kita sebut bit . Satu bit adalah 0 atau 1. Banyak bit yang digabungkan menghasilkan angka yang lebih besar. Delapan bit menghasilkan satu byte . Dengan bit, kita dapat berhitung. Dengan berhitung, kita dapat memberi nama pada sesuatu. ASCII menggunakan penghitungan untuk memberi nama huruf dan simbol.
Satu bit menghasilkan dua pilihan. Dua bit menghasilkan empat pilihan. Dalam matematika, konsep ini direpresentasikan sebagai \(\;2^n\) Untuk \(n=7\) , kita mendapatkan \(2^7 = 128\) pilihan. Untuk \(n=8\) , kita mendapatkan \(2^8 = 256\) pilihan. ASCII menggunakan 7 bit. Hasilnya adalah 128 item bernama. Kemudian, orang-orang membuat himpunan 8-bit dengan 256 item. Himpunan ini disebut ASCII yang diperluas .
ASCII adalah singkatan dari American Standard Code for Information Interchange . Kode ini dimulai pada tahun 1960-an. Kode ini dibuat untuk mesin cetak, teletype, dan komputer generasi awal. Kode ini memberikan nomor untuk setiap huruf, angka, spasi, dan beberapa simbol. Kode ini juga memberikan nomor khusus untuk tindakan seperti baris baru . Versi pertama menggunakan 7 bit, sehingga memiliki angka dari 0 hingga 127.
Perhatikan sesuatu yang menarik. Huruf kecil 32 lebih banyak daripada pasangan huruf besarnya. Misalnya, \(\;97 - 65 = 32\) . Jadi, 'a' 32 lebih banyak daripada 'A'. 'b' 32 lebih banyak daripada 'B', dan seterusnya. Pola ini memudahkan beberapa tugas komputer.
Saat Anda menekan tombol Enter, komputer Anda mungkin mengirimkan LF, atau CR, atau keduanya, tergantung sistemnya. Banyak perangkat internet menggunakan LF. Beberapa sistem lama menggunakan CR dan LF secara bersamaan.
Kita dapat menulis angka dengan berbagai cara. Desimal adalah cara penghitungan normal, menggunakan angka 0 hingga 9. Biner hanya menggunakan 0 dan 1. Heksadesimal menggunakan 0 hingga 9 dan A hingga F.
Bagaimana biner menghasilkan 65 untuk 'A'? Lihat bit-bit pada 01000001. Bit paling kiri adalah 128. Kemudian 64, 32, 16, 8, 4, 2, 1. Hanya 64 dan 1 yang aktif. Jadi \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .
Tekan sebuah tombol. Papan ketik mengirimkan kode ke komputer. Sistem mengubahnya menjadi angka karakter. Untuk banyak tombol, angka tersebut adalah angka ASCII. Aplikasi menyimpan angka tersebut di memori. Ketika teks ditampilkan, aplikasi akan mencari angka tersebut dan menggambar hurufnya. Saat Anda menyimpan, angka-angka tersebut akan disimpan ke dalam berkas.
Bayangkan pesan "Hai!" . Huruf-hurufnya adalah H, i, dan !. Angka ASCII-nya adalah 72, 105, dan 33. Dalam biner, angka-angkanya adalah 01001000, 01101001, dan 00100001. Jaringan mengirimkan bit-bit ini. Sisi lain membaca bit-bit tersebut. Ia melihat angka-angkanya. Ia menampilkan H, i, dan ! lagi. Begitulah cara pesan teks sederhana dikirimkan.
Orang-orang menginginkan lebih banyak simbol. Mereka menginginkan huruf seperti é, ñ, dan ø. Mereka menginginkan simbol uang seperti €. Set 7-bit hanya memiliki 128 simbol. Jadi, orang-orang menggunakan 8 bit. Dengan 8 bit, kita mendapatkan \(2^8 = 256\) simbol. Separuh teratas, dari 128 hingga 255, digunakan untuk huruf dan simbol tambahan. Namun, ada masalah. Kelompok yang berbeda memilih angka yang berbeda untuk huruf-huruf tambahan tersebut. Pilihan ini disebut halaman kode .
Karena halaman kode berbeda, angka yang sama dapat menampilkan simbol yang berbeda di komputer lain. Kesalahan ini disebut mojibake . Kekacauan ini tampak seperti karakter yang aneh. Inilah salah satu alasan dunia beralih ke Unicode.
Unicode adalah standar besar yang dapat menampilkan banyak bahasa, simbol matematika, dan emoji. Standar ini memiliki ruang untuk lebih dari satu juta simbol. Ada banyak cara untuk menyimpan Unicode. Salah satu cara yang populer adalah UTF-8 .
Dengan teks ASCII saja, setiap karakter menggunakan satu byte. Jadi, kata cat menggunakan 3 byte. Frasa hi mom memiliki 6 karakter termasuk spasi, sehingga menggunakan 6 byte. Dalam matematika sederhana, \(\textrm{Byte ASCII} = \textrm{jumlah karakter}\) .
Komputer sering mengurutkan string berdasarkan nomor karakternya. Urutan ASCII mengelompokkan berbagai hal dengan cara tertentu.
Artinya, Zoo muncul sebelum Apple jika kita membandingkan nilai ASCII sederhana. Urutannya berdasarkan angka, bukan bunyi kata.
Perhatikan bahwa ampersand- nya adalah &. Nomor ASCII-nya adalah 38. Tanda plus + adalah 43. Tanda minus - adalah 45.
Orang-orang membuat gambar hanya menggunakan karakter. Ini disebut seni ASCII . Ini wajah mungil yang dibuat dengan karakter ASCII.
:-) Senyum sederhana
(^_^) Wajah ramah
o_O Terkejut
Setiap wajah hanya berupa karakter seperti titik dua, tanda hubung, dan tanda kurung. Tanpa warna atau bentuk. Hanya teks.
ASCII berkembang dari teletype dan komputer-komputer awal. Pada tahun 1963, versi pertama disepakati. Versi ini membantu banyak mesin berbeda berkomunikasi satu sama lain. Dengan satu kode yang sama, huruf seperti A berarti angka yang sama di mana-mana. Hal ini memudahkan pengiriman pesan dan pencetakan teks.
ASCII hanya memiliki 128 item. Itu tidak cukup untuk semua bahasa. ASCII tidak dapat menampilkan aksara Cina, Hindi, Arab, atau banyak aksara lainnya. ASCII tidak dapat menampilkan emoji. ASCII juga tidak dapat menampilkan banyak simbol matematika dan musik. Untuk ini, kami menggunakan Unicode. Unicode dapat menampilkan banyak aksara dan simbol. UTF-8 adalah cara untuk menyimpannya. Kabar baiknya adalah semua teks ASCII berfungsi di dalam UTF-8. Jadi, sistem modern dapat membaca ASCII lama dengan mudah.
Kebanyakan aplikasi membutuhkan UTF-8. Namun, ketika sebuah berkas hanya memiliki huruf dan simbol ASCII, tampilannya tetap sama dengan UTF-8. Para programmer menyukai format ini karena lebih sederhana. Halaman web, API, dan banyak alat menggunakan UTF-8, yang sudah menyertakan ASCII tanpa perubahan.
ASCII adalah himpunan 7-bit. Artinya, terdapat hingga \(2^7 = 128\) karakter berbeda. Himpunan yang diperluas dengan 8 bit memiliki \(2^8 = 256\) . Jika teks Anda hanya memiliki karakter ASCII, dan terdapat \(n\) karakter, maka teks tersebut menggunakan \(n\) byte. Dalam pesan singkat seperti OK , \(n = 2\) Jadi, teks tersebut menggunakan 2 byte ketika disimpan sebagai ASCII atau UTF-8.
Beberapa item ASCII melakukan tindakan dan tidak dicetak. Spasi mencetak kosong. Namun, LF dan CR memindahkan kursor. TAB melompat. Ketika kita membuka berkas di editor khusus, LF mungkin ditampilkan sebagai \n. Simbol tersebut bukan bagian dari ASCII itu sendiri. Itu adalah cara editor menampilkan baris baru kepada Anda.
Bayangkan sebuah mesin pembuat label yang mencetak nama. Mesin ini membaca nama sebagai karakter. Mesin ini mengubah setiap karakter menjadi angka ASCII. Mesin ini menyimpan angka-angka tersebut dalam memori. Mesin ini mencetak huruf-huruf dengan mencari cara menggambar setiap angka. Jika memenuhi LF (10), mesin ini pindah ke baris berikutnya sebelum mencetak angka berikutnya.
Perhatikan kembali karakter '!'. Kita dapat menulis kodenya dalam tiga cara. Desimal: 33. Biner: 00100001. Heksadesimal: 21. Dalam bentuk matematika, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Setiap bentuk memiliki nilai yang sama. Aplikasi memilih bentuk yang mereka butuhkan. Orang sering membaca desimal. Komputer menyukai biner. Heksadesimal adalah cara singkat bagi orang untuk membaca angka biner.
ASCII kecil dan jelas. Dibuat sejak awal. Banyak perangkat dan protokol dibangun di atasnya. Karena 128 kode Unicode pertama cocok dengan ASCII, rencana ini masih berfungsi hingga saat ini. Inilah mengapa Anda dapat membuka berkas teks yang sangat lama di ponsel atau laptop baru dan melihat huruf yang sama.
Buka berkas dengan teks Halo . Byte-nya adalah angka ASCII 72 101 108 108 111. Dalam biner, angka-angka tersebut adalah 01001000 01100101 01101100 01101100 01101111. Aplikasi membaca setiap angka dan menampilkan Halo di layar. Jika angka berikutnya adalah 10, aplikasi akan berpindah ke baris baru sebelum menampilkan teks lainnya. Beginilah proses yang sederhana dan stabil ini.
Bayangkan angka 10. Dalam biner, itu adalah 00001010. Dalam desimal, itu adalah sepuluh. Dalam ASCII, 10 adalah LF, baris baris. Ini menunjukkan bagaimana angka yang sama dapat ditampilkan dengan cara yang berbeda. Maknanya berasal dari cara kita menggunakan angka tersebut. Jika kita menyebutnya kode karakter, maka 10 berarti LF. Jika kita menyebutnya hanya hitungan apel, maka itu adalah sepuluh apel. Konteks itu penting.
Kita akan mengirimkan kata Sun dari satu perangkat ke perangkat lain. Kodenya adalah 'S' 83, 'u' 117, 'n' 110. Dalam biner, 83 adalah 01010011, 117 adalah 01110101, dan 110 adalah 01101110. Bit-bit tersebut bergerak sebagai sinyal On dan Off. Perangkat lain mengubah bit kembali menjadi angka. Kemudian, angka tersebut diubah menjadi huruf. Perangkat ini menampilkan kata Sun. Jika kode berikutnya adalah 32, itu adalah spasi. Jika berikutnya adalah 33, itu adalah '!'. Aturannya tetap sama setiap kali. Itulah kekuatan kode bersama.