Primer lesson: bahasa inggris ascii

ASCII: Bagaimana Komputer Menyimpan Huruf dan Simbol

Ide besar

Komputer menggunakan angka. Manusia menggunakan huruf dan simbol. Kita membutuhkan jembatan. ASCII adalah jembatan itu. ASCII mengubah setiap huruf atau simbol menjadi angka. Komputer menyimpan angka tersebut. Saat kita membaca, komputer menampilkan huruf tersebut lagi. Beginilah cara teks bekerja di banyak berkas dan aplikasi.

Mengapa komputer membutuhkan kode

Komputer bekerja dengan listrik. Ia melihat dua kondisi: On dan Off. Kondisi ini kita sebut bit . Satu bit adalah 0 atau 1. Banyak bit yang digabungkan menghasilkan angka yang lebih besar. Delapan bit menghasilkan satu byte . Dengan bit, kita dapat berhitung. Dengan berhitung, kita dapat memberi nama pada sesuatu. ASCII menggunakan penghitungan untuk memberi nama huruf dan simbol.

Satu bit menghasilkan dua pilihan. Dua bit menghasilkan empat pilihan. Dalam matematika, konsep ini direpresentasikan sebagai \(\;2^n\) Untuk \(n=7\) , kita mendapatkan \(2^7 = 128\) pilihan. Untuk \(n=8\) , kita mendapatkan \(2^8 = 256\) pilihan. ASCII menggunakan 7 bit. Hasilnya adalah 128 item bernama. Kemudian, orang-orang membuat himpunan 8-bit dengan 256 item. Himpunan ini disebut ASCII yang diperluas .

Apa arti ASCII

ASCII adalah singkatan dari American Standard Code for Information Interchange . Kode ini dimulai pada tahun 1960-an. Kode ini dibuat untuk mesin cetak, teletype, dan komputer generasi awal. Kode ini memberikan nomor untuk setiap huruf, angka, spasi, dan beberapa simbol. Kode ini juga memberikan nomor khusus untuk tindakan seperti baris baru . Versi pertama menggunakan 7 bit, sehingga memiliki angka dari 0 hingga 127.

Apa isi ASCII

Huruf besar : A sampai Z. Mereka menggunakan angka 65 sampai 90.
Huruf kecil : a sampai z. Mereka menggunakan angka 97 sampai 122.
Digit : 0 sampai 9. Mereka menggunakan angka 48 sampai 57.
Spasi : Ruang kosong. Ini nomor 32.
Tanda baca : ! , . ? : ; ' " ( ) dan lainnya. Misalnya, ! adalah 33, koma adalah 44, titik adalah 46, tanda tanya adalah 63.
Karakter kontrol : Karakter ini melakukan tindakan. Karakter ini berupa angka 0 hingga 31 dan 127. Karakter ini melakukan hal-hal seperti memulai baris baru, membunyikan bel, atau menggerakkan kursor.

Contoh peta sederhana

'A' adalah 65.
'B' adalah 66.
'Z' adalah 90.
'a' adalah 97.
'z' adalah 122.
'0' adalah 48.
'9' adalah 57.
'' (spasi) adalah 32.
'!' adalah 33.

Perhatikan sesuatu yang menarik. Huruf kecil 32 lebih banyak daripada pasangan huruf besarnya. Misalnya, \(\;97 - 65 = 32\) . Jadi, 'a' 32 lebih banyak daripada 'A'. 'b' 32 lebih banyak daripada 'B', dan seterusnya. Pola ini memudahkan beberapa tugas komputer.

Karakter kontrol dalam kata-kata biasa

NUL (0): Tidak berarti apa-apa. Ini menandai akhir dalam beberapa sistem lama.
BEL (7): Bisa mengeluarkan bunyi bip. Bayangkan sebuah peringatan lembut.
BS Backspace (8): Bergerak satu langkah mundur.
TAB (9): Melompat ke pemberhentian tab berikutnya. Ini membantu menyelaraskan semuanya.
LF Line Feed (10): Bergerak ke baris baru.
CR Carriage Return (13): Kembali ke awal baris. Pada mesin tik lama, kereta kembali ke kiri. CR melakukan itu.
ESC Escape (27): Memulai perintah khusus untuk layar atau printer lama.
DEL Hapus (127): Menandai sesuatu sebagai terhapus pada sistem yang sangat lama.

Saat Anda menekan tombol Enter, komputer Anda mungkin mengirimkan LF, atau CR, atau keduanya, tergantung sistemnya. Banyak perangkat internet menggunakan LF. Beberapa sistem lama menggunakan CR dan LF secara bersamaan.

Tampilan desimal, biner, dan heksadesimal

Kita dapat menulis angka dengan berbagai cara. Desimal adalah cara penghitungan normal, menggunakan angka 0 hingga 9. Biner hanya menggunakan 0 dan 1. Heksadesimal menggunakan 0 hingga 9 dan A hingga F.

'A' : desimal 65, biner 01000001, heksadesimal 41. Dalam bentuk matematika: \(65_{(10)} = 01000001_{(2)} = 41_{(16)}\) .
'a' : desimal 97, biner 01100001, heksadesimal 61. Yaitu \(97_{(10)} = 01100001_{(2)} = 61_{(16)}\) .
'0' : desimal 48, biner 00110000, heksadesimal 30. Yaitu \(48_{(10)} = 00110000_{(2)} = 30_{(16)}\) .
Spasi : desimal 32, biner 00100000, heksadesimal 20. Yaitu \(32_{(10)} = 00100000_{(2)} = 20_{(16)}\) .
Baris baru (LF) : desimal 10, biner 00001010, heksadesimal 0A. Yaitu \(10_{(10)} = 00001010_{(2)} = 0A_{(16)}\) .

Bagaimana biner menghasilkan 65 untuk 'A'? Lihat bit-bit pada 01000001. Bit paling kiri adalah 128. Kemudian 64, 32, 16, 8, 4, 2, 1. Hanya 64 dan 1 yang aktif. Jadi \(01000001_{(2)} = 0\times128 + 1\times64 + 0\times32 + 0\times16 + 0\times8 + 0\times4 + 0\times2 + 1\times1 = 65\) .

Dari keyboard ke layar

Tekan sebuah tombol. Papan ketik mengirimkan kode ke komputer. Sistem mengubahnya menjadi angka karakter. Untuk banyak tombol, angka tersebut adalah angka ASCII. Aplikasi menyimpan angka tersebut di memori. Ketika teks ditampilkan, aplikasi akan mencari angka tersebut dan menggambar hurufnya. Saat Anda menyimpan, angka-angka tersebut akan disimpan ke dalam berkas.

Bagaimana teks bergerak melalui jaringan

Bayangkan pesan "Hai!" . Huruf-hurufnya adalah H, i, dan !. Angka ASCII-nya adalah 72, 105, dan 33. Dalam biner, angka-angkanya adalah 01001000, 01101001, dan 00100001. Jaringan mengirimkan bit-bit ini. Sisi lain membaca bit-bit tersebut. Ia melihat angka-angkanya. Ia menampilkan H, i, dan ! lagi. Begitulah cara pesan teks sederhana dikirimkan.

Halaman ASCII dan kode yang diperluas

Orang-orang menginginkan lebih banyak simbol. Mereka menginginkan huruf seperti é, ñ, dan ø. Mereka menginginkan simbol uang seperti €. Set 7-bit hanya memiliki 128 simbol. Jadi, orang-orang menggunakan 8 bit. Dengan 8 bit, kita mendapatkan \(2^8 = 256\) simbol. Separuh teratas, dari 128 hingga 255, digunakan untuk huruf dan simbol tambahan. Namun, ada masalah. Kelompok yang berbeda memilih angka yang berbeda untuk huruf-huruf tambahan tersebut. Pilihan ini disebut halaman kode .

ISO-8859-1 (Latin-1) adalah salah satu set umum untuk huruf-huruf Eropa Barat. Huruf é ditempatkan pada angka 233.
Windows-1252 sangat mirip dengan Latin-1, tetapi menggunakan beberapa titik 128 hingga 159 untuk tanda baca seperti “tanda kutip pintar”.

Karena halaman kode berbeda, angka yang sama dapat menampilkan simbol yang berbeda di komputer lain. Kesalahan ini disebut mojibake . Kekacauan ini tampak seperti karakter yang aneh. Inilah salah satu alasan dunia beralih ke Unicode.

ASCII dan Unicode

Unicode adalah standar besar yang dapat menampilkan banyak bahasa, simbol matematika, dan emoji. Standar ini memiliki ruang untuk lebih dari satu juta simbol. Ada banyak cara untuk menyimpan Unicode. Salah satu cara yang populer adalah UTF-8 .

ASCII adalah bagian kecil dari Unicode. 128 kode Unicode pertama sama persis dengan ASCII.
Dalam UTF-8 , semua karakter ASCII menggunakan satu byte dan memiliki nilai yang sama 0 hingga 127. Jadi, teks ASCII apa pun sudah valid UTF-8.
Huruf selain ASCII membutuhkan dua byte atau lebih dalam UTF-8. Misalnya, é dalam UTF-8 membutuhkan dua byte. Anda tidak perlu mengingat byte-byte tersebut. Komputer akan memprosesnya untuk Anda.

Berapa banyak byte yang digunakan teks?

Dengan teks ASCII saja, setiap karakter menggunakan satu byte. Jadi, kata cat menggunakan 3 byte. Frasa hi mom memiliki 6 karakter termasuk spasi, sehingga menggunakan 6 byte. Dalam matematika sederhana, \(\textrm{Byte ASCII} = \textrm{jumlah karakter}\) .

Urutan penyortiran dengan ASCII

Komputer sering mengurutkan string berdasarkan nomor karakternya. Urutan ASCII mengelompokkan berbagai hal dengan cara tertentu.

Angka 0 sampai 9 diletakkan sebelum huruf karena 48 sampai 57 kurang dari 65 dan 97.
Huruf besar A sampai Z ditulis sebelum huruf kecil A sampai Z karena 65 sampai 90 lebih kecil daripada 97 sampai 122.

Artinya, Zoo muncul sebelum Apple jika kita membandingkan nilai ASCII sederhana. Urutannya berdasarkan angka, bukan bunyi kata.

Kode ASCII umum yang perlu diketahui

Ruang : 32
Seruan ! : 33
Koma , : 44
Periode : 46
Garis miring / : 47
Angka 0..9 : 48..57
Titik dua : : 58
Titik koma ; : 59
Tanda tanya ? : 63
Pada tanda @ : 64
Huruf Besar A..Z : 65..90
Tanda kurung siku kiri [ : 91
Garis miring terbalik \ : 92
Tanda kurung siku kanan ] : 93
Huruf kecil a..z : 97..122
Kurung kurawal { } : 123 dan 125
Tilde ~ : 126

Perhatikan bahwa ampersand- nya adalah &. Nomor ASCII-nya adalah 38. Tanda plus + adalah 43. Tanda minus - adalah 45.

Penggunaan nyata dalam teknologi sehari-hari

Berkas teks biasa (.txt): Banyak catatan sederhana hanya menggunakan ASCII.
Pemrograman : Huruf, angka, dan simbol dalam kode sering kali berasal dari ASCII. Misalnya, pernyataan if menggunakan huruf if, dan kurung kurawal { } dari ASCII.
File CSV : Banyak tabel data yang disimpan sebagai nilai yang dipisahkan koma menggunakan koma dan angka ASCII.
Dasar-dasar email dan web : Sistem email lama menggunakan ASCII 7-bit. Alamat web dan banyak perintah protokol menggunakan huruf dan angka ASCII.
Log dan pengaturan : Log sistem dan file konfigurasi sering kali menggunakan ASCII sehingga mudah dibaca di mana-mana.

Pola ASCII yang membantu

Dari atas ke bawah : Huruf kecil 32 lebih banyak daripada huruf besar untuk huruf yang sama. \(\;97 - 65 = 32\) , \(\;98 - 66 = 32\) , dan seterusnya.
Digit : Digit '0' adalah 48, '1' adalah 49, hingga '9' yang merupakan 57. Angka untuk sebuah digit adalah \(48 + \textrm{nilai digit}\) . Misalnya, \(48 + 7 = 55\) . Jadi, '7' adalah 55.

Bagaimana gambar dapat dibuat dengan ASCII

Orang-orang membuat gambar hanya menggunakan karakter. Ini disebut seni ASCII . Ini wajah mungil yang dibuat dengan karakter ASCII.

:-) Senyum sederhana
(^_^) Wajah ramah
o_O Terkejut

Setiap wajah hanya berupa karakter seperti titik dua, tanda hubung, dan tanda kurung. Tanpa warna atau bentuk. Hanya teks.

Sejarah singkat, dengan kata-kata sederhana

ASCII berkembang dari teletype dan komputer-komputer awal. Pada tahun 1963, versi pertama disepakati. Versi ini membantu banyak mesin berbeda berkomunikasi satu sama lain. Dengan satu kode yang sama, huruf seperti A berarti angka yang sama di mana-mana. Hal ini memudahkan pengiriman pesan dan pencetakan teks.

Ketika ASCII tidak cukup

ASCII hanya memiliki 128 item. Itu tidak cukup untuk semua bahasa. ASCII tidak dapat menampilkan aksara Cina, Hindi, Arab, atau banyak aksara lainnya. ASCII tidak dapat menampilkan emoji. ASCII juga tidak dapat menampilkan banyak simbol matematika dan musik. Untuk ini, kami menggunakan Unicode. Unicode dapat menampilkan banyak aksara dan simbol. UTF-8 adalah cara untuk menyimpannya. Kabar baiknya adalah semua teks ASCII berfungsi di dalam UTF-8. Jadi, sistem modern dapat membaca ASCII lama dengan mudah.

Bagaimana aplikasi menangani ASCII saat ini

Kebanyakan aplikasi membutuhkan UTF-8. Namun, ketika sebuah berkas hanya memiliki huruf dan simbol ASCII, tampilannya tetap sama dengan UTF-8. Para programmer menyukai format ini karena lebih sederhana. Halaman web, API, dan banyak alat menggunakan UTF-8, yang sudah menyertakan ASCII tanpa perubahan.

Fakta angka kecil dan matematika yang ramah

ASCII adalah himpunan 7-bit. Artinya, terdapat hingga \(2^7 = 128\) karakter berbeda. Himpunan yang diperluas dengan 8 bit memiliki \(2^8 = 256\) . Jika teks Anda hanya memiliki karakter ASCII, dan terdapat \(n\) karakter, maka teks tersebut menggunakan \(n\) byte. Dalam pesan singkat seperti OK , \(n = 2\) Jadi, teks tersebut menggunakan 2 byte ketika disimpan sebagai ASCII atau UTF-8.

Melihat karakter tersembunyi

Beberapa item ASCII melakukan tindakan dan tidak dicetak. Spasi mencetak kosong. Namun, LF dan CR memindahkan kursor. TAB melompat. Ketika kita membuka berkas di editor khusus, LF mungkin ditampilkan sebagai \n. Simbol tersebut bukan bagian dari ASCII itu sendiri. Itu adalah cara editor menampilkan baris baru kepada Anda.

Contoh sederhana yang terasa nyata

Mengetik kata sandi Wi-Fi dengan huruf dan angka menggunakan ASCII untuk simbol-simbol tersebut. Router dan telepon sepakat dengan angka-angka tersebut.
Memberi nama berkas hanya dengan A sampai Z, a sampai z, 0 sampai 9, dan simbol seperti - dan _ membuatnya tetap sederhana dan aman di banyak sistem.
Menulis subjek email hanya dengan huruf dan tanda baca standar memastikan server lama dapat meneruskannya.

Hal-hal yang perlu diperhatikan

Tanda kutip keriting vs. tanda kutip lurus : Teks dari editor yang lebih canggih mungkin menggunakan " ", bukan " ". Tanda kutip lurus adalah ASCII. Tanda kutip keriting tidak. Tanda kutip keriting mungkin tidak ditampilkan dengan benar di alat lama.
Halaman kode yang berbeda : Berkas yang disimpan sebagai Windows-1252 mungkin terlihat salah pada sistem yang mengharapkan ISO-8859-1, atau sebaliknya. Gunakan UTF-8 untuk menghindari hal ini. Teks ASCII saja tidak masalah.
Perbedaan tak terlihat : Spasi (32) dan TAB (9) keduanya tampak seperti celah. Padahal, keduanya adalah karakter yang berbeda. Hal ini penting dalam pemrograman dan berkas data.

Cara perangkat menggunakan ASCII dalam langkah-langkah sederhana

Bayangkan sebuah mesin pembuat label yang mencetak nama. Mesin ini membaca nama sebagai karakter. Mesin ini mengubah setiap karakter menjadi angka ASCII. Mesin ini menyimpan angka-angka tersebut dalam memori. Mesin ini mencetak huruf-huruf dengan mencari cara menggambar setiap angka. Jika memenuhi LF (10), mesin ini pindah ke baris berikutnya sebelum mencetak angka berikutnya.

Membandingkan tiga cara menulis kode satu karakter

Perhatikan kembali karakter '!'. Kita dapat menulis kodenya dalam tiga cara. Desimal: 33. Biner: 00100001. Heksadesimal: 21. Dalam bentuk matematika, \(\;33_{(10)} = 00100001_{(2)} = 21_{(16)}\) . Setiap bentuk memiliki nilai yang sama. Aplikasi memilih bentuk yang mereka butuhkan. Orang sering membaca desimal. Komputer menyukai biner. Heksadesimal adalah cara singkat bagi orang untuk membaca angka biner.

Mengapa ASCII bertahan begitu lama

ASCII kecil dan jelas. Dibuat sejak awal. Banyak perangkat dan protokol dibangun di atasnya. Karena 128 kode Unicode pertama cocok dengan ASCII, rencana ini masih berfungsi hingga saat ini. Inilah mengapa Anda dapat membuka berkas teks yang sangat lama di ponsel atau laptop baru dan melihat huruf yang sama.

Panduan singkat: membaca file pendek

Buka berkas dengan teks Halo . Byte-nya adalah angka ASCII 72 101 108 108 111. Dalam biner, angka-angka tersebut adalah 01001000 01100101 01101100 01101100 01101111. Aplikasi membaca setiap angka dan menampilkan Halo di layar. Jika angka berikutnya adalah 10, aplikasi akan berpindah ke baris baru sebelum menampilkan teks lainnya. Beginilah proses yang sederhana dan stabil ini.

Kapan harus memilih ASCII saja

Ketika Anda membutuhkan dukungan dasar terluas di seluruh peralatan lama dan perangkat sederhana.
Saat Anda menyimpan ID, nama file, atau kode yang hanya menggunakan huruf, angka, tanda hubung, dan garis bawah.
Saat Anda membuat log sederhana dan pesan antarmesin yang tidak memerlukan aksen atau emoji.

Simbol kunci yang sering digunakan orang

Tanda hubung - adalah 45. Garis bawah _ adalah 95. Mereka membantu membuat nama file yang rapi.
Plus + adalah 43. Sama dengan = adalah 61. Banyak URL dan rumus menggunakannya.
Ampersand & adalah 38. Formulir web dan string kueri sering menggunakannya.
Titik dua : adalah 58. Waktu seperti 12:30 menggunakannya.
Pada tanda @ adalah 64. Email user@example.com menggunakannya.

Pemeriksaan cepat ide bit dengan angka kecil

Bayangkan angka 10. Dalam biner, itu adalah 00001010. Dalam desimal, itu adalah sepuluh. Dalam ASCII, 10 adalah LF, baris baris. Ini menunjukkan bagaimana angka yang sama dapat ditampilkan dengan cara yang berbeda. Maknanya berasal dari cara kita menggunakan angka tersebut. Jika kita menyebutnya kode karakter, maka 10 berarti LF. Jika kita menyebutnya hanya hitungan apel, maka itu adalah sepuluh apel. Konteks itu penting.

Menggabungkan semuanya dengan satu contoh lagi

Kita akan mengirimkan kata Sun dari satu perangkat ke perangkat lain. Kodenya adalah 'S' 83, 'u' 117, 'n' 110. Dalam biner, 83 adalah 01010011, 117 adalah 01110101, dan 110 adalah 01101110. Bit-bit tersebut bergerak sebagai sinyal On dan Off. Perangkat lain mengubah bit kembali menjadi angka. Kemudian, angka tersebut diubah menjadi huruf. Perangkat ini menampilkan kata Sun. Jika kode berikutnya adalah 32, itu adalah spasi. Jika berikutnya adalah 33, itu adalah '!'. Aturannya tetap sama setiap kali. Itulah kekuatan kode bersama.

bahasa inggris ascii