เว็บไซต์    สารบัญเว็บไทย    หางาน   วิดีโอ    เพลง    ข่าว     ความรู้    ถามตอบ    ไฟล์ข้อมูล  
 
หาอะไร  
หาแบบละเอียด
ช่วยเหลือ
 
สมัครสมาชิก

สนุก!ความรู้ > ห้องสมุดความรู้ > สารานุกรม > สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 11 > รหัสตัวอักษรไทยที่ใช้ในระบบคอมพิวเตอร์
รหัสตัวอักษรไทยที่ใช้ในระบบคอมพิวเตอร์  
 

 
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 11
 
รหัสตัวอักษรไทยที่ใช้ในระบบคอมพิวเตอร์ โดย นายยืน ภู่วรวรรณ

          ความสำคัญของรหัสที่จะใช้ในระบบคอมพิวเตอร์นั้นมิได้ใช้สำหรับแทนตัวข้อมูล ที่จะให้คอมพิวเตอร์ประมวลผลแต่เพียงอย่างเดียวเท่านั้น แต่ยังใช้แทนคำสั่งที่จะสั่งให้คอมพิวเตอร์ทำงาน หรือควบคุมระบบการทำงานต่างๆรวมทั้งใช้ในการประมวลผลข้อมูลให้เกิดขึ้นตามความต้องการ
          คอมพิวเตอร์เป็นเทคโนโลยี ที่ได้รับการพัฒนามาจากประเทศทางตะวันตก ซึ่งใช้อักษรละติน ดังนั้นจึงมีผู้กำหนดรูปแบบของตัวอักษรละตินเป็นรหัสที่จะให้คอมพิวเตอร์รับรู้ได้ รหัสที่กำหนดนี้จะต้องเหมาะสมกับการทำงานของคอมพิวเตอร์ที่ใช้หลักการของเลขฐานสอง ดังนั้น จึงกำหนดรหัสแทนตัวอักษรละตินเหล่านั้นเป็นรหัสเลขฐานสองซึ่งมีหลักตัวเลขที่เล็กที่สุดคือ บิต เมื่อนำตัวเลขฐานสองหลายหลักหรือหลายบิตมาประกอบกันเป็นกลุ่มตั้งแต่ ๖, ๗ หรือ ๘ บิต เรียกว่า ไบต์
          รหัสแทนอักษรภาษาละตินที่นิยมใช้กันจริงๆ จนเป็นมาตรฐานใช้กันทั่วโลกมีเพียง ๒ รหัส คือ รหัสแอสกี(ASCII; American standard code for information interchange) และรหัสเอ็บซีดิก (EBCDIC; extended binarycode-decimal interchange code)
          รหัสแอสกีเป็นรหัสที่องค์การระหว่างประเทศว่าด้วยการมาตรฐาน  (International Standard Organization;ISO) กำหนดขึ้น  และใช้กันในระบบคอมพิวเตอร์ทั่วไปโดยใช้อีกชื่อว่า รหัสไอเอสโอ ๖๔๖-๑๙๘๓ (ISO  646-1983) รหัสแอสกีหรือรหัสไอเอสโอ ที่มีเพียง ๗ บิต ในแต่ละประเทศจะใช้แตกต่างกันเล็กน้อย โดยเฉพาะในเรื่องเครื่องหมายพิเศษบางตัว  เช่น อักษรแทนเงินตรา รหัสที่ไอเอสโอกำหนดนี้มีเพียง ๗ บิต   จึงแทนรหัสของตัวอักษรได้  ๒๗ หรือ = ๑๒๘ ตัว โดยกำหนดให้รหัส ๓๒ ตัวแรกคือ ๐๐๐๐๐๐๐ ถึง ๐๐๑๑๑๑๑ เป็นรหัสควบคุม เช่น ส่งเสียงปิ๊บ ปัดแคร่ (CR; carriage return) ขึ้นบรรทัดใหม่(LF; line feed) จบเอกสาร (EOT; end of text) เป็นต้น
          ส่วนรหัสเอ็บซีดิก เป็นรหัสที่มีประวัติความเป็นมาค่อนข้างยาวนาน  และมีรากฐานมาจากการใช้บัตรเจาะรูแบบฮอลเลอริท   โดยมีช่องเจาะอยู่  ๑๒ แถว จัดเป็นแถว ๐ ถึง๙, ๑๑ และ ๑๒ รหัสบนบัตรเจาะรูส่วนที่เป็นแถว ๐ ถึง ๙จะแปลเป็นเลขฐานสองโดยตรง  ซึ่งเรียกรหัสนี้ว่า  บีซีดี(BCD;  binary code decimal) ส่วนแถวที่ ๑๑ และ ๑๒จะได้รับการแปลเป็นเลขฐานสองควบคู่กันไปด้วยแถวละ  ๑ หลัก ผลที่ได้คือ จะได้รหัสที่ประกอบด้วยตัวเลขฐานสอง
๖ บิต หลังจากนั้นก็ได้มีการปรับปรุงขึ้น จนในที่สุดรหัสเอ็บซีดิกได้รับการขยายให้ครบ  ๘ บิต โดยให้มีตัวอักษรตัวเล็กและตัวใหญ่อยู่รวมกัน
          เพื่อให้การแสดงรหัสของคอมพิวเตอร์เป็นที่เข้าใจได้ง่าย การแสดงด้วยการแทนรหัสกับตัวอักษรโดยตรง  จึงไม่เป็นที่นิยมกันนัก  เพราะอ่านลำบาก เปลืองเนื้อที่ และจดจำได้ยาก การแสดงรหัสจึงแสดงในรูปของตาราง ซึ่งถ้าเป็นรหัส ๘ บิต จะแสดงในรูปตารางขนาด ๑๖ x ๑๖ และถ้าเป็นรหัส ๗ บิต จะแสดงในรูปตารางขนาด ๑๖ x ๘ โดยหมายเลขบรรทัด ๐-๑๕ ใช้แทนรหัสเลขท้าย  ๔  บิต (เลข ๔ บิต ได้แก่ ๐๐๐๐ ถึง ๑๑๑๑ มี ๑๖ จำนวน เลขบรรทัดจะ
ใช้เลขฐาน ๑๖  เป็นตัวบอกคือ ๐, ๑, ๒, ๓, ๔, ๕, ๖, ๗, ๘, ๙,A, B, C, D, E และ F) ส่วนหมายเลขสดมภ์ ๐-๗หรือ  ๐-๑๕  ใช้แทนรหัสเลขต้น  ๓  บิต หรือ ๔ บิต(เอ็บซีดิก) กำกับด้วยเลขฐาน ๑๖ เช่นกัน
         เนื่องจากรหัสแอสกีมีเพียง ๗ บิต (แทนตัวอักษรได้๑๒๘ ตัว) เมื่อนำมาใช้แสดงตัวอักษรไทยและอังกฤษ จึงมีความจำเป็นที่จะต้องขยายเพิ่มอีก ๑ บิต เพื่อให้ได้เป็นตารางขนาด  ๑๖ x ๑๖ และแสดงความหมาย โดยถ้าในบิตแรกเป็น ๐ ก็จะคงรหัสแอสกีเดิม และถ้าเป็น ๑ ก็แสดงเป็นรหัสไทย แต่สำหรับรหัสเอ็บซีดิกมีรูปแบบอักษรได้๒๕๖ ตัว จึงสามารถใส่อักษรไทยลงในช่องว่างได้พอ
         สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรมกระทรวงอุตสาหกรรม ได้ดำเนินการกำหนดรหัสมาตรฐานภาษาไทยเพื่อใช้กับงานคอมพิวเตอร์ โดยมีขอบข่ายของการใช้รหัสดังนี้
         ๑. มาตรฐานนี้กำหนดรหัสภาษาไทยเพื่อใช้กับคอมพิวเตอร์ และแลกเปลี่ยนข้อมูล
         ๒. มาตรฐานนี้ครอบคลุมรหัสภาษาไทย ซึ่งแบ่งออกเป็น ๒ กลุ่ม คือ กลุ่มไอเอสโอ ๖๔๖-๑๙๘๓และกลุ่มเอ็บซีดิก 
   
         ๓. มาตรฐานนี้กำหนดเฉพาะตัวอักษรภาษาไทยโดยยึดหลักการไม่เปลี่ยนแปลงรหัสที่องค์การระหว่างประเทศว่าด้วยการมาตรฐานได้กำหนดไว้แล้ว ตามไอเอสโอ ๖๔๖-๑๙๘๓ และเอ็บซีดิก
         การกำหนดรหัสในตารางเพิ่มต่อไอเอสโอ  ๖๔๖-๑๙๘๓ จะดูจากตารางที่มีขนาด ๑๖ x ๑๖ ได้ โดยตำแหน่งของอักษรภาษาไทยเริ่มจากตำแหน่ง A1 (สดมภ์ A แถว ๑)
         การพัฒนาคอมพิวเตอร์ให้สามารถทำงาน และรับส่งข้อมูลตัวอักษรไทยได้นั้น จำเป็นต้องมีการกำหนดรหัสที่ใช้
แทนอักษรไทย ซึ่งได้แก่ ตัวอักษรไทย ตัวเลขไทย  และเครื่องหมายพิเศษที่ใช้สื่อความหมายภาษาไทย จำแนกเป็นกลุ่มได้ดังนี้
         ตัวอักษรไทย ได้แก่
         พยั
ญชนะ ได้แก่ ก  ข  ฃ  ค  ฅ ฆ  ง จ  ฉ  ช  ซ ...... ร  ฤ  ล ฦ  ว  ศ  ษ  ส  ห  ฬ อ  ฮ
        
สระ  ได้แก่      ็  ะ    ั  า   ำ     ิ    ี    ึ    ื   ุ    ู เ  แ โ  ใ  ไ   ํ (นิคหิต)  .  (พินทุ)
        
วรรณยุกต์ ได้แก่   ่     ้     ๊    ๋     ์ (ทัณฑฆาต)
         
ตัวเลขไทย ได้แก่ ๐ ๑ ๒ ๓ ๔ ๕ ๖ ๗ ๘ ๙
         
เครื่องหมายพิเศษ ได้แก่ ๅ  ๆ   ฯ
         
เครื่องหมายพิเศษทั่วไป ได้แก่ ฿ (เครื่องหมายเงินบาท) e (ยามักการ)  ๏  ฟองมัน  ๛  (โคมูตร) และ ๚ (อังคั่นคู่) เป็นต้น
         
รหัสภาษาไทยในตารางเอ็บซีดิกนี้ ใช้วิธีการกำหนด    ให้ไม่ซ้ำกับอักษรตัวใดตัวหนึ่งที่มีอยู่แล้วในตารางเอ็บซีดิกโดยเริ่มต้นตั้งแต่ตำแหน่ง ๔๑


[ดูภาพทั้งหมดในเรื่องนี้]

บรรณานุกรม
• นายยืน ภู่วรวรรณ

[กลับหัวข้อหลัก]
 
ผู้สนับสนุน
อยากเห็นเว็บไซต์ของท่านตรงนี้ คลิกที่นี่
สนุก!ความรู้ > ห้องสมุดความรู้ > สารานุกรม > สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 11 > รหัสตัวอักษรไทยที่ใช้ในระบบคอมพิวเตอร์