สนุก! ค้นหาตรวจหวยข่าว อีเมล์ ดูทีวีออนไลน์ ฟังเพลง คลาสสิฟายด์ ริงโทน เล่นเกมส์ ดูทั้งหมด »
 
  เว็บไซต์    สารบัญเว็บไทย    หางาน   วิดีโอ    เพลง    ข่าว     ความรู้    ถามตอบ    ไฟล์ข้อมูล  
 
 
หาแบบละเอียด
ช่วยเหลือ


สนุก!ความรู้ > ห้องสมุดความรู้ > สารานุกรม > สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 25 > โปรแกรมการเรียงลำดับคำไทย(Thai Sorting)
โปรแกรมการเรียงลำดับคำไทย(Thai Sorting)  
 

 
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 25
 
โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) โดย ไม่มีผู้แต่ง

          การเรียงลำดับข้อมูลเป็นการจัดระเบียบให้แก่ข้อมูลเพื่อความสะดวกในการค้นหา  โดยมีลำดับของข้อมูลที่ตายตัว  การกำหนดลำดับดังกล่าวทำได้โดยกำหนดความสัมพันธ์ของข้อมูล  ๒ค่าใดๆ เพื่อพิจารณาลำดับก่อนหลัง  ความสัมพันธ์ดังกล่าวต้องมีคุณสมบัติถ่ายทอดได้ (transitive)กล่าวคือ  ถ้า  a  ถูกกำหนดให้มาก่อน b  และให้ bมาก่อน  c  แล้ว  จะต้องได้ว่า  a  มาก่อน   c  ด้วยในการเรียงลำดับตัวเลขความสัมพันธ์ดังกล่าวแทนได้ด้วยเครื่องหมายน้อยกว่า (<)  นั่นเองส่วนการเรียงลำดับสายอักขระนั้น  จะต้องสร้างฟังก์ชันสำหรับเปรียบเทียบสายอักขระ  เพื่อใช้ในกระบวนวิธีเรียงลำดับต่อไป

          การเรียงลำดับสายอักขระในภาษาต่างๆสามารถทำได้หลายแบบ  เช่น  การเรียงตามการออกเสียง  ซึ่งเห็นได้ในภาษาญี่ปุ่น  การเรียงตามรูปอักษร  ดังตัวอย่างในภาษาอังกฤษ  หรือการเรียงตามรูปอักษรผสมกับการออกเสียง  ดังที่ปรากฏในพจนานุกรมไทยบางเล่ม

          การเรียงลำดับช่วยให้การค้นหาทำได้ง่ายขึ้นไม่ว่าจะเป็นการค้นโดยคอมพิวเตอร์  หรือค้นโดยผู้ใช้ก็ตาม  ตัวอย่างที่เห็นได้อย่างชัดเจนคือ  การค้นหาคำในพจนานุกรม  หรือการค้นหาฐานข้อมูลชื่อต่างๆ  เช่น  ชื่อบุคคล  ชื่อหน่วยงาน  หรือชื่อแฟ้มเอกสาร  เป็นต้น  ถ้าได้จัดเรียงไว้ตามลำดับแล้ว  ก็สามารถประหยัดเวลาในการค้นหาได้ตัวอย่าง  ชื่อบุคคล

หลังจากเรียงลำดับแล้ว  ทำให้ค้นหาไง่ายขึ้น  ดังนี้








[ดูภาพทั้งหมดในเรื่องนี้]

หัวข้อ

การเรียงลำดับอักขระไทย
          การเรียงอักขระไทยโดยทั่วไปจะเรียงตามวิธีที่กำหนดไว้ในพจนานุกรม  ฉบับราช-บัณฑิตยสถาน  ซึ่งเป็นการเรียงตามรูป  ข้อกำหนดในการเรียงลำดับก็คือ
          ๑.  ลำดับของพยัญชนะ  และตัวฤ  ฤา  ฦ  ฦาเรียงไว้ตามรูป  ไม่ใช่ตามเสียง  (ตัวอย่างเช่น หนา  อยู่หมวด   ไม่ใช่หมวด   โดยมีลำดับดังนี้
          ๒.  ลำดับของสระเรียงไว้ตามรูป  ไม่ใช่ตามเสียง  (ตัวอย่างเช่น  รัว   อยู่ในหมวดไม้หันอากาศไม่ใช่หมวดสระ อัว   สังเกตว่า  คำดังกล่าวไม่ได้อยู่ใกล้กับคำว่า รวม   ซึ่งมีเสียง อัว เหมือนกัน)โดยมีลำดับ  ดังนี้
          ๓.  พยัญชนะถือว่ามาก่อนสระเสมอ  เช่นกก   มาก่อน  กะ   และ จริง มาก่อน จะ
          ๔.  ไม่มีการเรียงลำดับตามวรรณยุกต์  เช่นไต้ก๋ง  ไต้ฝุ่น  ไต่ไม้  เรียงลำดับเหมือนเป็นคำว่าไตกง  ไตฝุน  ไตไม   เว้นแต่ในกรณีที่ตัวสะกดและการันต์เหมือนกัน  เช่น   ไต  ไต่  ไต้  ไต๋  หรือกระตุ่น  กระตุ้น   คำที่มีไม้ไต่คู้จะมาก่อนวรรณยุกต์  เช่น เก็ง  เก่ง  เก้ง  เก๋ง

[กลับหัวข้อหลัก]

ตัวอย่างการเรียงลำดับคำไทยตามตัวอักษรของโปรแกรมพจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ. ๒๕๒๕




ตัวอย่างการเรียงลำดับคำไทยตามตัวอักษรของโปรแกรมพจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ. ๒๕๒๕

[ดูภาพทั้งหมดในเรื่องนี้]
รหัสภาษาไทย
          รหัสภาษาไทยตาม  มอก. ๖๒๐-๒๕๓๓หรือที่เรียกกันว่า  รหัส  สมอ.  นั้น  ได้จัดตัวอักขระให้เรียงอย่างถูกต้องตามข้อ  ๑-๓  ข้างต้น  จึงเอื้ออำนวยต่อการเรียงลำดับสายอักขระภาษาไทยเป็นอย่างดี  อย่างไรก็ตาม  ในการสร้างขั้นตอนวิธียังคงมีประเด็นอีก  ๒  ประเด็น  ที่ต้องพิจารณาเพิ่มเติม  กล่าวคือ
          ๑.  สระหน้าซึ่งเขียนก่อนพยัญชนะต้นได้แก่ เ  แ  โ  ใ  ไ  จะต้องถูกพิจารณาหลังพยัญชนะที่ตามมา  เพราะการเรียงลำดับจะต้องเรียงตามหมวดพยัญชนะต้น  เช่น  เก  ต้องมาก่อน  ขาซึ่งการเปรียบเทียบจะต้องเริ่มที่ กับ  ไม่ใช่กับ  แต่ถ้าพยัญชนะต้นเหมือนกัน  จึงจะพิจารณารูปสระ  เช่น  เก กับ กา  เมื่อพบว่าขึ้นต้นด้วย  เหมือนกัน  จึงจะเปรียบเทียบ กับ   และพบว่าเกอยู่หลัง กา
          ๒.  วรรณยุกต์  ไม้ไต่คู้  และไม้ทัณฑฆาตจะต้องไม่ถูกนำมาพิจารณาในขั้นแรก  แต่ถ้าพบว่า  ตัวสะกดส่วนอื่นเหมือนกันทุกประการ  จึงจะนำมาพิจารณา  เช่น  ในการเปรียบเทียบ  ไต้ก๋งและไต่ไม้จะต้องละเลยวรรณยุกต์  ราวกับเปรียบเทียบ ไตกง  และ  ไตไมและได้ผลว่าไต้ก๋งมาก่อนไต่ไม้  ส่วนในกรณีที่ตัวสะกดส่วนอื่นเหมือนกันทุกประการ  จึงจะพิจารณาวรรณยุกต์ไม้ไต่คู้  และไม้ทัณฑฆาต  เช่น เก่ง  มาก่อน เก้งทั้งนี้ โปรดสังเกตว่า  ตำแหน่งวรรณยุกต์มีความสำคัญเหนือค่าของตัววรรณยุกต์เอง  เช่น แหง่มาก่อน แห่งเพราะจุดที่ต่างกันคือ แห-  แห่-

[กลับหัวข้อหลัก]


[ดูภาพทั้งหมดในเรื่องนี้]
ขั้นตอนวิธีการเรียงลำดับคำภาษาไทยสำหรับคอมพิวเตอร์
          สำหรับขั้นตอนวิธีการเรียงลำดับคำภาษาไทยสำหรับคอมพิวเตอร์  ได้มีผู้พัฒนาหลายท่านโดยยึดหลักการเรียงตามข้างต้น  ตัวอย่างเช่น
          ๑. D. Londe และอุดม  วโรตมสิกขดิตถ์(พ.ศ. ๒๕๑๒)  ได้เสนอวิธีการแปลงรูปแบบข้อความให้อยู่ในรูปที่สามารถเปรียบเทียบจากซ้ายไปขวาตามปกติได้
          ๒. วิชิต  หล่อจีระชุณห์กุล  (พ.ศ. ๒๕๒๒)ได้ปรับปรุงขั้นตอนวิธีของ Londe  และ  อุดมและนำเสนอเป็รเอกสารประกอบการสัมมนาของสถาบันบัณฑิตพัฒนบริหารศาสตร์
          ๓. ยืน  ภู่วรวรรณ  (พ.ศ. ๒๕๒๙)  ได้นำเสนอขั้นตอนวิธี CTW  ในวารสารไมโครคอม-พิวเตอร์  ฉบับที่  ๒๔  โดยเปรียบเทียบอักขระทีละกลุ่ม  ซึ่งการแบ่งกลุ่มอาศัยพยัญชนะเป็นตัวบอกจุดสิ้นสุด  และมีการแบ่งระดับของน้ำหนักการเปรียบเทียบเป็น  ๓  ระดับ  คือ  พยัญชนะ  สระและวรรณยุกต์  ตามลำดับ
          ๔. สัมพันธ์  คำไทยดี  (พ.ศ. ๒๕๓๕) ได้เสนอฟังก์ชัน tstrcmp ในวารสารคอมพิวเตอร์รีวิวฉบับที่ ๙๑  โดยแบ่งเป็น  ๒  ขั้น  ขั้นแรกเป็นการวิ่งสะสมผลต่างของวรรณยุกต์จนถึงจุดที่ตัวสะกดส่วนอื่นต่างกันหรือจบสายอักขระ  ขั้นที่ ๒เป็นการเปรียบเทียบ  หากเป็นการจบสายอักขระก็สามารถใช้ผลต่างวรรณยุกต์ที่สะสมไว้  หรือตรวจสอบความเป็นส่วนย่อยของสายอักขระได้หากเป็นความต่างกันก่อนจบสายอักขระ  ก็สามารถเปรียบเทียบ ณ จุดต่างได้ทันที  โดยมีการตรวจสอบสระหน้าก่อนทำการเปรียบเทียบที่เหมาะสม
          ๕. เทพพิทักษ์ การุญบุญญานันท์  (พ.ศ.๒๕๔๐)  ได้เสนอสาร NECTEC ฉบับที่  ๑๔ห้เพิ่มส่วนขยายจากกฎการเรียงลำดับคำตามพจนานุกรม  ฉบับราชบัณฑิตยสถาน  กล่าวคือหากมีเครื่องหมายวรรคตอนอื่นกำกับคำด้วยเช่น  ไม้ยมก  (ๆ)  ไปยาลน้อย  (ฯ)  มหัพภาค  (.)ก็จะต้องพิจารณาเครื่องหมายดังกล่าวหลังจากวรรณยุกต์  ไม้ไต่คู้  และไม้ทัณฑฆาต  อีกต่อหนึ่งดังเช่นในลำดับต่อไปนี้  กรุงเทพ  กรุงเทพฯกรุงเทพมหานคร  หรือในลำดับ ครก  ค.ร.ก.  ครบเทพพิทักษ์เสนอให้ใช้วิธีขยายขอบเขตจาก tstrcmpของสัมพันธ์  คำไทยดี

[กลับหัวข้อหลัก]


[ดูภาพทั้งหมดในเรื่องนี้]

บรรณานุกรม
• A First Course in Database System
• Advances in Knowledge Discovery and Data Mining
• An Introduction to Database Systems
• Data Mining
• Database Management

[กลับหัวข้อหลัก] [ดูบรรณานุกรมทั้งหมดในเรื่องนี้]
 

บทความอื่น ๆ ของสารานุกรมไทยสำหรับเยาวชนฯ  
 
บทความอื่น ของสารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 25 สารานุกรมไทยสำหรับเยาวชนฯ เล่มอื่น
การพัฒนาซอฟต์แวร์
การให้บริการแบบหลายคนพร้อมกัน
บุคลากรที่เกี่ยวข้องกับงานระบบ
ประวัติความเป็นมาของระบบฐานข้อมูล
โปรแกรมในกลุ่ม Accessories
ฟังก์ชันพิเศษในการจัดการฐานข้อมูล
ภาษาที่สนับสนุนโปรแกรม
ระบบปฏิบัติการวินโดวส์ ๙๕
ลำดับรุ่นเครื่องคอมพิวเตอร์
วิวัฒนาการของความเร็วและสมรรถภาพของไมโครคอมพิวเตอร์
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 5
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 9
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 15
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 16
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 22
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 23
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 24
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 25
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 27
สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 28
   

ผู้สนับสนุน
สนใจลงโฆษณา คลิก!

สนุก!ความรู้ > ห้องสมุดความรู้ > สารานุกรม > สารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 25 > โปรแกรมการเรียงลำดับคำไทย(Thai Sorting)