ความรู้ รักออกฤทธิ์ เกร็ดความรู้ สารานุกรม สารานุกรมออนไลน์ ความรู้รอบตัว ความรู้ทั่วไป พจนานุกรม เกมส์

โปรแกรมการเรียงลำดับคำไทย(Thai Sorting), โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) หมายถึง, โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) คือ, โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) ความหมาย, โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) คืออะไร
| เปิดอ่าน 0 | ความคิดเห็น 0

          การเรียงลำดับข้อมูลเป็นการจัดระเบียบให้แก่ข้อมูลเพื่อความสะดวกในการค้นหา  โดยมีลำดับของข้อมูลที่ตายตัว  การกำหนดลำดับดังกล่าวทำได้โดยกำหนดความสัมพันธ์ของข้อมูล  ๒ค่าใดๆ เพื่อพิจารณาลำดับก่อนหลัง  ความสัมพันธ์ดังกล่าวต้องมีคุณสมบัติถ่ายทอดได้ (transitive)กล่าวคือ  ถ้า  a  ถูกกำหนดให้มาก่อน b  และให้ bมาก่อน  c  แล้ว  จะต้องได้ว่า  a  มาก่อน   c  ด้วยในการเรียงลำดับตัวเลขความสัมพันธ์ดังกล่าวแทนได้ด้วยเครื่องหมายน้อยกว่า (<)  นั่นเองส่วนการเรียงลำดับสายอักขระนั้น  จะต้องสร้างฟังก์ชันสำหรับเปรียบเทียบสายอักขระ  เพื่อใช้ในกระบวนวิธีเรียงลำดับต่อไป

          การเรียงลำดับสายอักขระในภาษาต่างๆสามารถทำได้หลายแบบ  เช่น  การเรียงตามการออกเสียง  ซึ่งเห็นได้ในภาษาญี่ปุ่น  การเรียงตามรูปอักษร  ดังตัวอย่างในภาษาอังกฤษ  หรือการเรียงตามรูปอักษรผสมกับการออกเสียง  ดังที่ปรากฏในพจนานุกรมไทยบางเล่ม

          การเรียงลำดับช่วยให้การค้นหาทำได้ง่ายขึ้นไม่ว่าจะเป็นการค้นโดยคอมพิวเตอร์  หรือค้นโดยผู้ใช้ก็ตาม  ตัวอย่างที่เห็นได้อย่างชัดเจนคือ  การค้นหาคำในพจนานุกรม  หรือการค้นหาฐานข้อมูลชื่อต่างๆ  เช่น  ชื่อบุคคล  ชื่อหน่วยงาน  หรือชื่อแฟ้มเอกสาร  เป็นต้น  ถ้าได้จัดเรียงไว้ตามลำดับแล้ว  ก็สามารถประหยัดเวลาในการค้นหาได้ตัวอย่าง  ชื่อบุคคล

หลังจากเรียงลำดับแล้ว  ทำให้ค้นหาไง่ายขึ้น  ดังนี้




การเรียงลำดับอักขระไทย
          การเรียงอักขระไทยโดยทั่วไปจะเรียงตามวิธีที่กำหนดไว้ในพจนานุกรม  ฉบับราช-บัณฑิตยสถาน  ซึ่งเป็นการเรียงตามรูป  ข้อกำหนดในการเรียงลำดับก็คือ
          ๑.  ลำดับของพยัญชนะ  และตัวฤ  ฤา  ฦ  ฦาเรียงไว้ตามรูป  ไม่ใช่ตามเสียง  (ตัวอย่างเช่น หนา  อยู่หมวด   ไม่ใช่หมวด   โดยมีลำดับดังนี้
          ๒.  ลำดับของสระเรียงไว้ตามรูป  ไม่ใช่ตามเสียง  (ตัวอย่างเช่น  รัว   อยู่ในหมวดไม้หันอากาศไม่ใช่หมวดสระ อัว   สังเกตว่า  คำดังกล่าวไม่ได้อยู่ใกล้กับคำว่า รวม   ซึ่งมีเสียง อัว เหมือนกัน)โดยมีลำดับ  ดังนี้
          ๓.  พยัญชนะถือว่ามาก่อนสระเสมอ  เช่นกก   มาก่อน  กะ   และ จริง มาก่อน จะ
          ๔.  ไม่มีการเรียงลำดับตามวรรณยุกต์  เช่นไต้ก๋ง  ไต้ฝุ่น  ไต่ไม้  เรียงลำดับเหมือนเป็นคำว่าไตกง  ไตฝุน  ไตไม   เว้นแต่ในกรณีที่ตัวสะกดและการันต์เหมือนกัน  เช่น   ไต  ไต่  ไต้  ไต๋  หรือกระตุ่น  กระตุ้น   คำที่มีไม้ไต่คู้จะมาก่อนวรรณยุกต์  เช่น เก็ง  เก่ง  เก้ง  เก๋ง

รหัสภาษาไทย
          รหัสภาษาไทยตาม  มอก. ๖๒๐-๒๕๓๓หรือที่เรียกกันว่า  รหัส  สมอ.  นั้น  ได้จัดตัวอักขระให้เรียงอย่างถูกต้องตามข้อ  ๑-๓  ข้างต้น  จึงเอื้ออำนวยต่อการเรียงลำดับสายอักขระภาษาไทยเป็นอย่างดี  อย่างไรก็ตาม  ในการสร้างขั้นตอนวิธียังคงมีประเด็นอีก  ๒  ประเด็น  ที่ต้องพิจารณาเพิ่มเติม  กล่าวคือ
          ๑.  สระหน้าซึ่งเขียนก่อนพยัญชนะต้นได้แก่ เ  แ  โ  ใ  ไ  จะต้องถูกพิจารณาหลังพยัญชนะที่ตามมา  เพราะการเรียงลำดับจะต้องเรียงตามหมวดพยัญชนะต้น  เช่น  เก  ต้องมาก่อน  ขาซึ่งการเปรียบเทียบจะต้องเริ่มที่ กับ  ไม่ใช่กับ  แต่ถ้าพยัญชนะต้นเหมือนกัน  จึงจะพิจารณารูปสระ  เช่น  เก กับ กา  เมื่อพบว่าขึ้นต้นด้วย  เหมือนกัน  จึงจะเปรียบเทียบ กับ   และพบว่าเกอยู่หลัง กา
          ๒.  วรรณยุกต์  ไม้ไต่คู้  และไม้ทัณฑฆาตจะต้องไม่ถูกนำมาพิจารณาในขั้นแรก  แต่ถ้าพบว่า  ตัวสะกดส่วนอื่นเหมือนกันทุกประการ  จึงจะนำมาพิจารณา  เช่น  ในการเปรียบเทียบ  ไต้ก๋งและไต่ไม้จะต้องละเลยวรรณยุกต์  ราวกับเปรียบเทียบ ไตกง  และ  ไตไมและได้ผลว่าไต้ก๋งมาก่อนไต่ไม้  ส่วนในกรณีที่ตัวสะกดส่วนอื่นเหมือนกันทุกประการ  จึงจะพิจารณาวรรณยุกต์ไม้ไต่คู้  และไม้ทัณฑฆาต  เช่น เก่ง  มาก่อน เก้งทั้งนี้ โปรดสังเกตว่า  ตำแหน่งวรรณยุกต์มีความสำคัญเหนือค่าของตัววรรณยุกต์เอง  เช่น แหง่มาก่อน แห่งเพราะจุดที่ต่างกันคือ แห-  แห่-

ขั้นตอนวิธีการเรียงลำดับคำภาษาไทยสำหรับคอมพิวเตอร์
          สำหรับขั้นตอนวิธีการเรียงลำดับคำภาษาไทยสำหรับคอมพิวเตอร์  ได้มีผู้พัฒนาหลายท่านโดยยึดหลักการเรียงตามข้างต้น  ตัวอย่างเช่น
          ๑. D. Londe และอุดม  วโรตมสิกขดิตถ์(พ.ศ. ๒๕๑๒)  ได้เสนอวิธีการแปลงรูปแบบข้อความให้อยู่ในรูปที่สามารถเปรียบเทียบจากซ้ายไปขวาตามปกติได้
          ๒. วิชิต  หล่อจีระชุณห์กุล  (พ.ศ. ๒๕๒๒)ได้ปรับปรุงขั้นตอนวิธีของ Londe  และ  อุดมและนำเสนอเป็รเอกสารประกอบการสัมมนาของสถาบันบัณฑิตพัฒนบริหารศาสตร์
          ๓. ยืน  ภู่วรวรรณ  (พ.ศ. ๒๕๒๙)  ได้นำเสนอขั้นตอนวิธี CTW  ในวารสารไมโครคอม-พิวเตอร์  ฉบับที่  ๒๔  โดยเปรียบเทียบอักขระทีละกลุ่ม  ซึ่งการแบ่งกลุ่มอาศัยพยัญชนะเป็นตัวบอกจุดสิ้นสุด  และมีการแบ่งระดับของน้ำหนักการเปรียบเทียบเป็น  ๓  ระดับ  คือ  พยัญชนะ  สระและวรรณยุกต์  ตามลำดับ
          ๔. สัมพันธ์  คำไทยดี  (พ.ศ. ๒๕๓๕) ได้เสนอฟังก์ชัน tstrcmp ในวารสารคอมพิวเตอร์รีวิวฉบับที่ ๙๑  โดยแบ่งเป็น  ๒  ขั้น  ขั้นแรกเป็นการวิ่งสะสมผลต่างของวรรณยุกต์จนถึงจุดที่ตัวสะกดส่วนอื่นต่างกันหรือจบสายอักขระ  ขั้นที่ ๒เป็นการเปรียบเทียบ  หากเป็นการจบสายอักขระก็สามารถใช้ผลต่างวรรณยุกต์ที่สะสมไว้  หรือตรวจสอบความเป็นส่วนย่อยของสายอักขระได้หากเป็นความต่างกันก่อนจบสายอักขระ  ก็สามารถเปรียบเทียบ ณ จุดต่างได้ทันที  โดยมีการตรวจสอบสระหน้าก่อนทำการเปรียบเทียบที่เหมาะสม
          ๕. เทพพิทักษ์ การุญบุญญานันท์  (พ.ศ.๒๕๔๐)  ได้เสนอสาร NECTEC ฉบับที่  ๑๔ห้เพิ่มส่วนขยายจากกฎการเรียงลำดับคำตามพจนานุกรม  ฉบับราชบัณฑิตยสถาน  กล่าวคือหากมีเครื่องหมายวรรคตอนอื่นกำกับคำด้วยเช่น  ไม้ยมก  (ๆ)  ไปยาลน้อย  (ฯ)  มหัพภาค  (.)ก็จะต้องพิจารณาเครื่องหมายดังกล่าวหลังจากวรรณยุกต์  ไม้ไต่คู้  และไม้ทัณฑฆาต  อีกต่อหนึ่งดังเช่นในลำดับต่อไปนี้  กรุงเทพ  กรุงเทพฯกรุงเทพมหานคร  หรือในลำดับ ครก  ค.ร.ก.  ครบเทพพิทักษ์เสนอให้ใช้วิธีขยายขอบเขตจาก tstrcmpของสัมพันธ์  คำไทยดี

โปรแกรมการเรียงลำดับคำไทย(Thai Sorting), โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) หมายถึง, โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) คือ, โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) ความหมาย, โปรแกรมการเรียงลำดับคำไทย(Thai Sorting) คืออะไร

ร่วมเป็นแฟนเพจเรา บน Facebook..ได้ที่นี่เลย!!

บทความอื่น ของสารานุกรมไทยสำหรับเยาวชนฯ เล่มที่ 25

สารานุกรมเล่มอื่นๆ

คำยอดฮิต

Sanook.commenu