มันเป็นรูปแบบหนึ่งของการเข้ารหสภาษาไทยนะพี่น้อง เป็นประเภท ascii
ปกติแล้ว(ประเภท ascii)หนึ่งตัวอักษรจะมีขนาด 1 byte = 8 bit = 2
8 = 256 รูปแบบอักษร ยกเว้นพวกที่ภาษามันทีหลายตัวอักษรเช่น จีน ญีปุ่น พวกนี้จะเป็น multibyte อาจจะ 2-4 ไบต์แล้วแต่ภาษา
แล้วทีนี้ 256 แบบอักษรเนี้ย(0-255) 128 ตัวแรกจะเป็นภาษาอังกฤษ 128 ที่เหลือก็จะเป็นไปตามรูปแบบการเข้ารหัส ถ้าภาษาไทยก็จะมี ISO-8859-11, TIS-620, CP874, MacThai windows-874 (เยอะมากๆ แต่จีนเยอะกว่า)
ดังนั้นในไฟล์ๆ นึง ในเว็บๆนึง มันก็จะแสดงได้แค่สองภาษาคือ อังกฤษและอีกภาษาหนึ่งตามรูปแบบการเข้ารหัส
ลองพี่น้อง view source ของหน้าเว็บนี้ก็จะเห็น
<meta http-equiv="Content-Type" content="text/html; charset=tis-620" />
เป็นการบอกว่า เว็บนี้นะ ข้อความในเว็บนี้ใช้รูปแบบ tis-620 นะ
รึพี่น้องอยากรู้ว่าตัวอักษรไทยกรณีที่แสดงในรูปแบบภาษาอื่นๆ จะเป็นยังไง
กรณีที่ใช้ Firefox ก็ลองไปที่ View -> Character Encoding แล้วเลือกที่มันไม่ใช่ tis-620
จะเห็นว่าหน้าเว็บมันจะแปลกๆ และส่วนที่เป็นภาษาอังกฤษยังจะอยู่ดี แต่ส่วนที่เป็นภาษาไทยก็จะเพี้ยนไป
หรือเข้าเว็บ
http://biega.com/special-char.html แล้วลองเปลี่ยน encoding ดู
กลับมาที่ฟอรั่มต่อ
ถ้าพี่น้องสังเกตดูดีๆ ที่ฟอรั่มของเราภาษาอื่นๆ อาหรับ ญีปุ่น ที่ไม่ใช่ไทยมันก็ยังอยู่ดีนิ!!!!
ในการแสดงผลเว็บจะมีคำสั่งหนึ่งให้แสดงผลอักษรพิเศษ (special character)
เช่น copyright TM หรืออักษรอื่นๆ รวมไปถึงภาษาอื่นๆ ด้วย
รปแบบมันก็จะเป็น &#รหัสตัวอักษร; ซึ่งรหัสตัวอกษรนี้จะไปอ้างอิงกับรูปแบบการเข้ารหัสข้อความแบบ Unicode
เช่น حکم الجماع (กระทู้อันโด่งดังของ ILHAM

) ถ้าเรา view source เนี้ยการจัดเก็บก็ไม่ได้เก็บในรูป حکم الجماع แต่
จะเก็บเป็น
حکم الجماع
แทนที่จะเก็บ 1 ไบต์ต่อหนึ่งตัวอักษร แต่ต้องเก็บถึง 6-8 ตัวอักษรทั้งๆ ที่เราจะแสดงแค่ตัวเดียว
เราจะแก้ปัญหานี้ยังไง???
ปล
Mac ไม่ผิด อิอิ
เวลาใช้ windows ก็รู้สึกขัดๆ อยู่นิดๆ
ถนัด ubuntu มากกว่า
ปล2
โพสนี้ใช้เวลานานมากที่สุด เยอะสุด แถมยัง แสดงตัวอย่างไม่ได้อีก ไม่รู้จะพิมพ์ผิดตรงไหนรึปล่าว
#แก้ ใหน เป็น ไหน ขอบคุณก๊ะ nada-yoru