วันศุกร์ที่ 5 กรกฎาคม พ.ศ. 2556

รหัส ASCII และ UNICODE




รหัส ASCII


          ASCII อ่านว่า แอส-กี้ เป็นรหัสที่พัฒนาขึ้นโดยสถาบัน

มาตรฐานแห่งชาติสหรัฐอเมริกา 

(American National Standard Institute: ANSI อ่านว่า แอน-ซาย) 

เรียกว่าASCII Code ซึ่งเป็นที่

นิยมในกลุ่มผู้สร้างเครื่องคอมพิวเตอร์ทั่วไป รหัสนี้ได้มาจากรหัสขอ

งองค์กรมาตรฐานระหว่างประเทศ

 (International Standardization Organization: ISO) ขนาด 

บิท ซึ่งสามารถสร้างรหัสที่แตกต่าง

กันได้ถึง 128 รหัส (ตั้งแต่ 000 0000 ถึง 111 1111) โดยกำหนด

ให้ 32 รหัสแรกเป็น 000 0000 ถึง

 001 1111 ทำหน้าที่เป็นสั่งควบคุม เช่น รหัส 000 1010 แทนการ

เลื่อนบรรทัด (Line Feed)ใน

เครื่องพิมพ์ เป็นต้น และอีก 96 รหัสถัดไป (32-95) ใช้แทนอักษร

และสัญลักษณ์พิเศษอื่นรหัส ASCII 

ใช้วิธีการกำหนดการแทนรหัสเป็นเลขฐานสิบ ทำให้ง่ายต่อการจำ

และใช้งาน นอกจากนั้นยังสามารถ

เขียนมนรูปของเลขฐานสิบหกได้ด้วย ดังนั้น ASCII Code จึงเป็น

รหัสที่เขียนได้ แบบ

          ASCII เป็นรูปแบบปกติของไฟล์ข้อความ (text file) ใน


คอมพิวเตอร์ และอินเตอร์เน็ต ในไฟล์ ASCII 

อักษรแต่ละตัว ตัวเลข หรืออักษรพิเศษ จะได้รับการแสดงด้วย

ตัวเลขฐานสอง ซึ่งสามารถใช้ระบุตัว

อักษรได้ 128 ตัว

          ระบบ ปฏิบัติการ UNIX และ DOS (ยกเว้น Windows NT
)

 ใช้ ASCII สำหรับไฟล์ข้อความ

 ระบบ Windows NT ใช้รหัสแบบใหม่ คือ Unicode ในระบบ IBM

 390 ใช้รหัส 8 หลัก เรียกว่า 

extended binary-decimal interchange code โปรแกรมแปลง

ยินยอมให้ระบบปฏิบัติที่แตกต่างกัน

แปลงไฟล์จากรหัสหนึ่งเป็น อีกรหัสหนึ่ง





______________________________________________________


 รหัส Unicode 


          ยูนิโค๊ด คือ รหัสคอมพิวเตอร์ใช้แทนตัวอักขระ สามารถใช้


แทน ตัวอักษร,ตัวเลข,สัญลักษณ์ต่างๆ 

ได้มากกว่ารหัสแบบเก่าอย่าง  ASCII ซึ่งเก็บตัวอักษรได้สูงสุดเพียง 

256 ตัว(รูปแบบ) โดย Unicdoe

 รุ่นปัจจุบันสามารถเก็บตัวอักษรได้ถึง 34,168 ตัวจากภาษาทั้งหมด

ทั่วโลก 24 ภาษา โดยไม่สนใจว่า

เป็นแพลตฟอร์มใด ไม่ขึ้นกับโปรแกรมใด หรือภาษาใด unicode ได้

ถูกนำไปใช้โดยผู้นำในอุตสาหกรรม

 เช่น Apple, HP, IBM, Microsoft, Unix ฯลฯ และเป็นแนวทางอย่างเป็นทางการในการทำ ISO /IEC

 10646 ดังนั้น Unicode จึงถือเป็นมาตรฐานในการกำหนดรหัส 

สำหรับทุกตัวอักษร ทุกอักขระ  

unicode ทำให้ข้อมูลสามารถเคลื่อนย้ายไปมาในหลายๆ ระบบ ข้าม

แพลตฟอร์มไปมา หรือข้าม

โปรแกรมได้อย่างสะดวก โดยไร้ข้อจำกัด


Unicode ต่างจาก ASCII 

          คือ ASCII เก็บ byte เดียว แต่ Unicode เก็บ 2 byte ซึ่ง


ข้อมูล 2 byte เก็บข้อมูลได้มากมายมหาศาล 

สามารถเก็บข้อมูลได้มากมายหลายภาษาในโลก 

อย่างภาษาไทยก็อยู่ใน Unicode นี้ด้วยเหมือนกัน ดังนั้นรหัสภาษา


ไทยเอาไปเปิดในภาษาจีน ก็ยัง

เป็นภาษาไทยอยู่ ไม่ออกมาเป็นภาษาจีน เพราะว่ามี code ตายตัว

อยู่ว่า code นี้จองไว้สำหรับภาษา

ไทย แล้ว code ตรงช่วงนั้นเป็นภาษาจีน ตรงโน่นเป็นภาษาญี่ปุ่น จะ

ไม่ใช้ที่ซ้ำกัน เป็นต้น



Unicode คืออะไร ยูนิโค๊ด คือ รหัสคอมพิวเตอร์ ซึ่งใช้แทนตัวอักษร ตัวเลข และ สัญลักษณ์ต่างๆ




______________________________________________________

PANISA    DASSADAJUN


แทนด้วยรหัส ASCII  ดังนี้

P      0101 0000 
A     0100 0001
N     0100 1110
I       0100 1001
S      0101 0011
A     0100 0001 

D     0100 0100 
A     0100 0001
S      0101 0011
S      0101 0011
A     0100 0001
D     0100 0100
A     0100 0001
J      0100 1010
U     0101 0101 
N     0100 1110   

ใช้พื้นที่จัดเก็บจำนวน 136 บิต เท่ากับ 17 ไบต์


ขอบคุณค่ะ

     

______________________________________________________






ไม่มีความคิดเห็น:

แสดงความคิดเห็น