สถาปัตยกรรมข้อมูล
Data architectare
ข้อมูล ทำงานของคอมพิวเตอร์มี 3 ขั้นตอนหลักคือ
  การรับข้อมูลเข้า หรืออินพุต (Input)  การดำเนินการ (Process)
และการนำ ข้อมูลออก หรือเอาต์พุต (Output)  พื้นฐานข้อมูล
ข้อมูลไม่ว่าจะเป็นคาแรกเตอร์ รูปภาพ เสียง หรือข้อมูลในรูปแบบ ต่าง ๆจะต้องสามารถนำเข้าสู่คอม
พิวเตอร์ และแปลงให้อยู่ในรูปแบบที่เหมาะสมด้วยอุปกรณ์อินพุตที่ให้คอมพิวเตอร์
สามารถดำเนินการ จัดเก็บ หรือนำไปใช้ในระบบคอมพิวเตอร์ได้
พื้นฐานข้อมูล
  ข้อมูล ในรูปแบบต่างๆ จะต้องสามารถนำเข้าสู่คอมพิวเตอร์
และแปลงให้อยู่ในรูปแบบที่เหมะสมด้วยอุปกรณ์ อินพุต ที่คอมพิวเตอรืสามาถดำเนินการจัดเก้บ
หรือนำไปใช้ในระบบคอมพิวเตอร์
ฟอร์แมตมาตรฐานของข้อมูล
ฟอร์แมตข้อมูล=มาตรฐาน
คาแรกเตอร์=Unicode, ASCII, EBCDIC
รูปภาพ (บิตแมพ)=GIF (Graphical Image Format),
TIFF (Tagged Image File Format),
PNG (Portable Network Graphics)
รูปภาพ (ออปเจ็กต์)=PostScript, JPEG (Joint Photographic Experts Group).
SWF (Macromedia Flash), SVG (Scalable Vector Graphics)
กราฟิกและฟอนต์=PostScript, TrueType
เสียง=WAV (Waveform Audio), AVI (Audio Visual Interleaved),
MP3 MPEG (Moving Picture Experts Group) (audio layer) 3,
MIDI (Musical Instrument Digital Interface), WMA
เพจ=PDF (Acrobat Portable Document Format),
HTML XML (eXtension Markup Language)
ภาพเคลื่อนไหว=Quicktime, MPEG-2 (Moving Picture Experts Group –2),
RealVideo, WMV
คาแรกเตอร์
ASCII ASCII กับคาแรกเตอร์ภาษาไทยมาตรฐาน สมอ EBCDIC Unicode

การใส่ตัวอักษรจากคีย์บอร์ด

     ตัวอักษรที่ใส่ผ่านคีย์บอร์ดจะถูกแปลง scan code
แล้วส่งเข้าไปสมมุติว่าผู้ใช้งานคีย์ตัวอักษร 3 ตัว “D”, “I”, “R” แล้วกดคีย์ Enter คอมพิวเตอร์จะแปลง
scan code 4 ตัวเป็นโค้ด ASCII ฐานสองเป็น 1000100, 1001001, 1010010, 0001101
การใส่ตัวอักษรจากแหล่งอื่น
- OCR (Optical Character Recognition)
- Barcode Reader
- Magnetic Stripe Reader
- Voice Input
เลขจำนวนเต็ม
- ในระบบเลขฐานสอง สามารถแสดงค่าโดยใช้เลขเพียง 2 ตัวคือ 0 และ 1
โดยอาจจะใช้เครื่องหมาย + และ - รวมทั้งแทนจำนวนทศนิยมได้ เช่น
1000011 = 35 หรือ -1011.0110 = -11.375
- แต่ในคอมพิวเตอร์จะรู้จักเฉพาะเลข 0 และ 1 ไม่สามารถใช้ประโยชน์จากจุดได้ แต่สามารถใช้เครื่อง
หมายลบโดยใช้เงื่อนไขเพิ่มเติม การเก็บข้อมูลจะเป็นการเก็บค่าในรีจิสเตอร์ เช่น ถ้าเป็นขนาด 8 บิต จะได้
    00000000 = 0 00000001 = 1         01000001 = 65      10000001 = 129         10000011 = 131      11111111 = 255         เลขจำนวนเต็มที่ไม่มีเครื่องหมาย
- การเก็บข้อมูลในคอมพิวเตอร์ที่เป็นเลขจำนวนเต็มไม่มีเครื่องหมายจะเก็บเลขฐานสอง ตามจำนวนบิตที่กำหนด เช่น
8 บิต = 256 ค่า (0-255) 16 บิต = 65,536 (0-65,535)
32 บิต = 4,294,967,296 (0-4,294,967,295)
เลขจำนวนเต็มที่มีเครื่องหมาย
- Sign-and-magnitude : คล้ายเลขจำนวนเต็มทั่วไป
แต่บิตซ้ายสุดมป็นบิตเครื่องหมาย 0 หมายถึงจำนวนเต็มบวก และ 1 เป็นจำนวนเต็มลบ
00110101 = +53
10110101 = -53
- 1’s complement : เกิดจากนำเลขจำนวนเต็มฐานสองจำนวนนั้นลบออกจากค่าที่เป็น 1
ทุกบิต เช่น 1’s complement ของ 10110101 คือ
11111111-10110101 = 01001010 หรือ สลับค่าทุกบิตเป็นค่าตรงข้าม
10110101 ---> 01001010
- 2’s complement : เกิดจากบวก 1 เข้ากับบิตขวาสุดของ 1’s complement เช่นหาค่า
2’s complement ของ 10110100 คือค่า 1’s complement ของ 10110100 =
01001011ค่า2’s complement ของ10110100 =01001011+1= 01001100
เลขทศนิยม
- เลขทศนิยม : จำนวนเต็มที่เป็นมาตรฐาน 1 word
ประกอบด้วยเลข 7 ตัวและเครื่องหมายอีก 1 ตัว รูปแบบจะเป็น
SMMMMMMM
โดยที่ S คือ Sign ซึ่งเป็นบิตที่เก็บเครื่องหมาย
M คือ Mantissa ซึ่งเป็นบิตค่าของจำนวนเต็ม
รูปแบบนี้สามารถเก็บค่าจำนวนเต็มในช่วง
–9,999,999 < I < 99,999,999
- เลขทศนิยมที่มีเครื่องหมาย : จะมีบิตเครื่องหมาย 2 บิต รูปแบบจะเป็น SEEMMMMM โดยที่S คือ Sign ซึ่งเป็นบิตที่เก็บเครื่องหมาย
E คือ Exponent ซึ่งเป็นบิตที่เก็บเลขชี้กำลัง
M คือ Mantissa ซึ่งเป็นบิตค่าของจำนวนทศนิยม
- การทำ Normalization : เป็นการกำหนดรูปแบบของเลข
ทศนิยมเพื่อให้เกิดความแม่นยำ โดยการเลื่อนจำนวนไปทางซ้ายโดยการเพิ่มเลข
ชี้กำลังจนกว่า 0 ที่นำหน้าจำนวนนั้นถูกกำจัดออกไป รูปแบบมาตรฐานจะเป็น
.MMMMM x 10EE
เช่น 123.4567 = 123.4567 x 100
= 0.1234567 x 103
= 0.12345 x 103
= 05312345

-เลขทศนิยมในคอมพิวเตอร์ : นำรูปแบบเลขทศนิยมที่มี
เครื่องหมายมาประยุกต์ใช้งาน ถ้าใช้ขนาด 32 บิต
จะใช้บิตเครื่องหมาย 1 บิต,เลขชี้กำลัง 8 บิต
(ใช้ excess-128 ในช่วง 10-128 ถึง 10+127 )
และค่าของจำนวนใช้ 23 บิต (ระหว่าง 10-38 ถึง 10+38)
-เลขทศนิยมตามมาตรฐาน IEEE754 :
มาตรฐานการเก็บจำนวนทศนิยมในคอมพิวเตอร์
-Packed Decimal :
แต่ละเลขฐานสิบจะเก็บในรูปแบบ BCD ที่ใช้ 2 ตัวเลขเป็น 1 ไบต์
ตัวเลขที่มีค่านัยสำคัญสูงสุดจะเก็บไว้ก่อนในบิตที่มีค่ามากของไบต์แรก
เครื่องหมายถูกเก็บอยู่ในบิตที่มีค่าต่ำของไบต์สุดท้าย สามารถเก็บค่า
ได้ถึง 31 ตัวเลขค่าเลขฐานสอง 1100 และ 1101 ใช้แสดง
เครื่องหมาย + และ –ตามลำดับ ส่วนค่า 1111
ใช้เพื่อกำหนดว่าจำนวนนั้นไม่มีเครื่องหมาย
ข้อมูลรูปภาพ
- Raster image --> Bitmap, GIF, JPG
- Vector image --> Graphical object, Object image
- SVG (Scalable Vector Graphics)
- Macromedia Flash
- รูปภาพแบบบิตแมพ
- รูปภาพแบบ GIF
- รูปภาพแบบ Object
- รูปภาพแบบ Postscript
- การแสดงคาแรกเตอร์เป็นรูปภาพ
- รูปภาพแบบวิดีโอ
ข้อมูลเสียง
ข้อมูลที่ถูกบีบอัด
- Lossless
- Lossy
สถาปัตยกรรมคอมพิวเตอร์
เป็นทฤษฎีที่อยู่ฉากหลังของการออกแบบคอมพิวเตอร์
โดยทั่วไปหมายถึง การออกแบบ
•โครงสร้างของหน่วยประมวลผลกลาง
(ซึ่งก็คือ การออกแบบจำนวนรีจิสเตอร์ที่จำเป็น และหน้าที่ที่จำเป็นของ หน่วยควบคุมกับหน่วยประมวลผลตัวเลข)
•ชุดของคำสั่งเครื่อง และการอ้างหน่วยความจำ
•เทคนิคอื่นๆ เช่น การประมวลผลแบบไปป์ไลน์
ประเภทของสถาปัตยกรรมการประมวลผลแบบขนาน ของโปรเซสเซอร์
1.SISD (Single Instruction Single Data stream)
คือ โปรเซสเซอร์ ที่ใช้การประมวลผลด้วยชุดข้อมูลเพียงชุดเดียว และ ทำงานด้วยคำสั่งเดียว ภายใน 1 สัญญาณนาฬิกา
2.MISD (Multiple Instruction Single Data stream)
คือ โปรเซสเซอร์ ที่ใช้การประมวลผลด้วยชุดข้อมูลเพียงชุดเดียว แต่ทำงานด้วยได้หลาย
คำสั่ง ภายใน 1 สัญญาณนาฬิกา มักจะไม่ค่อยมีใครพัฒนาโปรเซสเซอร์แบบนี้
3.SIMD (Single Instruction Multiple Data stream)
คือ โปรเซสเซอร์ที่ใช้การประมวลผลด้วยชุดข้อมูลหลายชุด แต่ทำงานด้วยคำสั่งเดียว ภายใน 1
สัญญาณนาฬิกา และได้ผลลัพธ์หลายชุด ใช้ในโปรเซสเซอร์แบบ Pentium MMX
4.MIMD (Multiple Instruction Multiple Data stream)
คือ โปรเซสเซอร์ที่ใช้การประมวลผลด้วยชุดข้อมูลหลายชุด และทำงานด้วยได้หลายคำสั่ง ภายใน 1 สัญญาณนาฬิกา
RISC (Reduced Instruction- Set Computing หรือชิปที่มีการลดทอนคำสั่ง)
คือ โปรเซสเซอร์ที่มีชุดคำสั่งที่มีรูปแบบและขนาดที่แน่นอน สามารถประ
มวลผลได้ภายใน 1 สัญญาณนาฬิกา การอ้างอิงหน่วยความจำจะใช้คำสั่ง
Load และ Store ที่สามารถอ้างอิงหน่วยความจำได้โดยตรงเท่านั้น
ใช้การอ้างตำแหน่งแบบตรงๆ ง่ายโดยมีรูปแบบจำกัดอยู่ 2 แบบ
คือ 1.แบบอ้างผ่าน Register ( Register Indirect )
Register จะเก็บค่าตำแหน่งไว้ แล้ว ทำการอ้าง
ตำแหน่งนั้นๆผ่าน Register 2.ในแบบ Index
จะเป็นการอ้างตำแหน่งจากค่าคงที่ที่มาในคำสั่งนั้นๆเลย
CISC (Complex Instruction-Set Computing)
คือสถาปัตยกรรมของโปรเซสเซอร์ ที่ใช้คำสั่งซับซ้อนที่มี
ความยาวเปลี่ยนไปตามชนิดของคำสั่ง มีคำสั่งให้ใช้งานมาก
มายทำให้เขียนโปรแกรมง่าย และโปรแกรมมีขนาดเล็ก การ
ทำงานของคำสั่งจะใช้ Microcode โดยคงความเข้ากัน
ได้กับโปรเซสเซอร์รุ่นเก่า ทำให้ไม่ต้องเขียนโปรแกรมใหม่
SMP(Symmetric MultiProcessing)
คือสถาปัตยกรรมของการใช้โปรเซสเซอร์ หลายตัว
ที่ใช้ทรัพยากรของระบบเช่น บัส หน่วยความจำ I/O
ร่วมกัน ไม่สามารถแบ่งเป็น partition ย่อยๆ
ได้ และสมรรถนะของระบบจะลดลงเมื่อใช้โปรเซสเซอร์
มากกว่า 8 ตัว ความสามารถในการขยายสเกลยังจำกัด
แต่สามารถใช้โปรแกรมแบบเดิมได้ไม่ต้องเขียนขึ้นใหม่
การแบ่งกันใช้งานและการติดต่อสื่อสาร
1.Shared-bus topology คือการต่อโปรเซสเซอร์
หลายตัวให้ใช้งาน Frontside บัสเส้นเดียวร่วมกัน แต่มีข้อเสียคือ
จะเกิดคอขวดที่เกิดจากรอคอยการใช้บัสร่วมกัน และทำให้เกิดประจุไฟฟ้าส
ะสมบนบัส ซึ่งจะเกิดการรบกวนสัญญาณข้อมูลซึ่งกันและกัน ทำให้สามารถใช้
โปรเซสเซอร์ ได้สูงสุดไม่เกิน 4 ตัวมีใช้ใน บัส GTL+ ของ
Intel x86 และ บัส MPX ของ SMP G4 (Apple)
2.Point-to-point topology คือการต่อโปรเซสเซอร์
หลายตัวโดยให้โปรเซสเซอร์ แต่ละตัวมี Frontside บัสของตัวเองที่ต่อตรง
ไปยังชุดชิปหลัก จะแก้ปัญหาที่เกิดจากการใช้ Shared-bus topology
ได้ มีใช้ใน บัส EV6 ของ Athlon
Cache Coherence
คือการทำให้ข้อมูลที่มีอยู่ในแคชของโปรเซสเซอร์
ทุกตัวมีความสอดคล้องกับโปรเซสเซอร์ตัวอื่นๆ
1.Snoop คือการจัดการให้แคชของโปร
เซสเซอร์แต่ละตัว คอยฟังว่ามีการร้องขอข้อมูลใน
หน่วยความจำที่โปรเซสเซอร์กำลังใช้งานอยู่ของ
โปรเซสเซอร์ตัวอื่นๆทุกตัวหรือไม่ ซึ่งจะทำให้เกิด
การติดต่อสื่อสารสถานะของข้อมูล เพื่อประสานงาน
การใช้ข้อมูลร่วมกันโดยเกิดข้อขัดแย้งน้อยที่สุด
แต่จะเกิดปัญหาความล่าช้าบนระบบ Shared-bus
เพราะการ snoop จะลด bandwidth
ของบัสที่ใช้งานร่วมกัน แต่ในระบบ point-to-point
จะมี snoop bus ต่างหาก ทำให้แคชสามารถ
ทำงานโดยไม่ต้องไปรบกวนการทำงานของส่วนอื่นๆ
2.Data Intervention คือเทคนิคที่
เพิ่มความเร็วในการประสานการของทำงานของแคช
โดยการที่แคชของโปรเซสเซอร์ต้องการอ่านข้อมูลเดียว
กัน ที่กำลังใช้งานอยู่และเพิ่งจะเริ่มแก้ไข ก็จะส่งสัญ
ญาณบอกโปรเซสเซอร์อีกตัวให้รอรับข้อมูลที่จะส่ง
ไปให้ ไม่ต้องไปขอจากหน่วยความจำหลักให้เสียเวลา
CMP (Cellular MultiProcessing)
คือสถาปัตยกรรมของการใช้โปรเซสเซอร์หลายตัว
ที่ผสมผสานข้อดีของ SMPและ Clustering
เข้าด้วยกัน โดยแบ่งโปรเซสเซอร์ออกเป็นหน่วยเล็กที่เรียก
ว่า subpod (ประกอบด้วย โปรเซสเซอร์ 2 คู่ที่แต่
ละคู่ใช้บัสแยกกัน และ cache แบบ L3 และสามารถ
ใช้ระบบปฏิบัติการของตนเองหรือรวมกันเป็นหน่วยเดียวก็ได้)
ที่ใช้ ทรัพยากรของระบบ (หน่วยความจำ, I/O) ร่วม
กัน การเชื่อมโยงใช้ลักษณะการติดต่อแบบ Crossbar
(เป็นการเชื่อมต่อแบบจุดต่อจุดโดยตรง ที่สามารถกำจัดการขัดข้องที่จุดๆเดียวได้)
สามารถขยายสเกลได้ดีมาก และสามารถใช้โปรแกรมแบบเดิมได้ไม่ต้องเขียนขึ้นใหม่
สถาปัตยกรรมคอมพิวเตอร์
โดยนิยามแล้วคอมพิวเตอร์จะประกอบด้วย
ส่วนประกอบที่สำคัญอยู่ 2 ส่วน ด้วยกัน คือ
1.สถาปัตยกรรม(Computer Architecture) และ
2.ออร์กาไรเซซั่นคอมพิวเตอร์ (Computer organization)
ซึ่งแต่ละส่วนก็จะให้ความหมายอยู่แล้วแต่ว่าเราก็สามารถให้ความ
หมายได้อย่างกว้างๆกับคำสองคำนี้ ซึ่งเป็นที่ยอมรับกันโดยทั่วไปคือ
-สถาปัตยกรรมคอมพิวเตอร์ คือ ลักษณะต่างๆของระบบคอมพิวเตอร์
ที่ผู้ใช้ๆทั่วไปสามารและจะมีผลกระทบต่อการทำงานของคอมพิวเตอร์
-ออร์กาไนเซซั่นคอมพิวเตอร์ คือ การเชื่อมต่อคอมพิวเตอร์ที่มีการคำนึงถึงสถาปัตย
กรรมตัวอย่างทางสถาปัตยกรรมคอมพิวเตอร์ได้แก่ ขั้นตอนการประมวลผลของชุดคำสั่ง
(Instruction Set) จากความสัมพันธ์ของทั้งสองตัวนี้ในการที่
คอมพิวเตอร์ จะทำการประมวล เช่นทำการบวก ลบ คูณ หาร นั้นถือว่าเป็นการทำงาน
ตามขั้นตอนของสถาปัตยกรรม ส่วนขั้นตอนการทำงานด้วยออร์กาไนเซซั่นนั้นจะหมายถึง
ยุดประจุบันนี้จะให้ความสัมพันธ์กับสถาปัตยกรรมและออร์กาไนเซซั่นเป็นอย่างมาก ซึ่งทั้ง
สองอย่างนี้มีความแตกต่างกันแต่ว่ามี ออร์กาไนเซซั่นที่แตกต่างกันอย่างสิ้นเชิง ซึ่งจะเป็นผล
ที่ทำให้ราคาของเครื่องคอมพิวเตอร์มีราคาที่แตกต่างกัน และประสิทธิภาพในการใช้งานไม่เท่า
กันยิ่งกว่านี้ สถาปัตยกรรคอมพิวเตอร์อาจมีการใช้งานหลายๆปี แต่ ออร์กาไนเซซั่นมีการเปลี่ยน
แปลงตามยุคตามเทคโนโลยีที่ผลิต
ตัวอย่างที่เห็นๆกันโดยทั่วไปก็คือ เช่น เครื่องคอมพิวเตอร์ของ IBM system/370
คอมพิวเตอร์ยุคนี้มีการใช้ สถาปัตยกรรมแบบเดียวกันนี้กับ เครื่องคอมพิวเตอร์ หลายๆรุ่นส่งให้กับ
ลูกค้า ลูกค้าที่ต้องการเครื่องที่มีความเร็วไม่สูงมาก อาจจะจ่ายในราคาที่ต่ำ
โครงสร้างและหน้าที่ของคอมพิวเตอร์
-โครงสร้าง คือ วิธีที่อุปกรณ์ ต่างๆเชื่อมต่อเข้าด้วยกัน
-หน้าที่ คือ การทำงานของส่วนประกอบ แต่ละส่วน
ซึ่งถือว่าเป็นส่วนหนึ่งของโครงสร้าง หน้าที่การทำงาน
โดยพื้นฐานของคอมพิวเตอร์แล้วจะประกอบไปด้วย
ส่วนประกอบหลักๆ อยู่ 4 ส่วน ด้วยกัน คือ
1.การประมวลผลข้อมูล (Data processing Facility)
2.ส่วนเก็บข้อมูล (Data Storage Facility)
3.ส่วนเคลื่อนย้ายข้อมูล (Data movement Apparatus)
4.ส่วนการควบคุม (Control mechanism)
สถาปัตยกรรมคอมพิวเตอร์แบบ SMID
  SMID คืออะไร
  SMID คือ Single instruction Multiple Data stream
หรือ กล่าวคือ เป็นการประมวลผลแบบที่มีข้อมูล
เข้ามาหลายๆชุด โดยใช้คำสั่งในการประมวลผล
เพียงชุดคำสั่งเดียว และได้ผลลัพธ์ออกมาหลายๆผล
(เพราะมีหลายชุดข้อมูล)
หน้าแรก
Back
next