Scribe Book - 06
images?q=tbn:ANd9GcTJHDZ9-mgoQZZGeNwdx9TLxG4j-xhRvxGr1syg_Zw6uiJzb0DqdA

Database

Date, Wed 3 July 2013
By, YMBA35-Group6


* Database Content

Database
15AkzL.jpg
Database หรือ ฐานข้อมูล คือ กลุ่มของข้อมูลอิเล็คโทรนิกส์ที่ถูกเก็บรวบรวมไว้ โดยมีความสัมพันธ์ซึ่งกันและกัน ซึ่งประกอบไปด้วยแฟ้มข้อมูล (File) ระเบียน (Record) และ เขตข้อมูล (Field) และถูกจัดการด้วยระบบเดียวกัน โปรแกรมคอมพิวเตอร์จะเข้าไปดึงข้อมูลที่ต้องการได้ อย่างรวดเร็ว ซึ่งข้อมูลที่ถูกเก็บมานั้นจะเรียกว่า “ข้อมูลดิบ” ซึ่งจะต้องมีการแปลงข้อมูลดิบนั้นไปสู่ข้อมูลที่สามารถนำไปใช้งานได้นั้นจำเป็นต้องมีระบบการจัดการฐานข้อมูลมาช่วยเรียก ว่า database management system (DBMS) ซึ่งจะช่วยให้ผู้ใช้สามารถจัดการกับข้อมูล ตามความต้องการได้ ในหน่วยงานใหญ่ๆอาจมีฐานข้อมูลมากกว่า 1 ฐานข้อมูลเช่น ฐานข้อมูลบุคลากร ฐานข้อมูลลูกค้า ฐานข้อมูลสินค้า เป็นต้น
ประโยชน์ของDatabase
1. สามารถเก็บข้อมูลมากๆได้อย่างมีประสิทธิภาพ โดยการลดการเก็บข้อมูลที่ซ้ำซ้อน ข้อมูลบางชุดที่อยู่ในรูปของแฟ้มข้อมูลอาจมีปรากฏอยู่หลาย ๆ แห่งใช้ระบบฐานข้อมูลแล้วจะช่วยให้ความซ้ำซ้อนของข้อมูลลดน้อยลง
2. รักษาความถูกต้องของข้อมูล เนื่องจากฐานข้อมูลมีเพียงฐานข้อมูลเดียว ในกรณีที่มีข้อมูลชุดเดียวกันปรากฏอยู่หลายแห่งในฐานข้อมูล ข้อมูลเหล่านี้จะต้องตรงกัน ถ้ามีการแก้ไขข้อมูลนี้ทุก ๆ แห่งที่ข้อมูลปรากฏอยู่จะแก้ไขให้ถูกต้องตามกันหมดโดยอัตโนมัติด้วยระบบ จัดการฐานข้อมูล
3. การป้องกันและรักษาความปลอดภัยให้กับข้อมูลทำได้อย่างสะดวก โดยจะให้เฉพาะผู้ที่เกี่ยวข้องเท่านั้นที่จะเข้าสู่ข้อมูลได้ ซึ่งก่อให้เกิดความปลอดภัย(security) ของข้อมูลด้วย
Database Management System(DBMS)

DBMS คือ ระบบการจัดการฐานข้อมูล หรือ ซอฟต์แวร์ที่ดูแลจัดการเกี่ยวกับฐานข้อมูล โดยอำนวยความสะดวกให้แก่ผู้ใช้ทั้งในด้านการสร้าง การปรับปรุงแก้ไข ระบบจัดการฐานข้อมูลที่นิยมใช้กันในปัจจุบันเช่น Oracle,IBM DB2,Microsoft SQL Server, Sybase, Cache, PostgreSQL, Progress, MySQL,Interbase, Firebird, Pervasive SQL, SAP DB, Microsoft Office Access, Lotus, Paradox

HierachyOf Data

• Bit ย่อมาจาก Binary Digit ข้อมูลในคอมพิวเตอร์ 1 บิต จะแสดงได้ 2 สถานะคือ 0
หรือ 1 การเก็บข้อมูลต่าง ๆ ได้จะต้องนำ บิต หลาย ๆ บิต มาเรียงต่อกัน
• Byte คือการนำข้อมูลจากบิตมาเรียงต่อกัน การนำ 8บิต มาเรียงเป็น 1 ชุด เรียกว่า 1ไบต์
• Field เกิดจากการนำไบต์ หลาย ๆ ไบต์ มาเรียงต่อกัน เรียกว่า เขตข้อมูล (field)
• Record เมื่อนำเขตข้อมูล หลาย ๆ เขตข้อมูล มาเรียงต่อกัน เรียกว่า ระเบียน (record)
• File การเก็บระเบียนหลาย ๆ ระเบียน รวมกัน เรียกว่า แฟ้มข้อมูล (File)
• Database การจัดเก็บ แฟ้มข้อมูล หลาย ๆ แฟ้มข้อมูล ไว้ภายใต้ระบบเดียวกัน เรียกว่า ฐานข้อมูล
หรือ Database
ปัญหาของแฟ้มข้อมูลระบบดั้งเดิม
1. ซับซ้อน และ ไม่ต่อเนื่อง เช่น มีไฟล์ 2 ไฟล์อยู่ต่าง Folder กัน ถ้ามีการเปลี่ยนแปลงไฟล์ใดไฟล์หนึ่ง ทางระบบจะเกิดความขัดแย้งกัน
2. ขาดความยืดหยุ่นในการใช้งาน ทำให้เกิดความช้าในการทำงานได้
3. ความปลอดภัยต่ำ เนื่องจากในสมัยก่อน การควบคุมข้อมูลเป็นไปได้อย่างยากลำบาก
Entity Relationship Diagram(ER Diagram)
โมเดลข้อมูลเชิงสัมพันธ์ (Entity Relationship Model) หรือ E-R Model เป็นวิธีการแสดงความต้องการสารสนเทศในระบบธุรกิจให้เป็นแผนภาพในขั้นตอนการ วิเคราะห์และออกแบบระบบฐานข้อมูลเน้นตัวข้อมูลที่มีอยู่จริงโดยไม่คำนึงถึง รายละเอียดในการ ติดตั้ง, ความต้องการพิเศษอื่นในแง่การใช้งาน และความเร็วในการสืบค้นข้อมูล จะแสดงข้อมูลในขอบเขตที่ผู้ออกแบบสนใจโดยมีสิ่งที่ต้องกำหนดเป็นพื้นฐานได้ แก่เอนทิตี้, รีเลชั่นชิป, แอททริบิวต์ ในแง่ของ ER-Diagram ประกอบด้วย

1.เอนทิตี้ (Entity)
ส่วนที่ใช้สำหรับเก็บข้อมูลแต่ละรายการภายในระบบที่เราจัดทำอยู่หรือแทนสิ่งที่เราสนใจ ในระบบงานนั้นๆ โดยแต่ละ Entity จำเป็นจะต้องมี Attributeที่เป็น Primary Key ซึ่ง Primary Key เป็นข้อมูลที่ไม่ควรจะมีการนำไปใช้อีกครั้งหนึ่ง

2.แอททริบิวต์ (Attribute)
คือคุณสมบัติต่างๆ ของเอนทิตี้ ซึ่งในแต่ละเอนทิตี้ สามารถมี คุณสมบัติต่างๆ ได้มากมาย ขึ้นอยู่กับว่าเราต้องการจัดเก็บข้อมูลอะไรบ้าง

3.ความสัมพันธ์ (Relationship)
ความสัมพันธ์ของเอนทิตี้คือการอธิบายความสัมพันธ์ระหว่างเอนทิตี้ ว่ามีความสัมพันธ์ของ ข้อมูลกันอย่างไร ใช้สัญลักษณ์สี่เหลี่ยมข้าวหลามตัด และมีเส้นโยง ความสัมพันธ์ระหว่างเอนทิตี้ แบ่งได้เป็น 3 ลักษณะดังต่อไปนี้
1.ความสัมพันธ์แบบหนึ่งต่อหนึ่ง(One to One Relationship)
เป็นความสัมพันธ์ของข้อมูลใน 1 เรคอร์ดในตารางหนึ่งมีความสัมพันธ์กับข้อมูลอย่างมากหนึ่งข้อมูลกับอีก เรคอร์ดในอีกตารางหนึ่งเท่านั้นในลักษณะที่เป็นหนึ่งต่อหนึ่ง

2.ความสัมพันธ์แบบหนึ่งต่อกลุ่ม(One to Many Relationship)
เป็นความสัมพันธ์ของข้อมูลใน 1 เรคอร์ดในตารางหนึ่งมีความสัมพันธ์กับข้อมูลมากกว่าหนึ่งข้อมูลกับอีก เรคอร์ดในอีกตารางหนึ่งเท่านั้นในลักษณะที่เป็นหนึ่งต่อหนึ่ง

3.ความสัมพันธ์แบบกลุ่มต่อกลุ่ม(Many to Many Relationship)
เป็นความสัมพันธ์ของข้อมูลในเรคอร์ดใดๆ ของตารางหนึ่งมีค่าตรงกับข้อมูลของหลายๆ เรคอร์ดในตารางอื่นๆ

ตัวอย่างของ ERD

Component of DBMS
องค์ประกอบหลักของ Database ประกอบด้วย 3 ฟังก์ชั่นหลักๆ
• Data Definition Language (DDL) เป็นภาษาที่ใช้กำหนดโครงสร้างข้อมูลหรือนิยามข้อมูลของฐานข้อมูล (Database Schema) การกำหนดโครงสร้างข้อมูลหรือนิยามข้อมูลเช่นการกำหนดว่าฐานข้อมูลที่สร้างมี ชื่อว่าอะไร มีโครงสร้างประกอบด้วยตาราง (table) แต่ละตารางประกอบด้วย เขตข้อมูลใดบ้าง เขตข้อมูล แต่ละตัวมีประเภทของข้อมูลเป็นอะไร ความกว้างของข้อมูลเท่าใด แต่ละตารางมีอินเด็กซ์ (index) ช่วยในการค้นหาข้อมูลหรือไม่ ถ้ามีจะใช้เขตข้อมูลใดบ้างเป็นคีย์ เป็นต้น
• ภาษาที่ใช้จัดการข้อมูล (Data Manipulation Language : DML) การจัดการข้อมูลหมายถึง การเพิ่มข้อมูลใหม่ลงในฐานข้อมูล, การลบข้อมูลที่มีอยู่ในฐานข้อมูล, การเปลี่ยนแปลงแก้ไขข้อมูลในฐานข้อมูล และการค้นคืนข้อมูลจากฐานข้อมูล
• ภาษาที่ใช้ในการควบคุมข้อมูล (Data Control Language) เป็นภาษาที่ใช้สำหรับควบคุมความถูกต้องและความปลอดภัยของข้อมูล ภาษาในส่วนนี้จะทำหน้าที่ป้องกันการเกิดเหตุการณ์ภาวะพร้อมกันจากการใช้ ข้อมูลในฐานข้อมูลของผู้ใช้หลาย ๆ คน โดยจะควบคุมความถูกต้องของการใช้ข้อมูลรวมถึงการจัดลำดับการใช้ข้อมูลของผู้ ใช้แต่ละคนและตรวจสอบสิทธิ์ในการใช้ข้อมูลนั้นๆ
Database Model

1.The Relational Database Model(ฐานข้อมูลเชิงสัมพันธ์)
- ใช้แสดงความสัมพันธ์ของข้อมูลนั้นเป็นตารางซึ่งเก็บข้อมูลที่มีลักษณะเหมือนกันไว้ และเชื่อมโยงกันด้วย Primary Key

2. The Object-Oriented Database Model (ฐานข้อมูลเชิงวัตถุ)
ฐานข้อมูลแบบลำดับชั้น แบบเครือข่าย และฐานข้อมูลเชิงสัมพันธ์ ล้วนจัดเก็บเฉพาะข้อมูล ไว้ในฐานข้อมูล ส่วนชุดคำสั่งที่ใช้ในการดำเนินการกับฐานข้อมูลจะจัดเก็บไว้ในซอฟแวร์ระบบ จัดการฐานข้อมูลแยกต่างหาก แต่ฐานข้อมูลเชิงวัตถุ จัดเก็บทั้งข้อมูลและชุดคำสั่งไว้ด้วยกัน จึงสามารถใช้งานร่วมกันได้โดยอัตโนมัติ ทำให้ฐานข้อมูลชนิดนี้มีประสิทธิภาพในการจัดเก็บและจัดการ แต่มีการนำมาใช้งานน้อยกว่าฐานข้อมูลเชิงสัมพันธ์ เนื่องจากมีความยุ่งยากซับซ้อนมากกว่า

3. Multidimensional Database (ฐานข้อมูลแบบหลายมิติ)
การวิเคราะห์ข้อมูลในตารางข้อมูลนั้นทำได้ยาก เช่น ต้องการหายอดรวมในฤดูหนาวทุกสายการผลิตและทุกภูมิภาคจากตารางข้อมูลข้างต้น จะทำได้ยากมาก จึงต้องมีการจัดเก็บข้อมูลที่มากกว่า 1 มิติ

4. Database in the Cloud
Cloud Database คือ ฐานข้อมูลที่ทางานบนแพล็ตฟอร์มของคลาวด์คอมพิวติ้ง เช่น Amazon EC2 คลาวด์ดาต้าเบส มีสองวิธีในการดาเนินการดาต้าเบสบนคลาวด์ คือ แบบแรก Virtual Machine Image และแบบ Database as a Service

Database Design
1. การออกแบบฐานข้อมูลในระดับแนวคิด (Conceptual Database Design) เป็นการออกแบบลักษณะโครงสร้างของข้อมูลที่เก็บอยู่ในฐานข้อมูล ว่ามีข้อมูลอะไรบ้าง มีลักษณะประจำ (Attribute) ของข้อมูลอะไร และข้อมูลเหล่านั้นมีความสัมพันธ์กันอย่างไรบ้าง ซึ่งในการออกแบบฐานข้อมูลในระดับนี้ไม่จำเป็นต้องรู้ว่าข้อมูลต่าง ๆ มีวิธีการจัดเก็บอย่างไรในฮาร์ดดิสก์ โดยในระดับนี้จะมี Database Administrator เป็นผู้ออกแบบ
2. การออกแบบฐานข้อมูลในเชิงกายภาพ (Physical Database Design) เป็นการออกแบบที่เน้นในเรื่องของการจัดเก็บข้อมูลที่แท้จริงในฮาร์ดดิสก์ เช่นเก็บข้อมูลเป็นไบต์ (Byte) หรือ เรคคอร์ด (Record)
3. Entity-relationship diagram (ERD) ซึงเป็นวิธีการหาความสัมพันธ์ของข้อมูลระหว่าง Database Entities
4. Normalization : เป็นกระบวนการทำให้ง่ายขึ้น โดยอาจจะย่อให้มีขนาดที่เล็กลง
ระบบฐานข้อมูลแบบรวมศูนย์กลางไว้ด้วยกัน และ แบบกระจายศูนย์รวมข้อมูล
1. รวมข้อมูลไว้ที่ศูนย์กลาง
- ข้อดีคือ ลด Cost
- ข้อเสียคือ อาจเกิดความล่าช้าในการโหลดข้อมูล
2. กระจายข้อมูลออกไป
- เป็นการเพิ่มความปลอดภัยให้กับการเข้าถึงข้อมูล โดยเก็บข้อมูลไว้ที่หนึ่ง และ อีกส่วนหนึ่งคือจะกระจายออกไป partitioned
-
- Replicate คือการทำให้แต่ละแห่งมีสำเนาฐานข้อมูลเป็นของตัวเอง

Data Warehouse

Data Warehouse คือ คลังของข้อมูลที่ผ่านกระบวนการสารสนเทศแล้ว และได้รับการออกแบบมาเพื่อจัดเก็บข้อมูลที่ปริมาณมาก เป็นฐานข้อมูลขนาดใหญ่ที่เก็บรวบรวมข้อมูลจากหลายแหล่งขององค์กรทั้งหมด ตั้งแต่อดีตจนถึงปัจจุบันโดยข้อมูลที่เก็บจะต้องเป็นข้อมูลสารสนเทศ (Data Information)

ประโยชน์ของ Data Warehouse
1. ช่วยสนับสนุนการรายงานและเชื่อมโยงข้อมูล เพื่อทำให้ตัดสินใจให้เกิดประสิทธิภาพ
2. สามารถเข้าถึงข้อมูลที่สำคัญได้อย่างสะดวกและรวดเร็ว และ สามารถเรียกดูข้อมูลในอดีตได้

Data mining

ดาต้าไมนิ่ง (Data Mining) คือการค้นหาความสัมพันธ์และรูปแบบทั้งหมด ซึ่งมีอยู่จริงในฐานข้อมูลแต่ได้ถูกซ่อนไว้ภายในข้อมูลจำนวนมาก โดยความสัมพันธ์เหล่านี้แสดงให้เห็นถึงความรู้ต่าง ๆ ที่มีประโยชน์ในฐานข้อมูล
ดาต้าไมนิ่งเป็นสาขาที่สามารถดึงความรู้ออกมาจากข้อมูลจำนวนมากที่ถูก เก็บสะสมไว้ในโลกของธุรกิจปัจจุบันบริษัทต่าง ๆ จะพยายามหาเทคนิคที่สามารถนำความสำเร็จมาสู่บริษัท ซึ่งจะทำให้การทำงานไม่เป็นประสิทธิภาพ
Task of data mining

1. การจัดหมวดหมู่ (Classification) เพื่อให้ง่ายต่อการค้นหา
2. การประเมินค่า (Estimation) การประเมินค่าทางธุรกิจอย่างต่อเนื่องจะก่อให้เกิดผลลัพธ์ที่มีประโยชน์กับธุรกิจ
3. การทำนายล่วงหน้า (Prediction) สามารถนำข้อมูลในอดีตมาทำนายอนาคตได้
4. การจัดกลุ่มโดยอาศัยความใกล้ชิด (Affinity Group) การตัดสินใจรวมสิ่งที่สามารถไปด้วยกันเข้าไว้ในกลุ่มเดียวกัน โดยในกลุ่มที่มีความสัมพันธ์เหมือนกๆกัน
5. การรวมตัว (Clustering) เป็นการรวบรวมข้อมูลย่อยๆ แล้วทำการจัดกลุ่ม
6. การบรรยาย (Description) อธิบายความสับสนของฐานข้อมูลในทางที่จะเพิ่มความเข้าใจในส่วนของ ประชากร,ผลิตภัณฑ์, หรือขบวนการให้มากขึ้น

Business intelligence

Business intelligence หรือ BI คือ ซอฟต์แวร์ที่นำข้อมูลที่มีอยู่เพื่อจัดทำรายงานในรูปแบบต่างๆ ที่เหมาะสมกับมุมมองในการวิเคราะห์ แสดงความสัมพันธ์ และทำนายผลลัพธ์ของแนวโน้มที่อาจเกิดขึ้นได้ ตรงตามความต้องการขององค์กร เพื่อประโยชน์ในการวางแผนกลยุทธด้านต่างๆ
องค์ประกอบของ Business Intelligence
จะประกอบไปด้วยระบบข้อมูล และโปรแกรมแอพพลิเคชั่น ด้านการวิเคราะห์ มากมายหลายระบบ ดังนี้
1. Data warehouse : เป็นแหล่งข้อมูล หรือฐานข้อมูลขนาดใหญ่ที่รวบรวมข้อมูลทั้งจากแหล่งข้อมูลภายในและ ภายนอกองค์กร โดยมีรูปแบบและวัตถุประสงค์ในการจัดเก็บข้อมูลซึ่งจำเป็นต้องมีการออกแบบฐาน ข้อมูลให้สอดคล้องกับการนำข้อมูลที่ต้องการนำมาใช้งาน
2. Business analytics : กลุ่มเครื่องมือที่ใช้ดำเนินการค้นหา (mining) และวิเคราะห์ข้อมูลใน data warehouse
3. Business performance management (BPM) : ทางการ monitor และวิเคราะห์ประสิทธิภาพการดำเนินงานนำมาใช้ในการวางแผนและดำเนินกลยุทธ์
4. User interface : ส่วนของผู้ใช้บริการ หรือการเชื่อมต่อกับผู้ใช้งาน เช่น การเขียนรายงาน , Dashboard ที่จะทำหน้าที่ รวบรวมและนำเสนอสารสนเทศในวิธีการที่ง่ายต่อการอ่าน

ประโยชน์ของ BI

- วิเคราะห์การดำเนินงานของบริษัทฯ เพื่อการตัดสินใจด้านการลงทุนสำหรับผู้บริหาร
- วิเคราะห์และวางแผนการขาย / การตลาด เพื่อประเมินช่องทางการจำหน่าย ฯลฯ
- วิเคราะห์สินค้าที่ทำกำไร สูงสุด / ขาดทุนต่ำสุด เพื่อการวางแผนงานด้านการตลาด และการผลิต
- วิเคราะห์ปัจจัยที่มีผลกระทบต่อยอดขายของสินค้า ฯลฯ
- วิเคราะห์ข้อมูลเกี่ยวกับคู่แข่งขัน ฯลฯ

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License