บทที่ 4 ฐานข้อมูลโครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศและระบบสารสนเทศ
ฐานข้อมูลโครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศและระบบสารสนเทศ
Information Technology Infrastructure Database and Information System
Information Technology Infrastructure Database and Information System
การจัดองค์กรและแนวคิด
- ระบบคอมพิวเตอร์จัดข้อมูลในลำดับชั้นที่ขึ้นต้นด้วยบิตและไบต์และดำเนินไปยังเขตข้อมูล ระเบียน ไฟล์ และ ฐานข้อมูล
- บิตแสดงถึงหน่วยข้อมูลที่เล็กที่สุดที่คอมพิวเตอร์สามารถจัดการได้ กลุ่มของบิตที่เรียกว่าไบต์ หมายถึง อักขระเดี่ยวซึ่งอาจเป็นตัวอักษรตัวเลขหรือสัญลักษณ์อื่น การจัดกลุ่มอักขระลงในคำกลุ่มคำหรือจำนวนที่สมบูรณ์ (เช่นชื่อหรืออายุของบุคคล) เรียกว่าฟิลด์ กลุ่มของฟิลด์ที่เกี่ยวข้องเช่น ชื่อนักเรียน หลักสูตรที่เรียน วันที่ และคะแนน รวมถึงระเบียน กลุ่มของระเบียนชนิดเดียวกันเรียกว่าไฟล์
ลำดับชั้นข้อมูล |
ปัญหาเกี่ยวกับสภาพแวดล้อมแบบดั้งเดิม
ความซ้ำซ้อนของข้อมูลและความไม่สอดคล้องกัน
- ความไม่สอดคล้องกันของข้อมูลเป็นแอตทริบิวต์เดียวกันอาจมีค่าที่ต่างกันและยังนำไปสู่ความซ้ำซ้อนของข้อมูล
- ข้อมูลซ้ำซ้อน คือ การปรากฏตัวของข้อมูลที่ซ้ำกันในไฟล์ข้อมูลหลาย ๆ ไฟล์เพื่อให้ข้อมูลเดียวกันถูกจัดเก็บในมากกว่าหนึ่งแห่งหรือสถานที่ซึ่งนำไปสู่แหล่งเก็บข้อมูลขยะ
การประมวลผลไฟล์แบบดั้งเดิม |
การใช้วิธีการแบบดั้งเดิมในการประมวลผลไฟล์ทำให้แต่ละพื้นที่ทำงานใน
บริษัทต่าง ๆ สามารถพัฒนาแอพพลิเคชันเฉพาะได้ แต่ละแอพพลิเคชันต้องการไฟล์ข้อมูลที่ไม่ซ้ำกันซึ่งจะนำไปสู่ข้อมูลซ้ำซ้อนและไม่สอดคล้องกันการประมวลผลความไม่ยืดหยุ่นและการสูญเสียทรัพยากรที่จัดเก็บ
โปรแกรมขึ้นอยู่กับข้อมูล
การพึ่งพาข้อมูลโปรแกรม หมายถึง ความสัมพันธ์ของข้อมูลที่เก็บอยู่ในไฟล์และโปรแกรมเฉพาะที่จำเป็นในการปรับปรุงและดูแลรักษาไฟล์เหล่านั้น
เช่น การเปลี่ยนแปลงในโปรแกรมต้องการการเปลี่ยนแปลงข้อมูลในสภาพแวดล้อมของไฟล์แบบเดิม
การเปลี่ยนแปลงใด ๆ
ในโปรแกรมซอฟต์แวร์อาจต้องมีการเปลี่ยนแปลงข้อมูลที่เข้าถึงโดยโปรแกรมนั้น
ขาดความยืดหยุ่น
ระบบไฟล์แบบดั้งเดิมสามารถส่งรายงานตามกำหนดการตามกำหนดเวลาหลังจากความพยายามในการเขียนโปรแกรมที่กว้างขวาง
แต่ไม่สามารถส่งรายงานเฉพาะกิจหรือตอบสนองต่อความต้องการข้อมูลที่ไม่คาดคิดได้ทันเวลา
ความปลอดภัย
การจัดการข้อมูลอาจไม่มีทางรู้ว่าใครกำลังเข้าถึงหรือเปลี่ยนแปลงข้อมูลขององค์กร
การขาดการแชร์ข้อมูลและความพร้อมใช้งาน
หากผู้ใช้พบค่าที่แตกต่างกันของข้อมูลเดียวกันในระบบสองระบบอาจไม่ต้องการใช้ระบบเหล่านี้เนื่องจากไม่สามารถเชื่อถือความถูกต้องของข้อมูลได้
ฐานข้อมูลและระบบจัดการฐานข้อมูล (Database Management Systems - DBMS)
ฐานข้อมูล คือ ชุดของข้อมูลที่จัดไว้เพื่อรองรับแอพพลิเคชันจำนวนมากได้อย่างมีประสิทธิภาพ
โดยรวบรวมข้อมูลและควบคุมข้อมูลที่ซ้ำซ้อน แทนที่จะจัดเก็บข้อมูลในไฟล์แยกต่างหากสำหรับแต่ละแอพพลิเคชันข้อมูลจะปรากฏแก่ผู้ใช้ว่าถูกเก็บไว้ในที่เดียวเท่านั้น
ฐานข้อมูลเดียวใช้งานได้หลายโปรแกรม
ระบบการจัดการฐานข้อมูล
(DBMS) เป็นซอฟต์แวร์ที่อนุญาตให้องค์กรสามารถรวมข้อมูลจัดการข้อมูลได้อย่างมีประสิทธิภาพและให้การเข้าถึงข้อมูลที่จัดเก็บโดยโปรแกรมประยุกต์
DBMS ทำหน้าที่เป็นส่วนติดต่อระหว่างโปรแกรมประยุกต์กับไฟล์ข้อมูลทางกายภาพ
ฐานข้อมูลทรัพยากรมนุษย์ที่มีหลายมุมมอง |
DBMS ช่วยลดข้อมูลซ้ำซ้อนและไม่สอดคล้องกันโดยทำให้องค์กรสามารถจัดการข้อมูลการใช้และความปลอดภัยจากส่วนกลางได้
การจัดเรียงข้อมูลผ่านองค์กรทำได้ง่ายขึ้นเนื่องจากข้อมูลจะถูกนำเสนอต่อผู้ใช้ว่าอยู่ในตำแหน่งเดียวมากกว่าการแยกส่วนในหลาย
ๆ ระบบและไฟล์
ภาพประกอบที่นี่มีสองมุมมองที่เป็นไปได้ซึ่งเป็นที่สนใจของผู้เชี่ยวชาญด้านประโยชน์และเป็นที่สนใจของสมาชิกในแผนกบัญชีเงินเดือนของบริษัท
ทำไม DBMS เชิงสัมพันธ์จึงมีประสิทธิภาพ
- DBMS ที่ได้รับความนิยมมากที่สุดในปัจจุบันสำหรับเครื่องพีซีเช่นเดียวกับคอมพิวเตอร์ขนาดใหญ่และเมนเฟรมคือ DBMS เชิงสัมพันธ์ ฐานข้อมูลเชิงสัมพันธ์แสดงข้อมูลเป็นตารางสองมิติ (เรียกว่า relations)
- ตารางหรือความสัมพันธ์อาจจะเรียกว่าเป็นไฟล์ แต่ละตารางมีข้อมูลเกี่ยวกับเอนทิตีและแอตทริบิวต์
- Microsoft Access คือ DBMS เชิงสัมพันธ์สำหรับระบบเดสก์ท็อปขณะที่ DB2, Oracle Database และ Microsoft SQL Server เป็น DBMS เชิงสัมพันธ์สำหรับเมนเฟรมขนาดใหญ่และคอมพิวเตอร์ขนาดกลาง MySQL เป็น DBMS โอเพนซอร์สที่ได้รับความนิยม
ตารางฐานข้อมูลเชิงสัมพันธ์ |
ฐานข้อมูลเชิงสัมพันธ์จัดข้อมูลในรูปแบบของตาราง twodimensional ภาพประกอบที่นี่มีตารางสำหรับเอนทิตี SUPPLIER และ PART แสดงวิธีการแสดงแต่ละเอนทิตีและแอตทริบิวต์ Supplier_Number เป็นคีย์หลักสำหรับตาราง SUPPLIER และคีย์ร่วมสำหรับตาราง PART
ฐานข้อมูลเชิงสัมพันธ์และฐานข้อมูลที่ไม่ใช่ข้อมูลในระบบคลาวด์
- กว่า 30 ปีเทคโนโลยีฐานข้อมูลเชิงสัมพันธ์ได้รับมาตรฐานทองคำ
- Cloud computing, ปริมาณข้อมูลที่ไม่เคยมีมาก่อน, ปริมาณงานที่มากสำหรับบริการเว็บบริษัทต่าง ๆ หันมาใช้เทคโนโลยีฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์สำหรับ "NoSQL" เพื่อวัตถุประสงค์นี้
- ระบบจัดการฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์ใช้รูปแบบข้อมูลที่มีความยืดหยุ่นมากขึ้นและได้รับการออกแบบมาสำหรับการจัดการชุดข้อมูลขนาดใหญ่ผ่านเครื่องกระจายหลายเครื่องและสามารถปรับขนาดขึ้นหรือลงได้อย่างง่ายดาย มีประโยชน์สำหรับการเร่งแบบสอบถามที่เรียบง่ายกับข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างรวมทั้งเว็บโซเชียลมีเดียกราฟิกและรูปแบบอื่น ๆ ที่ยากต่อการวิเคราะห์ด้วยเครื่องมือแบบ SQL แบบเดิม
- มีฐานข้อมูล NoSQL หลายแบบซึ่งแต่ละคุณลักษณะและลักษณะทางเทคนิคของตนเอง ฐานข้อมูล Oracle NoSQL เป็นตัวอย่างหนึ่งเช่นเดียวกับ Amazon SimpleDB ซึ่งเป็นหนึ่งใน Amazon Web Services ที่ทำงานในระบบคลาวด์ SimpleDB จัดเตรียมอินเทอร์เฟซ Web services ที่เรียบง่ายเพื่อสร้างและเก็บชุดข้อมูลต่างๆข้อมูลแบบสอบถามได้อย่างง่ายดายและส่งคืนผลลัพธ์ ไม่จำเป็นต้องกำหนดโครงสร้างฐานข้อมูลอย่างเป็นทางการล่วงหน้าหรือเปลี่ยนนิยามนั้นหากมีการเพิ่มข้อมูลใหม่ในภายหลัง
- บริการจัดการข้อมูลบนระบบคลาวด์เป็นพิเศษสำหรับผู้เริ่มต้นใช้งานเว็บที่มุ่งเน้นหรือธุรกิจขนาดเล็กถึงขนาดกลางที่ต้องการความสามารถด้านฐานข้อมูลในราคาที่ต่ำกว่าผลิตภัณฑ์ฐานข้อมูลภายใน
ความสามารถในการจัดการระบบฐานข้อมูล
DBMS มีความสามารถและเครื่องมือในการจัดการจัดการและเข้าถึงข้อมูลในฐานข้อมูล
ที่สำคัญที่สุดคือภาษาคำจำกัดความข้อมูลพจนานุกรมข้อมูลและภาษาการจัดการข้อมูล
การสืบค้นและการรายงาน
DBMS มีเครื่องมือสำหรับการเข้าถึงและจัดการข้อมูลในฐานข้อมูล
ภาษาการจัดการข้อมูลถูกใช้เพื่อเพิ่มแก้ไขลบและดึงข้อมูลในฐานข้อมูล
แผนผังการสร้างแบบแผนและความเป็นสากล (EntityRelationship Diagrams)
การออกแบบฐานข้อมูล
(Database)
- ฐานข้อมูลต้องการทั้งการออกแบบแนวความคิดและการออกแบบทางกายภาพ แนวคิดหรือการออกแบบเชิงตรรกะของฐานข้อมูลเป็นรูปแบบนามธรรมของฐานข้อมูลจากมุมมองทางธุรกิจในขณะที่การออกแบบทางกายภาพแสดงให้เห็นว่าฐานข้อมูลจัดเป็นอย่างไรในอุปกรณ์จัดเก็บข้อมูลเข้าถึงโดยตรง
- การสร้างมาตรฐานเป็นกระบวนการสร้างโครงสร้างข้อมูลที่มีขนาดเล็กมีเสถียรภาพยืดหยุ่นและปรับตัวได้จากกลุ่มข้อมูลที่ซับซ้อนเรียกว่าแผนภาพความสัมพันธ์เอนทิตี
- Entity-Relationship Diagram หรือ ERD เป็นรูปแบบข้อมูลที่นักออกแบบฐานข้อมูลจัดทำเอกสารรูปแบบข้อมูลของตน แผนภาพ ER แสดงความสัมพันธ์ระหว่างเอนทิตีในฐานข้อมูล
ความสัมพันธ์ที่ไม่เป็นปกติสำหรับการสั่งซื้อ |
สร้างตารางการสร้างแบบฟอร์มตามปกติ |
เครื่องมือหลักและเทคโนโลยีสำหรับการเข้าถึงข้อมูลจากฐานข้อมูลเพื่อปรับปรุงประสิทธิภาพและการตัดสินใจทางธุรกิจ
ธุรกิจใช้ฐานข้อมูลเพื่อติดตามธุรกรรมพื้นฐานและต้องมีฐานข้อมูลเพื่อให้ข้อมูลที่จะช่วยให้บริษัทดำเนินธุรกิจได้อย่างมีประสิทธิภาพมากขึ้นและช่วยให้ผู้จัดการและพนักงานสามารถตัดสินใจได้ดียิ่งขึ้น
ข้อมูลส่วนใหญ่ที่รวบรวมโดยองค์กรที่ใช้เป็นข้อมูลการทำธุรกรรมที่สามารถพอดีกับแถวและคอลัมน์ของระบบการจัดการฐานข้อมูลเชิงสัมพันธ์
ข้อมูลเหล่านี้อาจไม่มีโครงสร้างหรือกึ่งโครงสร้างดังนั้นจึงไม่เหมาะสำหรับผลิตภัณฑ์ฐานข้อมูลเชิงสัมพันธ์ที่จัดระเบียบข้อมูลในรูปแบบของคอลัมน์และแถว
ความท้าทายของข้อมูลขนาดใหญ่
- ขณะนี้เราใช้ข้อมูลขนาดใหญ่เพื่ออธิบายชุดข้อมูลเหล่านี้พร้อมกับไดรฟ์ข้อมูลที่ใหญ่เกินกว่าที่ DBMS ทั่วไปจะสามารถจับเก็บและวิเคราะห์ได้
- ข้อมูลขนาดใหญ่มักหมายถึงข้อมูลในช่วงของ petabyte และ exabyte หรือกล่าวอีกนัยหนึ่งคือเป็นล้านล้าน ๆ ระเบียนจากแหล่งต่าง ๆ ข้อมูลขนาดใหญ่ผลิตในปริมาณที่มากขึ้นและมากขึ้นอย่างรวดเร็วกว่าข้อมูลแบบเดิม
- ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เนื่องจากสามารถเปิดเผยรูปแบบและความผิดปกติที่น่าสนใจกว่าชุดข้อมูลขนาดเล็กที่มีศักยภาพในการให้ข้อมูลเชิงลึกใหม่เกี่ยวกับพฤติกรรมของลูกค้า รูปแบบสภาพอากาศ การทำตลาด การเงิน หรือปรากฏการณ์อื่น ๆ
โครงสร้างทางความคิดทางธุรกิจ
คลังข้อมูลและ Data Marts
- คลังข้อมูลเป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและประวัติที่น่าสนใจสำหรับผู้มีอำนาจตัดสินใจทั่วทั้งบริษัทคลังข้อมูลจะดึงข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์จากระบบปฏิบัติการหลายระบบและปรับโครงสร้างข้อมูลเพื่อการรายงานและการวิเคราะห์ด้านการจัดการ
- มาร์กดาต้าคือเซตย่อยของคลังข้อมูลซึ่งข้อมูลข้อมูลขององค์กรที่สรุปหรือเน้นมากจะอยู่ในฐานข้อมูลที่แยกต่างหากสำหรับประชากรเฉพาะของผู้ใช้
Hadoop
Hadoop
เป็นกรอบซอฟต์แวร์โอเพนซอร์สซึ่งได้รับการจัดการโดย
Apache Software Foundation ซึ่งช่วยให้สามารถประมวลผลแบบขนานในปริมาณข้อมูลจำนวนมากทั่วทั้งคอมพิวเตอร์ที่ไม่แพง
แบ่งปัญหาใหญ่ออกเป็นปัญหาย่อยกระจายไปยังโหนดประมวลผลคอมพิวเตอร์ที่มีราคาไม่แพงนับพันรายการและรวมผลลัพธ์ไว้ในชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น
In-Memory
Computing
การประมวลผลในหน่วยความจำช่วยให้ชุดข้อมูลขนาดใหญ่มีขนาดเท่ากับข้อมูลขนาดใหญ่ของข้อมูลหรือคลังข้อมูลขนาดเล็กเพื่อให้อยู่ในหน่วยความจำทั้งหมด
การคำนวณทางธุรกิจแบบซับซ้อนที่ใช้เวลาหลายชั่วโมงหรือวันสามารถทำได้ภายในไม่กี่วินาทีและสามารถทำได้แม้กระทั่งบนอุปกรณ์มือถือ
(ดูเซสชันเชิงโต้ตอบเกี่ยวกับเทคโนโลยี)
โครงสร้างพื้นฐานธุรกิจอัจฉริยะร่วมสมัย |
โครงสร้างพื้นฐานธุรกิจอัจฉริยะร่วมสมัยมีความสามารถและเครื่องมือในการจัดการและวิเคราะห์ข้อมูลจำนวนมากและข้อมูลประเภทต่างๆจากหลายแหล่ง
เครื่องมือค้นหาและการรายงานที่ใช้งานง่ายสำหรับผู้ใช้ทางธุรกิจแบบสบาย ๆ
และเครื่องมือการวิเคราะห์ที่มีความซับซ้อนสำหรับผู้ใช้ที่มีอำนาจสูงจะรวมอยู่ด้วย
เครื่องมือวิเคราะห์ที่มีรายละเอียดมากขึ้นเกี่ยวกับการวิเคราะห์ข้อมูลทางธุรกิจและแอพพลิเคชัน
การประมวลผลแบบออนไลน์ (OLAP)
OLAP สนับสนุนการวิเคราะห์ข้อมูลแบบหลายมิติทำให้ผู้ใช้สามารถดูข้อมูลเดียวกันในรูปแบบต่างๆได้โดยใช้
หลายมิติ
แสดงแบบจำลองหลายมิติที่สามารถสร้างขึ้นเพื่อแสดงผลิตภัณฑ์พื้นที่ยอดขายจริงและยอดขายที่คาดการณ์ได้
|
การทำเหมืองข้อมูล
การทำเหมืองข้อมูลจะให้ข้อมูลเชิงลึกเกี่ยวกับข้อมูลของบริษัทที่ไม่สามารถหาได้จาก
OLAP โดยค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในฐานข้อมูลขนาดใหญ่และอนุมานเกี่ยวกับกฎจากพฤติกรรมเหล่านี้เพื่อคาดการณ์พฤติกรรมในอนาคต
รูปแบบและกฎที่ใช้เพื่อเป็นแนวทางในการตัดสินใจและคาดการณ์ผลของการตัดสินใจเหล่านั้น
จากการทำเหมืองข้อมูล ได้แก่ ความสัมพันธ์ลำดับ การจำแนกประเภทกลุ่มและการคาดการณ์
การทำเหมืองข้อความและการทำเหมืองบนเว็บ
มีเครื่องมือทำเหมืองข้อความเพื่อช่วยให้ธุรกิจสามารถวิเคราะห์ข้อมูลขนาดใหญ่ได้
เครื่องมือเหล่านี้สามารถดึงองค์ประกอบหลักจากชุดข้อมูลขนาดใหญ่ที่ไม่มีโครงสร้างค้นพบรูปแบบและความสัมพันธ์และสรุปข้อมูลได้
การทำเหมืองบนเว็บช่วยให้ธุรกิจเข้าใจถึงพฤติกรรมของลูกค้าประเมินประสิทธิภาพของเว็บไซต์โดยเฉพาะหรือหาจำนวนความสำเร็จของแคมเปญการตลาด
ตัวอย่างเช่นนักการตลาดใช้บริการของ Google เทรนด์และ
Google Insights for Search,
ฐานข้อมูลและเว็บ
หลายบริษัทใช้เว็บเพื่อทำข้อมูลบางอย่างในฐานข้อมูลภายในของตนให้กับลูกค้าและคู่ค้าทางธุรกิจ
ในสภาพแวดล้อมแบบไคลเอ็นต์ / เซิร์ฟเวอร์ DBMS
อยู่บนคอมพิวเตอร์เฉพาะที่เรียกว่าเซิร์ฟเวอร์ฐานข้อมูล DBMS ได้รับการร้องขอ
SQL และให้ข้อมูลที่จำเป็น
มิดเดิ้ลจะโอนข้อมูลจากฐานข้อมูลภายในขององค์กรไปยังเว็บเซิร์ฟเวอร์เพื่อส่งมอบในรูปแบบของเว็บเพจให้กับผู้ใช้
การเชื่อมโยงฐานข้อมูลภายในไปยังเว็บ |
ความคิดเห็น