บทที่ 4 ฐานข้อมูลโครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศและระบบสารสนเทศ


ฐานข้อมูลโครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศและระบบสารสนเทศ
Information Technology  Infrastructure  Database and  Information System


การจัดองค์กรและแนวคิด

  • ระบบคอมพิวเตอร์จัดข้อมูลในลำดับชั้นที่ขึ้นต้นด้วยบิตและไบต์และดำเนินไปยังเขตข้อมูล ระเบียน ไฟล์ และ ฐานข้อมูล
  •         บิตแสดงถึงหน่วยข้อมูลที่เล็กที่สุดที่คอมพิวเตอร์สามารถจัดการได้ กลุ่มของบิตที่เรียกว่าไบต์ หมายถึง อักขระเดี่ยวซึ่งอาจเป็นตัวอักษรตัวเลขหรือสัญลักษณ์อื่น การจัดกลุ่มอักขระลงในคำกลุ่มคำหรือจำนวนที่สมบูรณ์ (เช่นชื่อหรืออายุของบุคคล) เรียกว่าฟิลด์ กลุ่มของฟิลด์ที่เกี่ยวข้องเช่น ชื่อนักเรียน หลักสูตรที่เรียน วันที่ และคะแนน รวมถึงระเบียน กลุ่มของระเบียนชนิดเดียวกันเรียกว่าไฟล์
ลำดับชั้นข้อมูล

       ระบบคอมพิวเตอร์จัดข้อมูลในลำดับชั้นที่ขึ้นต้นด้วยบิตซึ่งหมายถึง 0 หรือ 1 บิตสามารถจัดกลุ่มเป็นไบต์เพื่อแสดงอักขระหมายเลขหรือสัญลักษณ์หนึ่งตัวได้ ไบต์สามารถจัดกลุ่มเป็นแบบฟอร์มฟิลด์และฟิลด์ที่เกี่ยวข้องสามารถจัดกลุ่มเป็นแบบฟอร์มได้ ระเบียนที่เกี่ยวข้องสามารถทำให้เกิดรูปแบบแฟ้มและไฟล์ที่เกี่ยวข้องสามารถจัดเป็นฐานข้อมูลได้

ปัญหาเกี่ยวกับสภาพแวดล้อมแบบดั้งเดิม


ความซ้ำซ้อนของข้อมูลและความไม่สอดคล้องกัน

  • ความไม่สอดคล้องกันของข้อมูลเป็นแอตทริบิวต์เดียวกันอาจมีค่าที่ต่างกันและยังนำไปสู่ความซ้ำซ้อนของข้อมูล
  • ข้อมูลซ้ำซ้อน คือ การปรากฏตัวของข้อมูลที่ซ้ำกันในไฟล์ข้อมูลหลาย ๆ ไฟล์เพื่อให้ข้อมูลเดียวกันถูกจัดเก็บในมากกว่าหนึ่งแห่งหรือสถานที่ซึ่งนำไปสู่แหล่งเก็บข้อมูลขยะ
การประมวลผลไฟล์แบบดั้งเดิม

   การใช้วิธีการแบบดั้งเดิมในการประมวลผลไฟล์ทำให้แต่ละพื้นที่ทำงานใน บริษัทต่าง ๆ สามารถพัฒนาแอพพลิเคชันเฉพาะได้ แต่ละแอพพลิเคชันต้องการไฟล์ข้อมูลที่ไม่ซ้ำกันซึ่งจะนำไปสู่ข้อมูลซ้ำซ้อนและไม่สอดคล้องกันการประมวลผลความไม่ยืดหยุ่นและการสูญเสียทรัพยากรที่จัดเก็บ

โปรแกรมขึ้นอยู่กับข้อมูล
    การพึ่งพาข้อมูลโปรแกรม หมายถึง ความสัมพันธ์ของข้อมูลที่เก็บอยู่ในไฟล์และโปรแกรมเฉพาะที่จำเป็นในการปรับปรุงและดูแลรักษาไฟล์เหล่านั้น เช่น การเปลี่ยนแปลงในโปรแกรมต้องการการเปลี่ยนแปลงข้อมูลในสภาพแวดล้อมของไฟล์แบบเดิม การเปลี่ยนแปลงใด ๆ ในโปรแกรมซอฟต์แวร์อาจต้องมีการเปลี่ยนแปลงข้อมูลที่เข้าถึงโดยโปรแกรมนั้น
ขาดความยืดหยุ่น
      ระบบไฟล์แบบดั้งเดิมสามารถส่งรายงานตามกำหนดการตามกำหนดเวลาหลังจากความพยายามในการเขียนโปรแกรมที่กว้างขวาง แต่ไม่สามารถส่งรายงานเฉพาะกิจหรือตอบสนองต่อความต้องการข้อมูลที่ไม่คาดคิดได้ทันเวลา
ความปลอดภัย
      การจัดการข้อมูลอาจไม่มีทางรู้ว่าใครกำลังเข้าถึงหรือเปลี่ยนแปลงข้อมูลขององค์กร
การขาดการแชร์ข้อมูลและความพร้อมใช้งาน
      หากผู้ใช้พบค่าที่แตกต่างกันของข้อมูลเดียวกันในระบบสองระบบอาจไม่ต้องการใช้ระบบเหล่านี้เนื่องจากไม่สามารถเชื่อถือความถูกต้องของข้อมูลได้

ฐานข้อมูลและระบบจัดการฐานข้อมูล (Database Management Systems - DBMS)


     ฐานข้อมูล คือ ชุดของข้อมูลที่จัดไว้เพื่อรองรับแอพพลิเคชันจำนวนมากได้อย่างมีประสิทธิภาพ โดยรวบรวมข้อมูลและควบคุมข้อมูลที่ซ้ำซ้อน แทนที่จะจัดเก็บข้อมูลในไฟล์แยกต่างหากสำหรับแต่ละแอพพลิเคชันข้อมูลจะปรากฏแก่ผู้ใช้ว่าถูกเก็บไว้ในที่เดียวเท่านั้น ฐานข้อมูลเดียวใช้งานได้หลายโปรแกรม
     ระบบการจัดการฐานข้อมูล (DBMS) เป็นซอฟต์แวร์ที่อนุญาตให้องค์กรสามารถรวมข้อมูลจัดการข้อมูลได้อย่างมีประสิทธิภาพและให้การเข้าถึงข้อมูลที่จัดเก็บโดยโปรแกรมประยุกต์ DBMS ทำหน้าที่เป็นส่วนติดต่อระหว่างโปรแกรมประยุกต์กับไฟล์ข้อมูลทางกายภาพ
ฐานข้อมูลทรัพยากรมนุษย์ที่มีหลายมุมมอง

   DBMS ช่วยลดข้อมูลซ้ำซ้อนและไม่สอดคล้องกันโดยทำให้องค์กรสามารถจัดการข้อมูลการใช้และความปลอดภัยจากส่วนกลางได้ การจัดเรียงข้อมูลผ่านองค์กรทำได้ง่ายขึ้นเนื่องจากข้อมูลจะถูกนำเสนอต่อผู้ใช้ว่าอยู่ในตำแหน่งเดียวมากกว่าการแยกส่วนในหลาย ๆ ระบบและไฟล์ ภาพประกอบที่นี่มีสองมุมมองที่เป็นไปได้ซึ่งเป็นที่สนใจของผู้เชี่ยวชาญด้านประโยชน์และเป็นที่สนใจของสมาชิกในแผนกบัญชีเงินเดือนของบริษัท

ทำไม DBMS เชิงสัมพันธ์จึงมีประสิทธิภาพ
  • DBMS ที่ได้รับความนิยมมากที่สุดในปัจจุบันสำหรับเครื่องพีซีเช่นเดียวกับคอมพิวเตอร์ขนาดใหญ่และเมนเฟรมคือ DBMS เชิงสัมพันธ์ ฐานข้อมูลเชิงสัมพันธ์แสดงข้อมูลเป็นตารางสองมิติ (เรียกว่า relations)
  • ตารางหรือความสัมพันธ์อาจจะเรียกว่าเป็นไฟล์ แต่ละตารางมีข้อมูลเกี่ยวกับเอนทิตีและแอตทริบิวต์
  • Microsoft Access คือ DBMS เชิงสัมพันธ์สำหรับระบบเดสก์ท็อปขณะที่ DB2, Oracle Database และ Microsoft SQL Server เป็น DBMS เชิงสัมพันธ์สำหรับเมนเฟรมขนาดใหญ่และคอมพิวเตอร์ขนาดกลาง MySQL เป็น DBMS โอเพนซอร์สที่ได้รับความนิยม
ตารางฐานข้อมูลเชิงสัมพันธ์

     ฐานข้อมูลเชิงสัมพันธ์จัดข้อมูลในรูปแบบของตาราง
twodimensional ภาพประกอบที่นี่มีตารางสำหรับเอนทิตี SUPPLIER และ PART แสดงวิธีการแสดงแต่ละเอนทิตีและแอตทริบิวต์ Supplier_Number เป็นคีย์หลักสำหรับตาราง SUPPLIER และคีย์ร่วมสำหรับตาราง PART

ฐานข้อมูลเชิงสัมพันธ์และฐานข้อมูลที่ไม่ใช่ข้อมูลในระบบคลาวด์
  • กว่า 30 ปีเทคโนโลยีฐานข้อมูลเชิงสัมพันธ์ได้รับมาตรฐานทองคำ
  • Cloud computing, ปริมาณข้อมูลที่ไม่เคยมีมาก่อน, ปริมาณงานที่มากสำหรับบริการเว็บบริษัทต่าง ๆ หันมาใช้เทคโนโลยีฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์สำหรับ "NoSQL" เพื่อวัตถุประสงค์นี้ 
  • ระบบจัดการฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์ใช้รูปแบบข้อมูลที่มีความยืดหยุ่นมากขึ้นและได้รับการออกแบบมาสำหรับการจัดการชุดข้อมูลขนาดใหญ่ผ่านเครื่องกระจายหลายเครื่องและสามารถปรับขนาดขึ้นหรือลงได้อย่างง่ายดาย มีประโยชน์สำหรับการเร่งแบบสอบถามที่เรียบง่ายกับข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างรวมทั้งเว็บโซเชียลมีเดียกราฟิกและรูปแบบอื่น ๆ ที่ยากต่อการวิเคราะห์ด้วยเครื่องมือแบบ SQL แบบเดิม
  • มีฐานข้อมูล NoSQL หลายแบบซึ่งแต่ละคุณลักษณะและลักษณะทางเทคนิคของตนเอง ฐานข้อมูล Oracle NoSQL เป็นตัวอย่างหนึ่งเช่นเดียวกับ Amazon SimpleDB ซึ่งเป็นหนึ่งใน Amazon Web Services ที่ทำงานในระบบคลาวด์ SimpleDB จัดเตรียมอินเทอร์เฟซ Web services ที่เรียบง่ายเพื่อสร้างและเก็บชุดข้อมูลต่างๆข้อมูลแบบสอบถามได้อย่างง่ายดายและส่งคืนผลลัพธ์ ไม่จำเป็นต้องกำหนดโครงสร้างฐานข้อมูลอย่างเป็นทางการล่วงหน้าหรือเปลี่ยนนิยามนั้นหากมีการเพิ่มข้อมูลใหม่ในภายหลัง
  • บริการจัดการข้อมูลบนระบบคลาวด์เป็นพิเศษสำหรับผู้เริ่มต้นใช้งานเว็บที่มุ่งเน้นหรือธุรกิจขนาดเล็กถึงขนาดกลางที่ต้องการความสามารถด้านฐานข้อมูลในราคาที่ต่ำกว่าผลิตภัณฑ์ฐานข้อมูลภายใน
ความสามารถในการจัดการระบบฐานข้อมูล
     DBMS มีความสามารถและเครื่องมือในการจัดการจัดการและเข้าถึงข้อมูลในฐานข้อมูล ที่สำคัญที่สุดคือภาษาคำจำกัดความข้อมูลพจนานุกรมข้อมูลและภาษาการจัดการข้อมูล

การสืบค้นและการรายงาน
     DBMS มีเครื่องมือสำหรับการเข้าถึงและจัดการข้อมูลในฐานข้อมูล ภาษาการจัดการข้อมูลถูกใช้เพื่อเพิ่มแก้ไขลบและดึงข้อมูลในฐานข้อมูล

แผนผังการสร้างแบบแผนและความเป็นสากล (EntityRelationship Diagrams)

การออกแบบฐานข้อมูล (Database)
  • ฐานข้อมูลต้องการทั้งการออกแบบแนวความคิดและการออกแบบทางกายภาพ แนวคิดหรือการออกแบบเชิงตรรกะของฐานข้อมูลเป็นรูปแบบนามธรรมของฐานข้อมูลจากมุมมองทางธุรกิจในขณะที่การออกแบบทางกายภาพแสดงให้เห็นว่าฐานข้อมูลจัดเป็นอย่างไรในอุปกรณ์จัดเก็บข้อมูลเข้าถึงโดยตรง
  • การสร้างมาตรฐานเป็นกระบวนการสร้างโครงสร้างข้อมูลที่มีขนาดเล็กมีเสถียรภาพยืดหยุ่นและปรับตัวได้จากกลุ่มข้อมูลที่ซับซ้อนเรียกว่าแผนภาพความสัมพันธ์เอนทิตี 
  • Entity-Relationship Diagram หรือ ERD เป็นรูปแบบข้อมูลที่นักออกแบบฐานข้อมูลจัดทำเอกสารรูปแบบข้อมูลของตน แผนภาพ ER แสดงความสัมพันธ์ระหว่างเอนทิตีในฐานข้อมูล

ความสัมพันธ์ที่ไม่เป็นปกติสำหรับการสั่งซื้อ


สร้างตารางการสร้างแบบฟอร์มตามปกติ
เครื่องมือหลักและเทคโนโลยีสำหรับการเข้าถึงข้อมูลจากฐานข้อมูลเพื่อปรับปรุงประสิทธิภาพและการตัดสินใจทางธุรกิจ

      ธุรกิจใช้ฐานข้อมูลเพื่อติดตามธุรกรรมพื้นฐานและต้องมีฐานข้อมูลเพื่อให้ข้อมูลที่จะช่วยให้บริษัทดำเนินธุรกิจได้อย่างมีประสิทธิภาพมากขึ้นและช่วยให้ผู้จัดการและพนักงานสามารถตัดสินใจได้ดียิ่งขึ้น
      ข้อมูลส่วนใหญ่ที่รวบรวมโดยองค์กรที่ใช้เป็นข้อมูลการทำธุรกรรมที่สามารถพอดีกับแถวและคอลัมน์ของระบบการจัดการฐานข้อมูลเชิงสัมพันธ์
      ข้อมูลเหล่านี้อาจไม่มีโครงสร้างหรือกึ่งโครงสร้างดังนั้นจึงไม่เหมาะสำหรับผลิตภัณฑ์ฐานข้อมูลเชิงสัมพันธ์ที่จัดระเบียบข้อมูลในรูปแบบของคอลัมน์และแถว

ความท้าทายของข้อมูลขนาดใหญ่
  • ขณะนี้เราใช้ข้อมูลขนาดใหญ่เพื่ออธิบายชุดข้อมูลเหล่านี้พร้อมกับไดรฟ์ข้อมูลที่ใหญ่เกินกว่าที่ DBMS ทั่วไปจะสามารถจับเก็บและวิเคราะห์ได้
  • ข้อมูลขนาดใหญ่มักหมายถึงข้อมูลในช่วงของ petabyte และ exabyte หรือกล่าวอีกนัยหนึ่งคือเป็นล้านล้าน ๆ ระเบียนจากแหล่งต่าง ๆ ข้อมูลขนาดใหญ่ผลิตในปริมาณที่มากขึ้นและมากขึ้นอย่างรวดเร็วกว่าข้อมูลแบบเดิม
  • ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เนื่องจากสามารถเปิดเผยรูปแบบและความผิดปกติที่น่าสนใจกว่าชุดข้อมูลขนาดเล็กที่มีศักยภาพในการให้ข้อมูลเชิงลึกใหม่เกี่ยวกับพฤติกรรมของลูกค้า รูปแบบสภาพอากาศ การทำตลาด การเงิน หรือปรากฏการณ์อื่น ๆ 

โครงสร้างทางความคิดทางธุรกิจ

คลังข้อมูลและ Data Marts
  •  คลังข้อมูลเป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและประวัติที่น่าสนใจสำหรับผู้มีอำนาจตัดสินใจทั่วทั้งบริษัทคลังข้อมูลจะดึงข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์จากระบบปฏิบัติการหลายระบบและปรับโครงสร้างข้อมูลเพื่อการรายงานและการวิเคราะห์ด้านการจัดการ
  • มาร์กดาต้าคือเซตย่อยของคลังข้อมูลซึ่งข้อมูลข้อมูลขององค์กรที่สรุปหรือเน้นมากจะอยู่ในฐานข้อมูลที่แยกต่างหากสำหรับประชากรเฉพาะของผู้ใช้
Hadoop

      Hadoop เป็นกรอบซอฟต์แวร์โอเพนซอร์สซึ่งได้รับการจัดการโดย Apache Software Foundation ซึ่งช่วยให้สามารถประมวลผลแบบขนานในปริมาณข้อมูลจำนวนมากทั่วทั้งคอมพิวเตอร์ที่ไม่แพง แบ่งปัญหาใหญ่ออกเป็นปัญหาย่อยกระจายไปยังโหนดประมวลผลคอมพิวเตอร์ที่มีราคาไม่แพงนับพันรายการและรวมผลลัพธ์ไว้ในชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น

In-Memory Computing
      การประมวลผลในหน่วยความจำช่วยให้ชุดข้อมูลขนาดใหญ่มีขนาดเท่ากับข้อมูลขนาดใหญ่ของข้อมูลหรือคลังข้อมูลขนาดเล็กเพื่อให้อยู่ในหน่วยความจำทั้งหมด การคำนวณทางธุรกิจแบบซับซ้อนที่ใช้เวลาหลายชั่วโมงหรือวันสามารถทำได้ภายในไม่กี่วินาทีและสามารถทำได้แม้กระทั่งบนอุปกรณ์มือถือ (ดูเซสชันเชิงโต้ตอบเกี่ยวกับเทคโนโลยี)
โครงสร้างพื้นฐานธุรกิจอัจฉริยะร่วมสมัย
      โครงสร้างพื้นฐานธุรกิจอัจฉริยะร่วมสมัยมีความสามารถและเครื่องมือในการจัดการและวิเคราะห์ข้อมูลจำนวนมากและข้อมูลประเภทต่างๆจากหลายแหล่ง เครื่องมือค้นหาและการรายงานที่ใช้งานง่ายสำหรับผู้ใช้ทางธุรกิจแบบสบาย ๆ และเครื่องมือการวิเคราะห์ที่มีความซับซ้อนสำหรับผู้ใช้ที่มีอำนาจสูงจะรวมอยู่ด้วย

เครื่องมือวิเคราะห์ที่มีรายละเอียดมากขึ้นเกี่ยวกับการวิเคราะห์ข้อมูลทางธุรกิจและแอพพลิเคชัน

การประมวลผลแบบออนไลน์ (OLAP)
      OLAP สนับสนุนการวิเคราะห์ข้อมูลแบบหลายมิติทำให้ผู้ใช้สามารถดูข้อมูลเดียวกันในรูปแบบต่างๆได้โดยใช้ หลายมิติ 

แสดงแบบจำลองหลายมิติที่สามารถสร้างขึ้นเพื่อแสดงผลิตภัณฑ์พื้นที่ยอดขายจริงและยอดขายที่คาดการณ์ได้
การทำเหมืองข้อมูล
      การทำเหมืองข้อมูลจะให้ข้อมูลเชิงลึกเกี่ยวกับข้อมูลของบริษัทที่ไม่สามารถหาได้จาก OLAP โดยค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในฐานข้อมูลขนาดใหญ่และอนุมานเกี่ยวกับกฎจากพฤติกรรมเหล่านี้เพื่อคาดการณ์พฤติกรรมในอนาคต รูปแบบและกฎที่ใช้เพื่อเป็นแนวทางในการตัดสินใจและคาดการณ์ผลของการตัดสินใจเหล่านั้น จากการทำเหมืองข้อมูล ได้แก่ ความสัมพันธ์ลำดับ การจำแนกประเภทกลุ่มและการคาดการณ์
การทำเหมืองข้อความและการทำเหมืองบนเว็บ
      มีเครื่องมือทำเหมืองข้อความเพื่อช่วยให้ธุรกิจสามารถวิเคราะห์ข้อมูลขนาดใหญ่ได้ เครื่องมือเหล่านี้สามารถดึงองค์ประกอบหลักจากชุดข้อมูลขนาดใหญ่ที่ไม่มีโครงสร้างค้นพบรูปแบบและความสัมพันธ์และสรุปข้อมูลได้
      การทำเหมืองบนเว็บช่วยให้ธุรกิจเข้าใจถึงพฤติกรรมของลูกค้าประเมินประสิทธิภาพของเว็บไซต์โดยเฉพาะหรือหาจำนวนความสำเร็จของแคมเปญการตลาด ตัวอย่างเช่นนักการตลาดใช้บริการของ Google เทรนด์และ Google Insights for Search,
ฐานข้อมูลและเว็บ
      หลายบริษัทใช้เว็บเพื่อทำข้อมูลบางอย่างในฐานข้อมูลภายในของตนให้กับลูกค้าและคู่ค้าทางธุรกิจ
      ในสภาพแวดล้อมแบบไคลเอ็นต์ / เซิร์ฟเวอร์ DBMS อยู่บนคอมพิวเตอร์เฉพาะที่เรียกว่าเซิร์ฟเวอร์ฐานข้อมูล DBMS ได้รับการร้องขอ SQL และให้ข้อมูลที่จำเป็น มิดเดิ้ลจะโอนข้อมูลจากฐานข้อมูลภายในขององค์กรไปยังเว็บเซิร์ฟเวอร์เพื่อส่งมอบในรูปแบบของเว็บเพจให้กับผู้ใช้

การเชื่อมโยงฐานข้อมูลภายในไปยังเว็บ

ความคิดเห็น

Nonthagorn Chantharaphatthana กล่าวว่า
ทำดีมาก น่าชื่นชมคะ

โพสต์ยอดนิยมจากบล็อกนี้

บทที่ 3 โครงสร้างพื้นฐานเทคโนโลยีสารสนเทศ

บทที่ 2 องค์กร การจัดการ การตัดสินใจ

บทที่ 1 ระบบสารสนเทศเพื่อการจัดการ