วันอังคารที่ 18 กันยายน พ.ศ. 2561

บทที่ 4 (3.2) โครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศ ฐานข้อมูลและระบบสารสนเทศ


       การจัดการทรัพยากรข้อมูลในสภาพแวดล้อมไฟล์แบบเดิมคือระบบข้อมูลที่มีประสิทธิภาพช่วยให้ผู้ใช้ได้รับข้อมูลที่ ถูกต้อง   ทันเวลาและข้อมูลที่เกี่ยวข้อง

Accurate ข้อมูลที่ถูกต้องปราศจากข้อผิดพลาด
Timely ข้อมูลที่มีให้กับผู้มีอำนาจตัดสินใจเมื่อมีความจำเป็น.  สารสนเทศใช้งานได้ทันเวลาในการตัดสินใจ เมื่อต้องการใช้มัน
Relevant ข้อมูลมีความเกี่ยวข้องเมื่อใช้ประโยชน์และเหมาะสมกับประเภทของงานและการตัดสินใจที่จำเป็นต้องใช้ สารสนเทศที่เกี่ยวข้องกับที่ใช้ประโยชน์หรือเหมาะสมกับงานที่ตัดสินใจ
            **เรียนรู้เพื่อที่จะหลีกเลี่ยงสารสนเทศที่ไม่ถูก ไม่ต้อง ไม่เกี่ยว คุณอาจจะประหลาดใจที่ทราบว่าหลายธุรกิจไม่มีข้อมูลที่ทันเวลาถูกต้องหรือมีความเกี่ยวข้องเนื่องจากข้อมูลในระบบข้อมูลของพวกเขาได้รับการจัดระเบียบไม่ดี และบำรุงรักษา

 แนวคิดเกี่ยวกับโครงสร้างของแฟ้มข้อมูล ( FILE ORGANIZATION TERMS AND CONCEPTS )

            •ระบบคอมพิวเตอร์จัดข้อมูลในลำดับชั้นที่ขึ้นต้นด้วยบิตและไบต์ และดำเนินไปยังเขตข้อมูล  ระเบียน  ไฟล์และฐานข้อมูล
            •บิตหน่วยแสดงข้อมูลที่เล็กที่สุดที่คอมพิวเตอร์สามารถจัดการได้ กลุ่มของบิตเรียกว่า  ไบต์ (onete)  ซึ่งอาจเป็นตัวอักษร  ตัวเลข  หรือ  สัญลักษณ์อื่น การจัดกลุ่มตัวอักษรเป็นคำ, กลุ่มของคำหรือหมายเลขที่สมบูรณ์ (เช่น ชื่อ หรือ อายุของบุคคล)  เรียกว่า ฟิลด์ กลุ่มของฟิลด์ที่เกี่ยวข้องเช่น ชื่อนักเรียน, หลักสูตร, วันที่,และเกรดประกอบด้วยบันทึก; คือกลุ่มของระเบียน  ชนิดเดียวกันเรียกว่า  ไฟล์
*****ระบบคอมพิวเตอร์จัดข้อมูลในลำดับชั้นที่ขึ้นต้นด้วยบิต,ซึ่งหมายถึง 0 หรือ บิตสามารถจัดกลุ่มเป็นไบต์เพื่อแสดงอักขระหนึ่งตัว, ตัวเลข, หรือสัญลักษณ์ไบต์สามารถจัดกลุ่มให้เป็นเขตข้อมูล,และเขตข้อมูลที่เกี่ยวข้องสามารถจัดกลุ่มเป็นฟอร์มได้ บันทึกที่เกี่ยวข้องสามารถเก็บรวบรวมในรูปแบบไฟล์, และไฟล์ที่เกี่ยวข้องสามารถจัดเป็นฐานข้อมูลได้
ปัญหาของการประมวลผลเกี่ยวกับสภาพแวดล้อมไฟล์แบบเดิม
( PROBLEMS WITH THE TRADITIONAL FILE ENVIRONMENT )
             •ข้อมูลซ้ำซ้อนและไม่สอดคล้องกัน (Data Redundancy and Inconsistency)
            • ความซ้ำซ้อนของข้อมูล (Data redundancy ) คือการปรากฏตัวของข้อมูลที่ซ้ำกันในไฟล์ข้อมูลหลาย ๆ ไฟล์ทำให้เกิดความขัดแย้ง เพื่อให้ข้อมูลเดียวกันถูกจัดเก็บไว้ในที่ต่างๆมากกว่าหนึ่งแห่ง
             • ข้อมูลไม่สอดคล้องกัน( Data inconsistency) เป็นแอททริบิวต์เดียวกันอาจมีค่าแตกต่างกัน,
และยังนำโดยข้อมูลซ้ำซ้อน
   การใช้วิธีการแบบดั้งเดิมในการประมวลผลไฟล์ทำให้แต่ละพื้นที่ทำงานใน บริษัทต่างๆสามารถพัฒนาแอปพลิเคชันเฉพาะได้แต่ละแอปพลิเคชันต้องการแฟ้มข้อมูลที่ไม่ซ้ำกันซึ่งจะนำไปสู่ข้อมูลซ้ำซากและความไม่ลงรอยกันการประมวลผลความไม่ยืดหยุ่นและการสูญเสียทรัพยากรการจัดเก็บข้อมูล
กำหนดโครงสร้างของข้อมูลในโปรแกรม (ProgramData Dependence)
            • โปรแกรมขึ้นอยู่กับข้อมูลการอ้างอิงข้อมูลโปรแกรมหมายถึงการมีสัมพันธ์ของข้อมูลที่เก็บอยู่ในไฟล์และโปรแกรมเฉพาะที่จำเป็นในการปรับปรุงและรักษาไฟล์เหล่านั้นเช่นการเปลี่ยนแปลงในโปรแกรมต้องมีการเปลี่ยนแปลงข้อมูล ในสภาพแวดล้อมของไฟล์แบบเดิม, การเปลี่ยนแปลงใด ๆ ในโปรแกรมซอฟต์แวร์อาจต้องมีการเปลี่ยนแปลงในข้อมูลที่เข้าถึงโดยโปรแกรมนั้น
            • ขาดความยืดหยุ่นในการใช้งาน ระบบแฟ้มข้อมูลจะออกรายงานตามเวลาที่ใช้งาน ถ้าจะออกเวลาอื่นต้องอาศัยบุคลากรอื่นออกให้
            •ระบบไฟล์แบบดั้งเดิมสามารถส่งรายงานตามกำหนดการตามกำหนดเวลาได้หลังจากความพยายามในการเขียนโปรแกรมอย่างกว้างขวาง แต่ไม่สามารถส่งรายงานเฉพาะกิจหรือตอบสนองต่อความต้องการข้อมูลที่ไม่คาดคิดได้ทันเวลา
               ความปลอดภัยต่ำ
              •การจัดการข้อมูลอาจไม่มีทางรู้ได้ว่าใครกำลังเข้าถึง
หรือแม้กระทั่งการเปลี่ยนแปลงข้อมูลขององค์กร
              • ขาดการแชร์ข้อมูลและความพร้อมใช้งาน แต่ละคนมีแฟ้มข้อมูลเพื่อใช้งาน ไม่มีตรงกลางที่แบ่งกันใช้ได้
         •หากผู้ใช้พบค่าที่แตกต่างกันของข้อมูลเดียวกันในสองระบบที่แตกต่างกัน พวกเขาอาจไม่ต้องการใช้ระบบเหล่านี้เนื่องจากไม่สามารถเชื่อถือความถูกต้องของข้อมูลได้
             ฐานข้อมูลและระบบจัดการฐานข้อมูล (Database Management Systems - DBMS)
•ฐานข้อมูล คือ ชุดของข้อมูลที่จัดไว้เพื่อรองรับแอปพลิเคชันจำนวนมากอย่างมีประสิทธิภาพโดยการรวบรวมข้อมูลและควบคุมข้อมูลซ้ำซ้อนแทนที่จะจัดเก็บข้อมูลในไฟล์แยกต่างหากสำหรับแต่ละแอพพลิเคชัน  ข้อมูลจะปรากฏต่อผู้ใช้ว่าถูกเก็บไว้ในที่เดียวเท่านั้น ฐานข้อมูลเดียวใช้งานได้หลายโปรแกรม ศูนย์กลางของข้อมูล การทำงานของโปรแกรมให้มีประสิทธิภาพ  ซอฟต์แวร์ที่ใช้ในการจัดการข้อมูลที่อยู่ในฐานข้อมูล เพื่อให้เกิดความปลอดภัยในการใช้ข้อมูล ไม่ว่าจะแก้ไขเพิ่มข้อมูล,ให้เกิดความถูกกต้อง
ระบบจัดการฐานข้อมูล(DBMS)เป็นซอฟต์แวร์ที่ช่วยให้องค์กรสามารถรวบรวมข้อมูล,จัดการได้อย่างมีประสิทธิภาพ และให้การเข้าถึงข้อมูลที่เก็บไว้โดยโปรแกรมประยุกต์ DBMS ทำหน้าที่เป็นส่วนติดต่อระหว่างโปรแกรมประยุกต์และไฟล์ข้อมูลทางกายภาพ



วิธีการจัดการระบบจัดการฐานข้อมูล แก้ปัญหาของสภาพแวดล้อมของไฟล์แบบเดิม?

         ระบบการจัดการฐานข้อมูล ช่วยลดความซ้ำซ้อนของข้อมูลและความไม่สอดคล้องกันโดยการทำให้องค์กรสามารถจัดการข้อมูลการจัดการและใช้งานได้อย่างปลอดภัย การจัดเก็บข้อมูลตลอดทั้งองค์กรทำได้ง่ายขึ้นเนื่องจากข้อมูลจะถูกนำเสนอต่อผู้ใช้ว่าอยู่ในตำแหน่งเดียวมากกว่าการแยกส่วนในหลาย ๆ ระบบและไฟล์ ภาพประกอบที่นี่มีสองมุมมองที่เป็นไปได้ หนึ่งที่น่าสนใจสำหรับผู้เชี่ยวชาญด้านสิทธิประโยชน์ และหนึ่งที่น่าสนใจให้กับสมาชิกของแผนกบัญชีเงินเดือนของบริษัท
ทำไมระบบการจัดการฐานข้อมูลเชิงสัมพันธ์จึงมีประสิทธิภาพ?
   • ระบบการจัดการฐานข้อมูลชนิดที่ได้รับความนิยมมากที่สุดในปัจจุบันสำหรับเครื่องพีซีเช่นเดียวกับคอมพิวเตอร์ขนาดใหญ่และเมนเฟรมคือ ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์
     •ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์แสดงข้อมูลเป็นตารางสองมิติ (เรียกว่า relations)
     •ตารางหรือความสัมพันธ์อาจเรียกว่า ไฟล์ แต่ละตารางมีข้อมูลเกี่ยวกับเอนทิตีและแอตทริบิวต์
    • Microsoft Access คือ DBMS เชิงสัมพันธ์ สำหรับระบบเดสก์ท็อป, ขณะที่ DB2, ibm  , Oracle Database,และ Microsoft SQL Server เป็นระบบการจัดการฐานข้อมูลเชิงสัมพันธ์สำหรับเมนเฟรมขนาดใหญ่และคอมพิวเตอร์ขนาดกลาง MySQL เป็นระบบการจัดการฐานข้อมูลโอเพนซอร์สที่ได้รับความนิยม 
•ฐานข้อมูลเชิงสัมพันธ์จัดระเบียบข้อมูลในรูปแบบของตารางแบบมี2มิติ
            ภาพประกอบที่นี่มีตารางสำหรับเอนทิตี้ SUPPLIERและ PART แสดงวิธีแสดงแต่ละเอนทิตี้
และคุณลักษณะของมัน Supplier_Number เป็นคีย์หลักสำหรับตาราง SUPPLIER และคีย์ต่างประเทศสำหรับตาราง PART

ฐานข้อมูลเชิงสัมพันธ์และฐานข้อมูลที่ไม่ใช่ฐานข้อมูลในระบบคลาวด์
            •กว่า 30 ปี, เทคโนโลยีฐานข้อมูลเชิงสัมพันธ์เป็นมาตรฐานทองคำ
            • Cloud computing, ปริมาณข้อมูลที่ไม่เคยมีมาก่อน,ปริมาณงานที่มากสำหรับบริการเว็บ
บริษัท ต่างหันมาใช้เทคโนโลยีฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์สำหรับ "NoSQL"
ปริมาณข้อมูลที่ไม่สามารถที่จำกัดได้ มีการส่งข้อมูลระหว่างไคลแอนต์ เซิร์ฟเวอร์ องค์กรต่างๆจะต้องปรับเปลี่ยนเทคโนโลยีเป็นแบบ NonRelation
            •ระบบจัดการฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์ใช้รูปแบบข้อมูลที่มีความยืดหยุ่นมากขึ้น และได้รับการออกแบบมาสำหรับการจัดการชุดข้อมูลขนาดใหญ่ผ่านเครื่องกระจายหลายเครื่องและสามารถปรับขนาดได้ง่ายขึ้นหรือลง พวกเขามีประโยชน์สำหรับการเร่งแบบสอบถามที่เรียบง่ายกับไดรฟ์ข้อมูลขนาดใหญ่ที่มีโครงสร้างและไม่มีโครงสร้างรวมทั้งเว็บโซเชียลมีเดีย,และรูปแบบอื่น ๆ ของข้อมูลที่ยากต่อการวิเคราะห์ด้วยเครื่องมือแบบ SQL แบบเดิม
            •มีฐานข้อมูล NoSQL หลายแบบ แต่ละคนมีคุณสมบัติและพฤติกรรมทางเทคนิคของตัวเอง
ฐานข้อมูล Oracle NoSQL เป็นตัวอย่างหนึ่งเช่นเดียวกับของ Amazon SimpleDB, หนึ่งในบริการ Amazon Web Services ที่ทำงานในระบบคลาวด์ SimpleDB ให้บริการเว็บอินเทอร์เฟซแบบง่ายๆในการสร้างและจัดเก็บชุดข้อมูลหลายชุดค้นหาข้อมูลแบบสอบถามได้อย่างง่ายดายและส่งคืนผลลัพธ์ ไม่จำเป็นต้องกำหนดโครงสร้างฐานข้อมูลอย่างเป็นทางการก่อนหรือไม่เปลี่ยนนิยามนี้หากมีการเพิ่มข้อมูลใหม่ในภายหลัง
            •บริการจัดการข้อมูลบนระบบคลาวด์ มีการอุทธรณ์เป็นพิเศษ  เว็บเบราเซอร์ที่เน้นการเริ่มต้นเว็บหรือธุรกิจขนาดเล็กถึงขนาดกลางที่ต้องการความสามารถด้านฐานข้อมูลในราคาที่ต่ำกว่าผลิตภัณฑ์ฐานข้อมูลภายใน
ความสามารถในการบริหารระบบฐานข้อมูล
            ระบบการจัดการฐานข้อมูลมีความสามารถและเครื่องมือในการจัดการ, จัดการ,และการเข้าถึงข้อมูลในฐานข้อมูลที่สำคัญที่สุดคือภาษาคำจำกัดความของข้อมูล,พจนานุกรมข้อมูลและข้อมูลการจัดการภาษา
การสืบค้นและการรายงาน
            ระบบการจัดการฐานข้อมูลมีเครื่องมือสำหรับการเข้าถึงและการจัดการข้อมูลในฐานข้อมูล
ภาษาการจัดการข้อมูลถูกใช้เพื่อเพิ่ม, เปลี่ยนแปลง, ลบ,และดึงข้อในฐานข้อมูล

Normalization and EntityRelationship Diagrams
แผนผังความสัมพันธ์และความสัมพันธ์ไดอะแกรม
          การออกแบบฐานข้อมูล (DESIGNING DATABASES)
ฐานข้อมูลต้องการทั้งการออกแบบแนวคิดและการออกแบบทางกายภาพ  แนวคิดหรือเหตุผล,
การออกแบบฐานข้อมูลเป็นรูปแบบนามธรรมของฐานข้อมูลจากมุมมองทางธุรกิจ,
ในขณะที่การออกแบบทางกายภาพแสดงให้เห็นว่าฐานข้อมูลเป็นจริงจัดในอุปกรณ์จัดเก็บข้อมูลเข้าถึงโดยตรง
        •Normalization การทำให้เป็นมาตรฐานคือกระบวนการในการสร้างขนาดเล็กมั่นคงและยืดหยุ่นและโครงสร้างข้อมูลแบบปรับตัวได้จากกลุ่มข้อมูลที่ซับซ้อน ลดความซับซ้อนของข้อมูล ลดปัญหาความไม่ต้องต้อง เอามาใช้ในการวิเคราะห์ ออกแบบฐานข้อมูล
       แผนภาพความสัมพันธ์เอนทิตี้ (Entity-Relationship Diagram - ERD) ความสัมพันธ์ของข้อมูลโดยใช้แผนภาพ เป็นแบบข้อมูลที่นักออกแบบฐานข้อมูลจัดทำเอกสารรูปแบบข้อมูลของตน 

เครื่องมือหลักและเทคโนโลยีสำหรับการเข้าถึงข้อมูลจากฐานข้อมูลเพื่อปรับปรุงประสิทธิภาพและการตัดสินใจทางธุรกิจ สารสนเทศช่วยในการตัดสินใจให้มีประสิทธิภาพ
            ธุรกิจใช้ฐานข้อมูลของตนเพื่อติดตามธุรกรรมพื้นฐานและยังต้องการฐานข้อมูลเพื่อให้ข้อมูลที่จะช่วยให้ บริษัท ดำเนินธุรกิจได้อย่างมีประสิทธิภาพ, และช่วยให้ผู้บริหารและพนักงานสามารถตัดสินใจได้ดียิ่งขึ้น
            •ข้อมูลส่วนใหญ่ที่รวบรวมโดยองค์กรที่ใช้เป็นข้อมูลการทำธุรกรรมที่สามารถพอดีกับแถวและคอลัมน์ของระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ ขณะนี้เรากำลังเป็นพยานถึงการระเบิดของข้อมูลจากการเข้าชมเว็บ
ข้อความอีเมล, และเนื้อหาสื่อสังคมออนไลน์ (ทวีตข้อความสถานะ) หรือจากระบบการซื้อขายทางอิเล็กทรอนิกส์
            •ข้อมูลเหล่านี้อาจไม่มีโครงสร้างหรือ กึ่งโครงสร้างและไม่เหมาะสมสำหรับผลิตภัณฑ์ฐานข้อมูลเชิงสัมพันธ์ที่จัดระเบียบข้อมูลในรูปแบบของคอลัมน์และแถว

ความท้าทายของข้อมูลขนาดใหญ่ (THE CHALLENGE OF BIG DATA)
     •ตอนนี้เราใช้ข้อมูลขนาดใหญ่เพื่ออธิบายชุดข้อมูลเหล่านี้พร้อมกับไดรฟ์ข้อมูลขนาดใหญ่ที่เกินกว่าความสามารถของระบบการจัดการฐานข้อมูล โดยทั่วไปในการรวบรวมจัดเก็บและวิเคราะห์
      •ข้อมูลขนาดใหญ่มักหมายถึงข้อมูลใน petabyte และ exabyte ช่วง - ในคำอื่น ๆ , พันล้านเรคคอร์ด เพื่อ trillions ของระเบียน, ทั้งหมดจากแหล่งต่างๆ  ข้อมูลขนาดใหญ่ผลิตในปริมาณที่มากขึ้น และมากขึ้นอย่างรวดเร็วกว่าข้อมูลแบบดั้งเดิม
      ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เนื่องจากสามารถเปิดเผยรูปแบบและความผิดปกติที่น่าสนใจมากกว่าชุดข้อมูลขนาดเล็กด้วยศักยภาพในการให้ข้อมูลเชิงลึกใหม่เกี่ยวกับพฤติกรรมของลูกค้า รูปแบบสภาพอากาศ, กิจกรรมตลาดการเงินหรือปรากฏการณ์อื่น ๆ ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เพราะพวกเขาสามารถเปิดเผยรูปแบบและความผิดปกติที่น่าสนใจที่มีศักยภาพมากขึ้น ให้ข้อมูลเชิงลึกใหม่ในพฤติกรรมของลูกค้า, รูปแบบสภาพอากาศ, กิจกรรมตลาดการเงินหรือปรากฏการณ์อื่น ๆ


โครงสร้างทางความคิดทางธุรกิจ (BUSINESS INTELLIGENCE INFRASTRUCTURE)
            • คลังข้อมูลและ ตลาดข้อมูล ( Data Warehouses and Data Marts )
            •data warehouse คลังข้อมูลเป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและ ข้อมูลทางประวัติศาสตร์ที่น่าสนใจที่อาจเกิดขึ้นกับผู้มีอำนาจตัดสินใจทั่วทั้งบริษัท  คลังข้อมูลจะดึงข้อมูลปัจจุบันและข้อมูลย้อนหลังจากระบบปฏิบัติการหลายระบบและปรับโครงสร้างข้อมูลเพื่อการจัดการการรายงานและการวิเคราะห์
            •data mart เป็นส่วนย่อยของคลังข้อมูลซึ่งสรุปหรือข้อมูลส่วนใหญ่ที่เน้นการจัดเก็บข้อมูลขององค์กรจะอยู่ในฐานข้อมูลที่แยกต่างหากสำหรับประชากรเฉพาะของผู้ใช้
            • Hadoop เป็นซอฟต์แวร์โอเพ่นซอร์สที่จัดการโดย A pache Software Foundation ช่วยให้สามารถประมวลผลข้อมูลแบบขนานในปริมาณมากบนคอมพิวเตอร์ที่มีราคาไม่แพง มันแบ่งปัญหาข้อมูลขนาดใหญ่ลงเป็นปัญหาย่อย,แจกจ่ายให้กับโหนดการประมวลผลคอมพิวเตอร์หลายพันเครื่องที่มีราคาไม่แพงและรวมผลลัพธ์ไว้ในชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น
            •คอมพิวเตอร์ในหน่วยความจำ
            • Inmemory processing การประมวลผลในหน่วยความจำทำให้ชุดข้อมูลมีขนาดใหญ่มาก
  จำนวนขนาดของมาร์ทข้อมูลหรือคลังข้อมูลขนาดเล็ก อาศัยอยู่ในหน่วยความจำทั้งหมด การคำนวณทางธุรกิจแบบซับซ้อนที่ใช้เวลาหลายชั่วโมงหรือวันสามารถทำได้ภายในไม่กี่วินาทีและนี้สามารถแม้จะประสบความสำเร็จในอุปกรณ์มือถือ

            โครงสร้างพื้นฐานธุรกิจอัจฉริยะร่วมสมัยมีขีดความสามารถและเครื่องมือในการจัดการและวิเคราะห์ปริมาณมากและข้อมูลประเภทต่างๆจากหลายแหล่งเครื่องมือสืบค้นข้อมูลและรายงานสำหรับผู้ใช้ที่ใช้งานง่าย และเครื่องมือวิเคราะห์ที่มีความซับซ้อนมากขึ้นสำหรับผู้ใช้ไฟฟ้า

เครื่องมือวิเคราะห์: ความสัมพันธ์รูปแบบแนวโน้ม
ที่มีรายละเอียดเพิ่มเติมเกี่ยวกับการวิเคราะห์ข้อมูลทางธุรกิจและการประยุกต์ใช้มีดังนี้:
            •การประมวลผลแบบออนไลน์ (OLAP) Online Analytical Processing (OLAP)
            OLAP สนับสนุนการวิเคราะห์ข้อมูลแบบหลายมิติ, ทำให้ผู้ใช้สามารถดูข้อมูลเดียวกันในรูปแบบต่างๆโดยใช้หลายมิติ
            •การทำเหมืองข้อมูล
            การทำเหมืองข้อมูลจะให้ข้อมูลเชิงลึกเกี่ยวกับข้อมูลของ บริษัท ที่ไม่สามารถหาได้จาก OLAP โดยค้นหารูปแบบที่ซ่อนอยู่และความสัมพันธ์ในฐานข้อมูลขนาดใหญ่และอนุมานกฎจากพวกเขาเพื่อคาดการณ์พฤติกรรมในอนาคต รูปแบบและกฎใช้เพื่อเป็นแนวทางในการตัดสินใจและคาดการณ์ผลของการตัดสินใจเหล่านั้น จากการทำเหมืองข้อมูล ได้แก่ ความสัมพันธ์ลำดับการจำแนกประเภทกลุ่มและการคาดการณ์
            •การทำเหมืองข้อความและการทำเหมืองบนเว็บ
            Text Mining เครื่องมือการทำเหมืองข้อความมีอยู่ในปัจจุบันเพื่อช่วยให้ธุรกิจสามารถวิเคราะห์ข้อมูลขนาดใหญ่ได้เครื่องมือเหล่านี้สามารถดึงองค์ประกอบสำคัญได้จากชุดข้อมูลขนาดใหญ่ที่ไม่มีโครงสร้าง, ค้นพบรูปแบบและความสัมพันธ์,และสรุปข้อมูล
            Web Mining การทำเหมืองบนเว็บช่วยให้ธุรกิจเข้าใจพฤติกรรมของลูกค้าประเมินประสิทธิภาพของเว็บไซต์เฉพาะ,หรือวัดความสำเร็จของแคมเปญการตลาด ตัวอย่างเช่นนักการตลาด ใช้บริการ Google trend และ Google Insights for Search

ฐานข้อมูลและเว็บ (DATABASES AND THE WEB)
หลาย บริษัท ใช้เว็บเพื่อให้ข้อมูลในฐานข้อมูลภายในของลูกค้าบางส่วนแก่ลูกค้าและคู่ค้าทางธุรกิจ
ในสภาพแวดล้อมแบบไคลเอ็นต์ / เซิร์ฟเวอร์ ระบบการจัดการฐานข้อมูลอยู่บนคอมพิวเตอร์เฉพาะที่เรียกว่าเซิร์ฟเวอร์ฐานข้อมูล ได้รับการร้องขอ SQL และให้ข้อมูลที่จำเป็น Middleware จะโอนข้อมูลจากฐานข้อมูลภายในขององค์กรไปยังเว็บเซิร์ฟเวอร์เพื่อส่งมอบในรูปแบบของเว็บเพจให้กับผู้ใช้



ไม่มีความคิดเห็น:

แสดงความคิดเห็น