นส.เมษศจี ศิริรุ่งเรือง 5202115191

นส.เมษศจี ศิริรุ่งเรือง 5202115191

วันพุธที่ 19 มกราคม พ.ศ. 2554

Business Intelligence

คาบ 9 : 19 ม.ค. 54

          วันนี้อาจารย์ศรีสมรักมาสอนอีกหนึ่งคาบ อาจารย์เริ่มต้นด้วยการทบทวนเนื้อหาคราวที่แล้วเกี่ยกวับ Data Warehouse แล้วจึงขึ้นหัวข้อต่อไปคือ

Data Warehouse Processing
          เป็นกระบวนการจัดทำ Data Warehouse โดยมีขั้นตอนทั้งหมด 5 ขั้นตอน ดังนี้
          1. รวบรวมข้อมูล  - ทั้งจากภายในองค์กร (Operational Data) และ ภายนอกงอค์กร (External Data)
          2. ทำ Meta Data- หลังจากที่ได้รวบรวมข้อมูลแล้ว จึงนำข้อมูลที่รวบรวมมา มาสร้าง Meta Data หรือ ข้อมูลของข้อมูล ที่ซึ่งใช้อธิบายเกี่ยวกับ Data ที่อยู๋ใน Warehouse ซึ่งจะมีทีมงานเข้ามเกี่ยวข้องด้วย
          2. ทำ Data Staging -หลังจากรวบรวมข้อมูลได้แล้ว นอกจากจะทำ Meda Data แล้ว ยังเอาข้อมูลที่รวบรวมมาไปทำ Data Staging ซึ่งเป็นการจัดระบบข้อมูลที่มี และสร้างเป็น Data Cube ซึ่งประกอบไปด้วยการทำ Extract, Clean, Transform และ Load
          3. สร้าง Data Warehouse - เมื่อได้ Data Cube แล้วจึงทำ Data Warehouse โดยยึด Business Object เป็นหลัก
          4. สร้าง Business View - เมื่อได้ Data Warehouse แล้ว การนำเสนอข้อมูลจะต้องอยู่ในรูปแบบที่ง่าย เพื่ออำนวยความสะดวกในการนำไปใช้ของผู้บริหาร ซึ่งจะอกมาในรูปแบบของ Dash Board

Meta Data
          เป็นข้อมูลที่ใช้อธิบายเกี่ยวกับ Data ที่อยู่ใน Warehouse, เป็นแนวทางในการเคลื่อนย้าย Data ต่างๆ รวมไปถึงวิธีในการเคลื่อนย้าย Data

Data Mart
          เป็นเสมือน Data Warehouse หน่วยย่อยของแต่ละแผนก เนื่องจาก Data Warehouse ของบริษัทนั้นมีขนาดใหญ่และมีผู้เข้าใช้จำนวนมาก ทำให้เกิดความวุ่นวายและสร้างปัญหาให้แก่ผู้ที่เข้าใช้ จึงคัดลอกข้อมูลในส่วนที่เกี่ยวข้องของแต่ละฝ่ายออกมาสร้างเป็น Data Mart ของแต่ละฝ่ายเอง เพื่อลดความวุ่นวายและปัญหาต่างๆ ลง ซึ่ง Data Mart แบ่งออกเป็น 2 ประเภท คือ
          1.Replicated (Dependent) Data Mart มีลักษณะเป็น Data Warehouse ของฝ่ายลักษณะเดียวกับที่อธิบายไปข้างต้น
          2.Stand-alone Data Mart เป็นการสร้าง Data Mart ของฝ่ายขึ้นมาโดยที่ไม่มี Data Warehouse ขององค์กร เนื่องจากองค์กรยังไม่มีความพร้อมในการสร้างเท่าฝ่าย แต่ข้อเสียของประเภทนี้คือ เมื่อทุกฝ่ายมี Data Mart แล้ว จะไม่สามารถนำ Data Mart -องแต่ละฝ่ายมารวมเป็น Data Warehouse ขององค์กรได้

Data Cube
          เป็น Multidimensional Databases ที่เอาไว้เก็บข้อมูลที่ Transform แล้วจึงมา Load ลงที่นี่ เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น จุดเด่นของ Data Cube คือ สามารถตัดแบ่งส่วนเพื่อเลือกข้อมูลที่ต้องการวิเคราะห์ได้ ทำให้สามารถวิเคราะห์ข้อมูลที่มีได้ในหลายมิติ หลายมุมมอง ทำให้เห็นปัญหาที่ชัดเจนขึ้น

* Multidimensional Data * เป็นข้อมูลที่ถูกออกแบบมาให้นำเสนอให้มองเห้นความผิดพลาดและจุดเด่นได้อย่างชัดเจน โดยข้อมูลที่มีทั้งหมดจะอยู่ในรูปแบบของลูกบาศก์ ซึ่งสามารถ Slice และ Dice ออกมาได้
           Slice คือ การตัดข้อมูลออกมาโดยมองในมุมมองของช่วงเวลา แต่มองสินค้าทุกชนิด
           Dice คือ การตัดข้อมูลออกมาโยมองในมุมมองของสินค้าชนิดหนึ่ง ในช่วงเวลายาวๆ


          พอถึงตรงนี้อาจารย์ก็ปล่อยพักแล้วจึงมาขึ้นเนื้อหาเรื่อง Business Intelligence ซึ่งมีรายละเอียดต่อไปนี้

Business Intelligence
           คือ เป็นการรวมกันของ การออกแบบโครงสร้างระบบ เครื่องมือต่างๆ รวมถึงฐานข้อมูลและ Apllication ต่างๆ ที่ช่วยในการทำงานวิเคราะห์ ประกอบไปด้วย 3 กลุ่ม Function และ Features ดังนี้

          1. Reporting and Analysis - เป็นส่วนออกรายงานให้แก่ผู้ใช้ ซึ่งมีตัวอย่างการออกรายงานต่างๆ เช่น
               - Enterprise Reporting System - จัดทำรายงานทั้งในรูปแบบปกติ และรูปแบบที่สามารถปรับแก้เองได้ตามต้องการ ซึ่งรายงานเหล่านี้จะเป็นข้อมูลที่เตรียมให้สำหรับผู้บริหารนำไปใช้ในการวิเคราะห์ต่างๆ
               - Dashboards - ส่วนมากเป็นการแสดงรายงานของ operation และ tactical แต่ก็มีในระดับ strategic ด้วย (แต่ไม่นิยม)
               - Scorecard - เป็นรายงานสำหรับผู้บริหาร ผู้จัดการในระดับ strategic

           2.Analytics - เป็นส่วนของการใช้เครื่องมือในการวิเคราะห์ข้อมูล โดยมีตัวอย่างดังต่อไปนี้
               - Online Analytical Processing (OLTP) - เป็นเครื่องมือเริ่มต้นของผู้บริหารที่ช่วยในการวิเคราะห์ ซึ่งเครื่องมือจะช่วยระบุปัญหาและวิเคราะห์ได้ในพื้นฐานเท่านั้น ไม่สามารถตอบคำถามเชิงธุรกิจได้ ซึ่งการวิเคราะห์ข้อมูลด้วยเครื่องมือนี้จะทำให้ได้ insight ของข้อมูล แสดงผลออกมาในรูปแบบของกราฟ โดยจะวิเคราะห์แบบ Multidimensional
            
               - Data Mining - เป็นการแยกข้อมูลออกมาเพื่อพยากรณ์แนวโน้มที่อาจจะเกิดขึ้น
           ลักษณะของ Data Mining จะต้องทำกับบริษัทที่มี Database ขนาดใหญ่, ต้องรู้ว่าข้อมู,นี้มีประโยชน์หรือไม่ (เหมือนแยกเพชรออกมาก้อนหิน), สามารถทำเป็น Paralle processing, นำเสนอรายงานได้ 5 รูปแบบ (แต่ต้องสั่งว่าต้องการรูปแบบไหน)

          Mining Process  เริ่มต้นที่ การรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่น แล้วทำ ECTL ซึ่งการที่ต้องทำอีกครั้งเนื่องจากข้อมูลชิ้นเดียวกันกับใน Warehouse แต่อาจมีความหมายที่แตกต่างไปใน Mining แล้วจึงวิเคราะห์และประมวลผลข้อมูล และสิ่งสุดท้ายที่สำคัญ คือ การแปรผลข้อมูล ที่จะทำให้สามารถนำไปใช้ได้ง่ายยิ่งขึ้น

           5 รูปแบบของ Data Mining
                    1.Clustering - นำเสนอข้อมูลที่มีความสัมพันธ์กันเอง
                    2.Classification - นำเสนอข้อมูลตามสมมติฐานที่เราคิด โดยให้ทดสอบว่าสมมติฐานนั้นจริงหรือไม่ อย่างไร
                    3.Association - นำเสนอผลสืบเนื่อง
                    4.Sequence discovery - consequence ที่เกิดตามหลังมา
                    5.Prediction - นำเสนอโดยการพยากรณ์สิ่งที่จะเกิดขึ้น

          ข้อดีข้อเสียของการทำ Data Mining
                   - เป็นเครื่องมือที่ใช้งานง่ายสำหรับพนักงานระดับปฏิบัติการ
                   - แต่เทคนิคอาจจะซับซ้อนมากเกินไป ทำให้ต้องการความรู้และการอบรม
                   - และอาจต้องมีความรู้ด้านสิถิติในการอ่านและแปลผล

         -Text Mining - เป็นการจัดกระทำกับข้อมูลที่ไม่มีรูปแบบ (Unstructure Data) เช่น ความคิดเห็นของลูกค้า ซึ่งเครื่องมือนี้จะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจับกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน
          การนำไปใช้ เครื่องมือนี้จะออกมาในรูปแบบของการ detect e-mail spam โดยการ detect keyword บางคำ หรือการส่งต่อกระบวนการทำงานอย่างอัตโนมัตให้แก่ผู้ที่รับผิดชอบ เช่น โทรศัพท์ตอบรับอัตโนมัติที่ให้กดเบอร์ตามฝ่ายที่ต้องการและจะโอนให้โดยตรง

ไม่มีความคิดเห็น:

แสดงความคิดเห็น