นส.เมษศจี ศิริรุ่งเรือง 5202115191

นส.เมษศจี ศิริรุ่งเรือง 5202115191

วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

Data Management

คาบ 8 : 12 ม.ค. 54

          วันนี้อาจารย์ศรีสมรักมาสอนแทนอาจารย์ปีเตอร์ ซึ่่งอาจารย์จะมาสอน 3 อาทิตย์ 3 เรื่องด้วยกัน อาทิตย์แรกนี้เริ่มด้วยเรื่อง Data Management โดยอาจารย์เริ่มปูพื้นเริ่มคาบดังนี้

          อาจารย์พูดถึงระบบสารสนเทศ (Information System) โดยอาจารย์ถามว่า twitter, facebook, เว็บคณะ, google, amazon พวกนี้เป็น IS หรือไม่?? โดยอาจารย์ได้อธิบายถึงความหมายของระบบ (System) ว่าจะต้องประกอบไปด้วย input, process, output เป็นหลักๆ และมี environment, boundary, control&feedback และ subsystem เป็นส่วนเสริม โดยการที่จะเกิดระบบขึ้นมาได้นั้น จะต้องมีวัตถุประสงค์ก่อนว่า สิ่งที่จะทำนั้น ทำเพื่ออะไร output ที่ต้องการเห็นมีหน้าตา ลักษณะประมาณไหน เพื่อจะได้สามารถระบุ input และ process ได้ชัดเจน

ระบบสารสนเทศ (Information System) คือ ระบบที่มีหน้าที่รวบรวมข้อมูล ตามวัตถุประสงค์เืพื่อให้แก่ผู้ใช้ระบบ หลังจากนั้นจึงมีการจัดเก็บข้อมูลที่นำเข้ามาสู่ระบบเพื่อการใช้งานในอนาคต

           มาถึงตรงนี้อาจารย์ก็มีคำถามว่า output ของระบบสารสนเทศคืออะไร??
คำตอบก็คือ สารสนเทศ นั่นเอง เนื่องจาก output ของระบบคือวัตถุประสงค์ของระบบ ซึ่งวัตถุประสงค์ของระบบสารสนเทศก็คือสร้างสารสนเทศขึ้นมา ดังนั้น output ของระบบสารสนเทศก็คือ สารสนเทศ

          โดยหน้าตาของ output ที่เป็นสารสนเทศนั้น จะแตกต่างไปจาก output ของระบบอื่นๆ คือ ระบบอื่นส่วนมากนั้น ลักษณะและรูปแบบของ output จะแตกต่างจาก input อย่างชัดเจน แต่สำหรับระบบสารสนเทศแล้วนั้น ส่วนมากจะมีลักษณะและรูปแบบที่ไม่แตกต่าง input มากนัก ทำให้ไม่สามารถแยกแยะได้ชัดเจนว่า output ที่ออกมานั้นเป็น Data หรือ Information

           ความแตกต่างของ data และ information นั้นจะพิจารณาจาก ประโยชน์ที่ผู้รับได้รับ ถ้าผู้รับเห็นว่า output นั้นมีประโยชน์ สามารถช่วยทำให้เกิดการเปลี่ยนแปลงในพฤติกรรม output นั้นจะเป็น Information แต่หาก output นั้นผู้รับไม่รู้สึกได้รับประโยชน์ output นั้นจะเป็นเพียง data

          ดังนั้น จากคำถามตอนต้นคาบของอาจารย์ ที่ถามว่า twitter, facebook, เว็บคณะ, google และ amazon นั้นอะไรเป็น IS บ้าง คำเฉลยก็คือ มีเพียง amazon เท่านั้นที่เป็น information เนื่องจากเป็น E-commerce มีการสั่งของเป็น input กระบวนการภายในของ amazon เป็น process และมี output คือ ของที่สั่ง

Data Management
      การบริหารข้อมูลทำได้ยาก เพราะ
  • มีข้อมูลเพิ่มขึ้นจำนวนมากตลอดเวลา
  • ข้อมูลกระจัดกระจายอยู่ตามหน่วยงานต่างๆ 
  • ข้อมูลมีความซ้ำซ้อน แต่ละฝ่ายมีการสร้างและเก็บแยกออกจากกัน
  • ข้อมูลจากภายนอกที่ใช้ในการตัดสินใจเป็นข้อมูลที่เราไม่ีมีอำนาจเป็นเจ้าของ ไม่สามารถทำอะไรได้
  • มีเรื่องความปลอดภัยของข้อมูล คุณภาพ และ จริยธรรมที่เป็นประเด็นสำคัญ
  • การเลือกเครื่องมือเพื่อใช้ในการจัดการนั้นเป็นปัญหาใหญ่

โดย Data Management แบ่งเป็น 4 อย่างคือ
  1. Data Profiling - ข้อมูลเืบื้องต้นของข้อมูลที่จัดเก็บ คือ ใครเป็นคนสร้าง ข้อมูลเหล่านี้จัดเก็บอยู่ที่ไหน จัดเก็บอย่างไร และใครเป็นผู้ใช้ข้อมูล
  2. Data quality management - เป็นการปรับปรุงคุณภาพของข้อมูล
  3. Data integration - เป็นการรวบรวมข้อมูลที่เหมือนกันจากหลายแหล่งเข้าด้วยกัน
  4. Data augmentation - เป็นการเพิ่มคุณค่าของข้อมูล

Data life cycle process
แบ่งออกเป็น 4 ขั้นตอน ดังนี้
           1. เก็บข้อมูล โดยสามารถเก็บข้อมูลได้จาก 3 แหล่งคือ Internal Data, External Data และ Personal Data
           2. เลือกข้อมูลที่้ต้องการใช้มารวมกันที่ Data Warehouse โดยจะเลือกเฉพาะข้อมูลย่อยๆ ที่ต้องการใช้ ไม่เลือกมาทั้งกลุ่ม
           3. ผู้ใช้เข้ามาคัดลอกข้อมูลเพื่อนำไปใช้ในการวิเคราะห์
           4. วิเคราะห์ข้อมูล โดยอาจใช้เครื่องมือช่วยในการวิเคราะห์ เช่น OLAP, EIS, DSS เป็นต้น หลังจากนั้นจึงนำข้อมูลที่ผ่านการวิเคราะห์ไปประยุกต์ใช้ เช่น การทำ SCM, CRM หรือการวางแผนกลยุทธ์ เป็นต้น

Data Processing
แบ่งออกเป็น 2 ด้านคือ
          Transactional เป็นการประมวลผลข้อมูลขั้นพื้นฐาน ระดับปฏิบัติการ
          Analytical เป็นการเอาข้อมูลมาใช้ประมวลผลอีกครั้งเพื่อการตัดสินใจระดับสูงขึ้นไป นำข้อมูลเหล่านี้ไปใช้วิเคราะห์ต่อ

Data Warehouse
           การทำ Data Warehouse นั้นเป็นเหมือนขั้นตอนการเตรียมข้อมูลที่เีกี่ยวข้อง เพื่อนำไปใช้ในการวิเคราะห์และประมวลผลเพื่อการตัดสินใจอีก ซึ่งจะเหมาะกับองค์กรที่ผู้บริหารเน้นการใช้ข้อมูลในกาารตัดสินใจ จะไม่เหมาะกับองค์กรที่ผู้บริหารใช้ประสบการณ์ในการตัดสินใจ ดังนั้น ไม่ใช่ทุกองค์กรที่จะต้องทำ Data Warehouse


ลักษณะของ Data Warehouse
  1. organization มีการจดหมวดหมู่ของข้อมูลใหม่ โดยจัดตามสิ่งที่สนใจ (Subject) เป็นหลัก (ไม่ได้แบ่งตามฝ่ายที่จัดเก็บข้อมูล)
  2. consistency ข้อมูลมีความสม่ำเสมอเหมือนกัน อยู่ในรูปแบบเดียวกัน
  3. time variant มีช่วงเวลาที่ชัดเจน
  4. non-volatile ข้อมูลจะไม่มีการเปลี่ยนแปลง ไม่ีมีการถูกอัพเดท
  5. relational ใช้ relational structure
  6. client/server ใช้ server เพื่อให้ผู้ใช้สามารถเข้าถึงข้อมูลได้ง่าย
องค์กรที่เหมาะกับการใช้ Data Warehouse
  • มีข้อมูลจำนวนมากที่ผู้ใช้ต้องการเข้าถึง
  • ข้อมูลระดับ operational ถูกจัดเก็บไว้ในหลากหลายรูปแบบ หลากหลายระบบ
  • มีการใช้ข้อมูลเป็นปัจจัยสำคัญในการตัดสินใจ
  • มีลูกค้าหลากหลายแบบ
  • ข้อมูลเดียวกันถูกเก็บในหลายรูปแบบในหลายระบบ
  • ข้อมูลถูกเก็บในระบบและรูปแบบที่ยากต่อการเข้าใจและแปลความ

ไม่มีความคิดเห็น:

แสดงความคิดเห็น