วันพุธที่ 19 มกราคม พ.ศ. 2554

Week 9 : 19/01/11

ต้นคาบทบทวนเรื่อง Data Warehouse แล้วจึงเริ่มในเรื่องต่อไปนี้

Data Warehouse Process
เป็นขั้นตอนของการจัดทำ Data Warehouse ประกอบไปด้วย
1. Operational Data :  เป็นการรวมรวบข้อมูลทั้งจากภายในและภายนอกองค์กร
2. Meta Data : เป็นการคัดลอกและคัดแยกข้อมูล แปลงสภาพข้อมูล ให้กลายเป็นข้อมูลของข้อมูล ซึ่งใช้อธิบาย data ใน warehouse โดยในกระบวนการนี้จะมีทีมงานเข้ามาเกี่ยวข้องด้วย
3. Data Staging : ประกอบไปด้วย extract, clean, transform และ load ซึ่งเป็นขั้นตอนของการขั้นแยกข้อมูลเฉพาะในส่วนที่่ต้องการใช้ออกมา แล้วจึงทำ data cleansing เพื่อจัดระบบข้อมูล จากนั้นจึงโหลดลงใน data cube
4. Data Warehouse Business Subject : จัดทำ data warehouse โดยการกำหนด business subject
5. Business View : upload ลง web เพื่อการใช้งานในรูปแบบ dach board สำหรับการใช้งานและการตัดสินใจ

Meta Data          เป็นข้อมูลที่ใช้อธิบายเกี่ยวกับ Data ที่อยู่ใน Warehouse, เป็นแนวทางในการเคลื่อนย้าย Data ต่างๆ

Data Mart
          เป็นเสมือน Data Warehouse ขนาดย่อมของหน่วยย่อยของแต่ละแผนก มีข้อมูลเฉพาะในสิ่งที่ผู้ใช้ต้องการ เป็นสิ่งที่ใช้ในการแก้ไขปัญหาในกรณีที่มีผู้เข้าใช้จำนวนมาก โดย Data Mart แบ่งออกเป็น 2 ประเภท คือ
          1.Replicated (Dependent) Data Mart มีลักษณะเป็น Data Warehouse ของแต่ละฝ่ายงาน
          2.Stand-alone Data Mart เป็นการสร้าง Data Mart ของแต่ละฝ่ายงานขึ้นมาโดยที่ไม่มี Data Warehouse ขององค์กร เนื่องจากองค์กรยังไม่มีความพร้อม Data Mart ในลักษณะนี้มักไม่เป็นที่นิยม เนื่องจากอาจเกิดกรณีที่แต่ละฝ่ายงานไม่สามารถที่จะนำ Data Mart ของแต่ละฝ่ายมารวมเป็น Data Warehouse ขององค์กรได้

Data Cube
          เป็น Multidimensional Databases ที่เอาไว้เก็บข้อมูลที่ Transform แล้วจึงมา Load ลงที่นี่ เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น จุดเด่นของ Data Cube คือ สามารถตัดแบ่งส่วนเพื่อเลือกข้อมูลที่ต้องการวิเคราะห์ได้ ทำให้สามารถวิเคราะห์ข้อมูลที่มีได้ในหลายมิติ หลายมุมมอง ทำให้เห็นปัญหาที่ชัดเจนขึ้น

Multidimensional Data  เป็นข้อมูลที่ถูกออกแบบมาให้นำเสนอให้มองเห็นความผิดพลาดและจุดเด่นได้อย่างชัดเจน โดยข้อมูลที่มีทั้งหมดจะอยู่ในรูปแบบของลูกบาศก์ ซึ่งสามารถ Slice และ Dice ออกมาได้

Business Intelligence
           คือ เป็นการรวมกันของ การออกแบบโครงสร้างระบบ เครื่องมือต่างๆ รวมถึงฐานข้อมูลและ Apllication ต่างๆ ที่ช่วยในการทำงานวิเคราะห์ ประกอบไปด้วย 3 กลุ่ม Function และ Features ดังนี้

          1. Reporting and Analysis - เป็นส่วนออกรายงานให้แก่ผู้ใช้ ซึ่งมีตัวอย่างการออกรายงานต่างๆ เช่น
               - Enterprise Reporting System เป็นการจัดทำรายงานทั้งในรูปแบบปกติ และรูปแบบที่สามารถปรับแก้เองได้ตามต้องการ ซึ่งรายงานเหล่านี้จะเป็นข้อมูลที่เตรียมให้สำหรับผู้บริหารนำไปใช้ในการวิเคราะห์ต่างๆ
               - Dashboards เป็นการแสดงและนำเสนอรายงาน
               - Scorecard เป็นการประเมินผลและติดตามการดำเนินงาน

           2.Analytics - เป็นส่วนของการใช้เครื่องมือในการวิเคราะห์ข้อมูล โดยมีตัวอย่างดังต่อไปนี้
               - Online Analytical Processing (OLTP) เป็นเครื่องมือเริ่มต้นของผู้บริหารที่ช่วยในการวิเคราะห์ ซึ่งเครื่องมือจะช่วยระบุปัญหาและวิเคราะห์ได้ในพื้นฐาน และแสดงผลออกมาในรูปแบบของกราฟ โดยจะวิเคราะห์แบบ Multidimensional
           
               - Data Mining เป็นการแยกข้อมูลออกมาเพื่อพยากรณ์แนวโน้มที่อาจจะเกิดขึ้น ลักษณะของ Data Mining จะต้องทำกับบริษัทที่มี Database ขนาดใหญ่ ทั้งยังต้องตัดสินใจได้ว่าข้อมูลที่ค้นพบนั้นมีประโยชน์หรือไม่

          Mining Process  เริ่มต้นที่ การรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่น แล้วทำ ECTLจากนั้นทำ Mining แล้วจึงวิเคราะห์และประมวลผลข้อมูล สุดท้ายจัดทำการแปรผลข้อมูล ที่จะทำให้สามารถนำไปใช้ได้ง่ายยิ่งขึ้น

                Data Mining แบ่งออกเป็น
                    1.Clustering
                    2.Classification
                    3.Association
                    4.Sequence discovery
                    5.Prediction

         Text Mining  เป็นการจัดกระทำกับข้อมูลที่ไม่มีรูปแบบ (Unstructure Data) เช่น ความคิดเห็นของลูกค้า ซึ่งเครื่องมือนี้จะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจับกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน ตัวอย่างที่เห็นได้คือการ detect e-mail spam โดยการ detect keyword บางคำ หรือการส่งต่อกระบวนการทำงานอย่างอัตโนมัตให้แก่ผู้ที่รับผิดชอบ เช่น โทรศัพท์ตอบรับอัตโนมัติที่ให้กดเบอร์ตามฝ่ายที่ต้องการและจะโอนให้โดยตรง 

ไม่มีความคิดเห็น:

แสดงความคิดเห็น