Скачать презентацию Matakuliah M 0304 Corporate Information System Management Tahun Скачать презентацию Matakuliah M 0304 Corporate Information System Management Tahun

a0ed777a00cf6241dfaadd49027bf5e4.ppt

  • Количество слайдов: 39

Matakuliah : M 0304/Corporate Information System Management Tahun : 2008 Pertemuan - 08 Fakultas Matakuliah : M 0304/Corporate Information System Management Tahun : 2008 Pertemuan - 08 Fakultas Ilmu Komputer 1

Modul-08 Management Sumberdaya Data: Warehousing, Analyzing, Mining, dan Visualization Fakultas Ilmu Komputer 2 Modul-08 Management Sumberdaya Data: Warehousing, Analyzing, Mining, dan Visualization Fakultas Ilmu Komputer 2

Sasaran Pembelajaran • • Mengenali pentingnya data, isu 2 managerialnya, dan daur hidupnya. Menjelaskan Sasaran Pembelajaran • • Mengenali pentingnya data, isu 2 managerialnya, dan daur hidupnya. Menjelaskan sumber-2 data, pengumpulannya dan isu qualitas. Menjelaskan operasi data warehousing dan perannya dalam pengambilan keputusan. Menjelaskan penemuan informasi dan pengetahuan dan business intelligence. Memhami kekuatan dan manfaat dari data mining. Menjelaskan metoda-2 presenasi data dan menjelaskan geographical information systems(GIS), visual simulations, dan virtual reality sebaga decision support tools. Mengenali peran Web dalam manajemen data. Fakultas Ilmu Komputer 3

Data Management Applikasi-2 TI tidak dapat dikerjakan tanpa menggunakan salah satu bentuk data. Data Data Management Applikasi-2 TI tidak dapat dikerjakan tanpa menggunakan salah satu bentuk data. Data harus siap tersedia manakala dibutuhkan , lengkap dan akurat. Data perlukan dimanage , meskipun kelihatannya sulit karena beberapa alasan. • Jumlah data bertambah seiring bertambahnya waktu. • Data tersebar diseleuruh organisasi. • Data dikumpulkan oleh banyak individu menggunakan beragam metoda. • Data External yang diperlukan harus dipertimbangkan dalam pengambilan keputusan organisasi. • Pengemanan Data, qualitas, dan integritas adalah kritikal. • Pemilihan alat 2/tools data management dapat menjadi masalah pokok. Data adalah asset, ketika dirubah jadi informasi dan pengetahuan, dapat memberikan keunggulan bersaing perusahaan. Fakultas Ilmu Komputer 4

Data Life Cycle Process Usaha berjalan pada data yang telah diproses menjadi informasi dan Data Life Cycle Process Usaha berjalan pada data yang telah diproses menjadi informasi dan pengetahuan , yang akan digunakan manajer dalam menghadapai masalah dan peluang. Trnasformasi data kedalam pengetahuan dan solusi-2 dijalankan dengan beberapa cara. 1. Pengumpulan data baru terjadi dari beragam sumber. 2. Disimpan sementara dalam sebuah database kemudian diolah untuk memenuhi format data warehouse atau data mart dari organisasi. 3. Users kemudian akses data warehouse atau data mart dan ambil satu copy dari data yang dibutuhkan untuk analisis. 4. Analysis (mencari patterns) dilakukan dengan ¡ Data analysis tools ¡ Data mining tools Hasil dari aktivitas ini adalah pembangkitan decision support dan knowledge Fakultas Ilmu Komputer 5

Data Life Cycle Process Continued hasilnya – pembangkitan knowledge Fakultas Ilmu Komputer 6 Data Life Cycle Process Continued hasilnya – pembangkitan knowledge Fakultas Ilmu Komputer 6

Sumber-2 Data life cycle dimulai dengan mendapatkan data dari sumber data. Sumber-2 ini dapat Sumber-2 Data life cycle dimulai dengan mendapatkan data dari sumber data. Sumber-2 ini dapat diklasifikasikan sebagai internal, personal, dan external. • • Sumber Data Internal umumnya disimpan dalam data base perusahaan. Data tentang people, products, services, dan processes. Data Personal adalah dokumentasi dari expertise pegawai perusahaan umumnya dipelihara oleh pegawai, dalam bentuk : – – – • • Estimasi penjualan Opini tentang para pesaing business rules Procedures Dls. Sumber data External dapat berasal dari database komersial ataupun laporan-2 Pemerintahan Internet dan Commercial Database Services dapat diakses melalui internet. Fakultas Ilmu Komputer 7

Methode-2 Pengumpulan bahan data Tugas pengumpulan dapat sangatlah kompleks , dimana akan menciptakan masalah Methode-2 Pengumpulan bahan data Tugas pengumpulan dapat sangatlah kompleks , dimana akan menciptakan masalah kualitas -data diperlukan validasi dan pembersihan /cleansing dari data. • Pengumpulan dapat dilakukan : – dilapangan – dari individual – Melalui metoda manual • • – – time studies Surveys Observations contributions dari experts Menggunakan instrument 2 dan sensor 2 Transaction processing systems (TPS) via electronic transfer Dari web site (Clickstream) Fakultas Ilmu Komputer 8

Methode-2 Pengumpulan bahan data Satu cara untuk memperbaiki pengumpulan data dari sumber eksternal yang Methode-2 Pengumpulan bahan data Satu cara untuk memperbaiki pengumpulan data dari sumber eksternal yang banyak digunakan data flow manager (DFM), yang mengambil informasi dari sumber externaldan menempatkan dimana dibutuhkan dalam bentuk yang mudah digunakan. • DFM terdiri dari: – suatu decision support system – suatu central data request processor – suatu data integrity component – Sambungan ke external data suppliers – Proses-2 digunakan oleh pemasok data external. Fakultas Ilmu Komputer 9

Qualitas dan Integritas Data Qualitas Data (QD) adalah sangat penting , karena qualitas data Qualitas dan Integritas Data Qualitas Data (QD) adalah sangat penting , karena qualitas data menentukan kegunaan data terkait dengan qualitas dari keputusan yang diambil berdasarkan data. Integritas Data cara 2 agar data harus accurate, accessible, dan upto-date. • • Intrinsic QD: Akurasi, objektivitas, dapat-dipercaya, dan reputasi. Accessibility DQ: Accessibility dan access security. Contextual DQ: Relevancy, value added, timeliness, completeness, jumlah dari data. Representation DQ: mudah diinterpretasi, mudah dipahami, ringkas, konsisten. Qualitas Data adalah fondasi dari effective business intelligence. Fakultas Ilmu Komputer 10

Manajemen Dokumen Management Dokumen adalah pengendalian otomatis dari dokumen 2 elektronik , image, spreadsheets, Manajemen Dokumen Management Dokumen adalah pengendalian otomatis dari dokumen 2 elektronik , image, spreadsheets, dokumen word processing, dan dokumen-2 kompleks yang lain memalui siklus hidup mereka dalam satu organisasi , dari mulai penciptaan sampai dengan akhir pengarsipan. • Memelihara dokumen-2 kertas, mensyaratkan : – Setiap orang memiliki versi terkini – Satu jadwal pemutahiran harus ditetapkan – Pengamanan disediakan untuk dokumen – Dokumen-2 didistribusikan kepada individu-2 yang tepat sasaran dan tepat waktu Fakultas Ilmu Komputer 11

Transactional vs. Analytical Data Processing Transactional processing berada di operational systems (TPS) yang menyediakan Transactional vs. Analytical Data Processing Transactional processing berada di operational systems (TPS) yang menyediakan kemampuan organisasi untuk melaksakan transaksi-2 bisnis dan menghasilan laporan 2 transaksional. Data diorganisasikan dalam satu hierarchical structure dan diolah terpusat. Ini dilakukan terutama untuk kecepatan dan efisiensi proses-2 rutin data yang berulang atau repetitive. Analytical processing, melibatkan analisis dari data yang telah diakumulasi dalam TPS, sering dikenal juga sebagai business intelligence , termasuk didalamnya data mining, decision support systems (DSS), querying, dan aktivitas analisis lainnya. Analisis 2 ini menempatkannya pada strategic information bagi pengambil keputusan untuk memperbaiki produktivitas dan membuat keputusan-2 lebih baik , bersama-sama membawa ke pada keunggulan perusahaan untuk bersaing. Fakultas Ilmu Komputer 12

Data Warehouse Suatu data warehouse adalah repositori dari subject-oriented historical data yang diorganisasikan agar Data Warehouse Suatu data warehouse adalah repositori dari subject-oriented historical data yang diorganisasikan agar mudah diakses dalam satu bentuk , tersedia dan dapat diterima untuk aktivitas pengolahan analisis( seperti data mining, decision support, querying, dan lain-2 applications ). • Benefit dari data warehouse adalah: – Kemampuan untuk mendapatkan data yang cepat, karena ditempatkan pada satu lokasi – Kemampuan untuk mendapatkan data secara mudah dan sering bagi user dengan Web browsers. • Karakteristik data warehousing adalah: – Organization. Data diorganisasikan berdasarkan subject – Consistency. Dalam warehouse data akan di kode dengan cara yang konsisten. Fakultas Ilmu Komputer 13

Data Warehouse Continued • Karakteristik data warehousing adalah : – Time variant. Data disimpan Data Warehouse Continued • Karakteristik data warehousing adalah : – Time variant. Data disimpan untuk jangka yang lama sehingga dapat digunakan untuk analisis trend, forcasting dan perbandingan-2 berdasarkan waktu. – Nonvolatile. Sekali dimasukkan kedalam warehouse, data tidak diupdate. – Relational. Pada umumnya data warehouse menggunakan struktur relational. – Client/server. Data warehouse menggunakan client/server architecture, terutama untuk menyediakan kemudahan bagi user untuk akses data. – Web-based. Data warehouses dirancang untum menyediakan lingkungan komputasi yang efisien untuk aplikasi 2 berbasis Web applications Fakultas Ilmu Komputer 14

Data Warehouse Continued Fakultas Ilmu Komputer 15 Data Warehouse Continued Fakultas Ilmu Komputer 15

Data Mart adalah versi turunan data warehouse skala kecil dirancang untuk satu strategic business Data Mart adalah versi turunan data warehouse skala kecil dirancang untuk satu strategic business unit (SBU) atau departmen. Mereka berisi lebih sedikit informasi daripada data warehouse, dapat memberikan respons lebih cepat dan kemudahan untuk navigasi ketimbang enterprise-wide data warehouses. • Ada dua tipe data mart : – Replicated (dependent) data marts adalah subset 2 kecil dari data warehouse. Di beberapa kasus satu mereplikasi beberapa subset dari data warehouse kedalam data marts yang lebih kecil, masing-2 untuk satu area functional. – Stand-alone data marts. Satu perusahaan dapat memiliki satu atau lebih data marts mandiri tanpa harus memiliki data warehouse. Biasanya data marts adalah untuk marketing, finance, dan aplikasi-2 engineering. Fakultas Ilmu Komputer 16

Data Cube Multidimensional databases (kadang dikenal OLAP) adalah simpanan data khusus yang mengorganisasikan fakta-2 Data Cube Multidimensional databases (kadang dikenal OLAP) adalah simpanan data khusus yang mengorganisasikan fakta-2 berdasarkan dimensi 2, seperti geographical region, lini-produk , salesperson, waktu. Data dalam database ini umtumnya preproses dan dismpan dalam data cubes. • Satu titikpotong mungkin kuantitas dari produk dijual oleh lokasi 2 retail-tententu selama periode 2 waktu tertentu. • Lain matrix mungkin Sales volume per department, perhari, perbulan, per tahun, untuk satu specific region • Cubes menyediakan kecepatan: – – Queries Slices dan Dices dari informasi Rollups Drill Downs Fakultas Ilmu Komputer 17

Simpanan Data Operational adalah database untuk transaction processing systems (TPS) yang menggunakan konsep data Simpanan Data Operational adalah database untuk transaction processing systems (TPS) yang menggunakan konsep data warehouse untuk menyediakan clean data kepada TPS. Hal ini membawakonsep data warehouse dan manfaatnya ke porsi operasional bisnis. • Umumnya digunakan untuk keputusan-2 jangka pendek yang memerlukan waktu yang sensitif untuk analisis data. • Secara logika berada diantara operational data pada legacy systems dan data warehouse. • Menyedian detail , bukan summary data. • Dioptimized untuk akses yang sering • Menyediakan kecepatan waktu respon lebih besar. Fakultas Ilmu Komputer 18

Business Intelligence Business intelligence (BI) adalah satu kategori aplikasi dan teknik yang luas untuk Business Intelligence Business intelligence (BI) adalah satu kategori aplikasi dan teknik yang luas untuk gathering, storing, analyzing dan penyediaan akes ke data. Membantu user-2 perusahaan membuat keputusan-2 bisnis dan strategis lebih baik. Applikasi-2 pokok termasuk aktivitas-2 : query dan reporting, online analytical processing (OLAP), DSS, data mining, forecasting dan statistical analysis. • Business intelligence mencakup : – output 2 seperti financial modeling dan budgeting – resource allocation – coupons dan sales promotions – Seasonality trends – Benchmarking (business performance) – competitive intelligence. Diawali dengan Knowledge Discovery Fakultas Ilmu Komputer 19

Business Intelligence Continued Bagaimana Mereka bekerja. Fakultas Ilmu Komputer 20 Business Intelligence Continued Bagaimana Mereka bekerja. Fakultas Ilmu Komputer 20

Knowledge Discovery Sebelum informasi dapat diproses kedalam BI , terlebih dahuluharus di “ discovered” Knowledge Discovery Sebelum informasi dapat diproses kedalam BI , terlebih dahuluharus di “ discovered” atau ekstrak data simpanan-2 data. Tujuan utama dari knowledge discovery in databases (KDD ) adalah untuk mengidentifikasi valid, novel, potensi usefulness, dan understandable patterns dalam data. • KDD didukung oleh teknologi : – massive data collection – powerful multiprocessor computers – data mining dan algorithma lain. • KDD pada dasarnya menggunakan tool untuk information discovery: – Traditional query languages (SQL, …) – OLAP – Data mining Discovering useful patterns Fakultas Ilmu Komputer 21

Knowledge Discovery Continued Discovering useful patterns Fakultas Ilmu Komputer 22 Knowledge Discovery Continued Discovering useful patterns Fakultas Ilmu Komputer 22

Queries memungkinkan user untuk meminta informasi dari komputer yang tidak tersedia dalam laporan 2 Queries memungkinkan user untuk meminta informasi dari komputer yang tidak tersedia dalam laporan 2 periodik. Query systems sering disediakan dengan basis menu atau jika data disimpan dalam sebuah data base data relational, melalui structured query language (SQL) atau menggunakan metoda query-by-example (QBE). • Permintaan user dinyatakan dalam satu bahasa query User requests are stated in a query language dan hasilnya adalah subset 2 dari relationship atau hubungan 2 nya. – Sales by department by customer type untuk periode tertentu – Kondisi cuaca untuk tanggal tertentu – Sales per hari, per minggu – … Fakultas Ilmu Komputer 23

Online Analytical Processing Online analytical processing (OLAP ) adalah satu set alat 2 atau Online Analytical Processing Online analytical processing (OLAP ) adalah satu set alat 2 atau tools yang digunakan untuk menganalisis dan mengaggregasi data untuk merefleksikan kebutuhan 2 bisnis dari perusahaan. Struktur bisnis ini (multidimensional views dari data) memungkinkan users dapat men jawab dengan cepat pertanyaan 2 bisnis. OLAP dijalankan pada Data Warehouses dan Marts. • ROLAP (Relational OLAP) merupakan satu OLAP database yang diimplementasikan pada tataran atas dari relational database yang ada. Multidimensional view dicreate setiap saat untuk user. • MOLAP (Multidimensional OLAP) adalah specialized multidimensional data store seperti Data Cube. Multidimensional view secara physik disimpan dalam specialize data files. Application View bukan struktur data atau schema Fakultas Ilmu Komputer 24

Data Mining Data mining adalah alat /tool untuk menganalisis data dalam jumlah yang besar. Data Mining Data mining adalah alat /tool untuk menganalisis data dalam jumlah yang besar. Menurunkan namanya dari kesamaan antara pencarian /searching untuk valuable business information dalam database yang besar. • Data mining technology dapat mengenerate peluang 2 business yang baru dengan menyediakan : – Automated prediction dari trends dan behaviors. – Automated discovery dari pattern 2 yang tidak dikenal sebelumnya atau tersembunyi. • Data mining tools dapat dikombinasikan dengan : – Spreadsheets – • Lain 2 end-user software development tools Data mining mengcreate satu data cube kemudian meng extracts data Fakultas Ilmu Komputer 25

Teknik-2 Data Mining • • Case-based reasoning, menggunakan kasus historis untuk mengenali pattern 2 Teknik-2 Data Mining • • Case-based reasoning, menggunakan kasus historis untuk mengenali pattern 2 Neural computing yaitu sebuah pendekatan mesin pembelajar yang menguji data historis untuk pattern 2. Intelligent agents meretrieve informasi dari Internet atau dari database 2 berbasis intranet. Association analysis menggunakan satu set algorithma khusus yang mengurut sejumlah besar data set dan menunjukkan statistical rules diantara item 2. Decision trees Genetic algorithms Nearest-neighbor method Fakultas Ilmu Komputer 26

Tugas Data Mining • • Classification. Menentukan karakteristik dari kelompok tertentu. • • • Tugas Data Mining • • Classification. Menentukan karakteristik dari kelompok tertentu. • • • Association. Identifikasi relationships antara event 2 yang terjadi pada suatu saat. Sequencing. Identifies relationships yang ada sepanjang satu periode waktu. Forecasting. Estimasi nilai 2 masadatang berdasarkan patterns dalam sekumpulan besar data. Regression. Memetakan sebuah data item pada satu variable prediksi. Time Series analysis dan menguji sebuah nilai atas variasinya sepanjang waktu. Clustering. Identifikasi kelompok/groups dari item 2 yang berbagi satu karakteristik. Clustering berbeda dengan classification, dimana tidak ada penentuan terlebih dulu karakteristik Fakultas Ilmu Komputer 27

“Other” Mining Environments Sebagai tambahan pada data stored dalam traditional databases ada tersedia struktur “Other” Mining Environments Sebagai tambahan pada data stored dalam traditional databases ada tersedia struktur lain yang dapat digali untuk pattern. • Text Mining adalah aplikasi dari data mining pada non-structured atau less-structured text files • Web Mining adalah aplikasi dari teknik data mining untuk data terkait World Wide Web. Data dapat ditampilkan dalam web pages atau yang terkait activitas Web. • Spatial Mining adalah aplikasi dari teknik data mining untuk data yang mempunyai komponen lokasi. • Temporal Mining adalah aplikasi dari data mining untuk data yang dipelihara untuk multiple points dalam waktu. Fakultas Ilmu Komputer 28

Data Visualization Data visualization merujuk pada presentation dari data oleh technologies seperti digital images, Data Visualization Data visualization merujuk pada presentation dari data oleh technologies seperti digital images, geographical information systems, graphical user interfaces, multidimensional tables dan graphs, virtual reality, three-dimensional presentations, videos dan animation. • Multidimensionality Visualization: Modern data dan informasi dapat memiliki beberapa dimensi. – Dimensions: • Products • Salespeople • Market segments • Unit Business • Geographical locations • Distribution channels • Countries • Industries Fakultas Ilmu Komputer 29

Data Visualization Continued Multidimensionality Visualization: – Measures: • • • Money Sales volume Head Data Visualization Continued Multidimensionality Visualization: – Measures: • • • Money Sales volume Head count Inventory profit Actual versus forecasted results. – Time: • • • Fakultas Ilmu Komputer Daily Weekly Monthly Quarterly Yearly. 30

Data Visualization Continued Fakultas Ilmu Komputer 31 Data Visualization Continued Fakultas Ilmu Komputer 31

Data Visualization Continued • • • A geographical information system (GIS) adalah suatu computer-based Data Visualization Continued • • • A geographical information system (GIS) adalah suatu computer-based system untuk capturing, storing, checking, integrating, manipulating, dan displaying data menggunakan digitized maps. Setiap record atau digital object memiliki satu identified geographical location. Menggunakan spatially oriented databases. Visual interactive modeling (VIM) menggunakan computer graphic displays untuk menampilkan impact dari keputusan management atau operational yang berbeda terhadap objectives seperti profit atau market share. Virtual reality (VR) interactive, computer-generated, three-dimensional graphics yang disajikan untuk user. Fakultas Ilmu Komputer 32

Specialized Databases Data warehouse dan data mart melayani end users pada semua area functional. Specialized Databases Data warehouse dan data mart melayani end users pada semua area functional. Kebanyakan current databases adalah static: Sederhana mengumpulkan dan menyimpan informasi. Kini lingkungan bisnis juga membutuhkan specialized databases. • Marketing transaction database (MTD) – Kombinasi banyak karakteristik dari current databases dan sumber data marketing kedalam satu database baru yang memungkinkan marketers untuk menggunakan dalam real-time personalization dan target setiap interaksi dengan customers • Interactive capability – satu transaksi interactive terjadi dengan pelanggan dalam pertukaran informasi dan updating database dalam real time, lawannya periodik (weekly, monthly, or quarterly) update warehouses and marts klasik. Fakultas Ilmu Komputer 33

Web-based Data Management Systems Aktivitas 2 Data management dan business intelligence — dari mulai Web-based Data Management Systems Aktivitas 2 Data management dan business intelligence — dari mulai data acquisition sampai mining— biasanya dilaksanakan dengan Web tools , atau gabungan Web technologies dan e-business tools. Hal ini dilakukan melalui intranets, danvia extranets. • Enterprise BI suites dan Corporate Portals integrasi query, reporting, OLAP, dan lain 2 tools • Intelligent Data Warehouse Web-based Systems menggunakan search engine untuk specific applications dimana dapat memperbaiki operasional data warehouse • Clickstream Data Warehouse terjadi didalam lingkungan Web, ketika pelanggan mengunjungi Web site. Fakultas Ilmu Komputer 34

Web-based Data Management Systems Continued Fakultas Ilmu Komputer 35 Web-based Data Management Systems Continued Fakultas Ilmu Komputer 35

Web-based Data Management Systems Continued Fakultas Ilmu Komputer 36 Web-based Data Management Systems Continued Fakultas Ilmu Komputer 36

MANAGERIAL ISSUES • • Cost-benefit issues and justification. Where to store data physically. Legal MANAGERIAL ISSUES • • Cost-benefit issues and justification. Where to store data physically. Legal issues. . Internal or external? Fakultas Ilmu Komputer 37

Fakultas Ilmu Komputer 38 Fakultas Ilmu Komputer 38

Fakultas Ilmu Komputer 39 Fakultas Ilmu Komputer 39