RSS
 

Archiwum dla kategorii ‘XIV. Business Intelligence’

Użytkownicy BI. Skuteczne wdrożenie BI. Trendy i przyszłość BI

18 gru

Użytkownicy systemów BI
BI integruje ze sobą ludzi, procesy i technologię. W cyklu BI biorą udział trzy grupy ludzi, a zarazem trzy grupy użytkowników BI – specjaliści IT, analitycy biznesowi i kadra zarządzająca. Pierwsza grupa – specjaliści IT – to ludzie odpowiadający za przygotowanie danych. Drugą grupę stanowią analitycy biznesowi, którzy tworzą raporty, analizy i modele, oceniają je, modyfikują, odświeżają. Trzecia to zarząd, który z jednej strony określa problem, a z drugiej ocenia, czy uzyskany wynik jest wystarczający, czy też powoduje pojawienie się kolejnych pytań. Przy obecnym rozwoju narzędzi BI grupy te są bardziej ze sobą zintegrowane.

Uwarunkowania skutecznego wdrożenia rozwiązań BI
Sukces wdrożenia rozwiązania jest ściśle połączony z wykorzystaniem jego funkcjonalności przez poszczególnych użytkowników. W praktyce o sukcesie wdrożenia decyduje jego zdolność z zakładanymi oczekiwaniami.

Coraz więcej przedsiębiorstw decyduje się na stworzenie Business Intelligence Competency Center (BICC), aby w pełni wykorzystywać wdrożony system BI. BICC to zespół z określonymi zadaniami, rolami i odpowiedzialnościami promujący i wspierający efektywne wykorzystanie BI w organizacji. To bardziej holistyczne podejście do BI obejmuje znacznie więcej niż technologię i w swojej strategii wyróżnia cztery wymiary: kapitał ludzki, procesy wiedzy, kulturę oraz infrastrukturę.

Trendy i przyszłość BI
W ewolucji rozwiązań BI wyróżnić można kilka istotnych trendów:
- poprawienie dokładności analiz i szybkości ich uzyskiwania,
- rozwój rozwiązań korporacyjnych,
- dalszy rozwój rozwiązań branżowych,
- integracja rozwiązań BI, gdzie systemy raportowania i zapytań oraz analityki są osadzone w procesach biznesowych,
- zwiększenie efektywności poprzez skrócenie czasu uzyskania dostępu do niezbędnych, wartościowych danych i ich analiz w optymalnym czasie,
- rozwój interfejsu użytkownika.

 

Funkcjonalność rozwiązań BI

17 gru

Najczęściej można się spotkać z dwoma wersjami określenia funkcjonalności rozwiązań BI: tradycyjnym i nowoczesnym. Według tradycyjnego BI jest rozumiany jedynie jako system do zapytań i raportowania. Obecnie BI należy rozumieć jako system informatyczny, który:
- zapewnia integrację danych za pomocą szerokiego zestawu rozwiązań technologicznych,
- umożliwia składowanie dużych wolumenów danych w sposób pozwalający na szybkie wykonanie pożądanych analiz i zapytań ad hoc,
- dostarcza mechanizmów przetwarzania danych, aby realizować zaawansowane analizy,
- umożliwia udzielanie odpowiedzi na zapytania, generowanie raportów oraz prezentację informacji w sposób przyjazny dla różnych użytkowników – od analityków aż po wyższą kadrę zarządzającą.

FUNKCJONALNOŚĆ ROZWIĄZAŃ ENTERPRISE BUSINESS INTELLIGENCE WEDŁUG OXFORD/HEC
Funkcjonalność rozwiązań Enterprise Business Intelligence

Raportowanie
Dostęp do informacji biznesowej może być przygotowany w postaci raportów statycznych, tzn. takich, w których poszczególne wartości są naliczane jednokrotnie i udostępniane wielu odbiorcom.

Raporty statyczne mogą być cyklicznie odświeżane, aby prezentowane informacje były zgodne z obecnym stanem źródłowych baz danych. Po pojawieniu się nowych, aktualnych danych za kolejny okres raport zostanie automatycznie odświeżony.

Raporty najczęściej są dostępne dla użytkownika poprzez przeglądarkę internetową. Raporty dynamiczne stwarzają możliwość modyfikacji pierwotnie zaprojektowanego raportu dla analizy informacji w bardziej przystępny dla użytkownika sposób niż było to planowane w momencie projektowania raportu.

Filtrowanie danych oznacza wybór podzbioru danych z ogółu dostępnych danych na podstawie warunku określonego przez użytkownika.

Dzięki dynamicznemu środowisku raportowemu łatwo tworzyć nowe zestawienia, raporty i analizy, a to umożliwia pracę w trybie ad hoc. Możliwości takiego systemu są więc w zasadzie nieograniczone. Wykorzystuje się technologię map informacyjnych.

Dostęp do danych i ich integracja
Integracja danych obejmuje zbieranie danych z różnych źródeł, czyszczenie ich i wzbogacanie.
Powszednim zadaniem wykonywanym przez działy informatyki są migracje danych.

Proces czyszczenia, a więc usuwania danych nieprawidłowych i zbędnych w ogólnym procesie ładowania danych, jest coraz bardziej doceniany. Obecnie do opisania tego procesu używa się coraz częściej określenia „higiena danych”, czyli czyszczenie i podporządkowanie danych.

Przetwarzanie i analizowanie danych
Najprostsze analizy to statystyka opisowa. Ten rodzaj analiz umożliwia otrzymanie odpowiedzi na pytanie, co się wydarzyło. Takie raporty nazywane są płaskimi, ponieważ są przedstawiane w postaci płaskich tabel.

Innym typem są analizy OLAP On-Line Analytical Processing), czyli analizy oparte na wielowymiarowych strukturach danych, umożliwiające obserwowanie trendów i statystyk nieosiągalnych w raportach płaskich, tabelarycznych, wykonywanych bezpośrednio na hurtowni danych.

OLAP to ogół analiz i procesów przetwarzania danych w krótkim czasie (on-line), tzn. w czasie pozwalającym na realną interakcję z systemem.

Kostka OLAP (OLAP Cube) stanowi wielowymiarową strukturę danych, w której dane są uporządkowane w postaci:
- poziomów,
- wymiarów,
- i miar.

Kostka OLAP umożliwia dostęp do danych z różnych punktów widzenia i jest podstawową strukturą danych w systemie OLAP, działającym w środowisku hurtowni danych. Kostka jest zoptymalizowana pod kątem szybkiego, wydajnego i bezpiecznego dostępu do danych wielowymiarowych – dzięki specjalnej wielowymiarowej strukturze oraz przechowywaniu agregatów danych.

Drążenie danych to przeglądanie danych w strukturze wielowymiarowej (OLAP), polegające na przechodzeniu na niższy poziom agregacji danych.

Kostki OLAP są udostępniane zewnętrznym aplikacjom za pomocą programu zwanego serwerem OLAP. Działa on na podobnej zasadzie jak serwer baz danych, z tą różnicą, że zwraca podzbiory kostek wielowymiarowych OLAP, a nie płaskie podzbiory tabel. Najbardziej popularne i najczęściej stosowane w praktyce to model relacyjny (ROLAP – Relational On-Line Analytical Processing), wielowymiarowy (MOLAP – Multidimensional On-Line Analytical Processing) i hybrydowy (HOLAP – Hybrid On-Line Analytical Processing).

Struktura ROLAP, często zwana też po prostu OLAP, zawiera agregaty danych zdefiniowane poprzez relacyjne modele danych. Technologia MOLAP przechowuje agregaty w postaci wielowymiarowej. Jest to struktura wydajniejsza niż ROLAP, ale redundantna. Zaletą ROLAP jest standaryzacja języka (SQL). Z kolei wadą MOLAP jest brak jednolitego języka zapytań. Możliwa jest jeszcze kombinacja obu technik. Taka struktura hybrydowa nosi nazwę HOLAP.

Wielowymiarowa kostka OLAP stanowi podstawową strukturę danych w systemie OLAP działającym w środowisku hurtowni danych. Składa się ona z:
- miar, jak wskaźniki numeryczne,
- wymiarów, jak dane opisowe,
- poziomów, które odzwierciedlają hierarchię funkcjonującą w organizacji.

Szczególnie istotne z punktu widzenia korzyści dla biznesu wydają się narzędzia umożliwiające zaawansowane analizy (ang. advanced analytics) – modelowanie predykcyjne, prognozowanie i optymalizacja.

Publikacja wyników i inne sposoby dystrybucji informacji
Dystrybucja informacji
w przedsiębiorstwie może polegać np. na przygotowaniu i dostarczeniu raportu dla zarządu w formacie PDF, RTF, HTML lub innym powszechnie dostępnym czy też automatycznym wysyłaniu e-maili do klienta. Raz przygotowane analizy mogą być łatwo powtórzone w przypadku zmiany danych.

 

Hurtownia danych

16 gru

Rola hurtowni danych w przedsiębiorstwie
W przedsiębiorstwach istnieje zwykle wiele systemów informatycznych. Są to systemy finansowo-księgowe, systemy magazynowe, systemy wspierające sprzedaż czy marketing, itp. Obsługują one bezpośrednie operacje, aktualizując dane. Operacje wykonywane za pomocą systemu transakcyjnego mogą jednocześnie powodować zmiany w danych przechowywanych w systemie. Dane w nim przechowywane są nietrwałe.

Systemy analityczne mają za zadanie dostarczanie informacji potrzebnych do analizy danego problemu. Najczęściej wykonywanymi zadaniami są różne porównania w czasie.

Systemy analityczne nie przechowują informacji o wszystkich zdarzeniach w systemie, ale zawierają informacje odnoszące się do konkretnych punktów w czasie. Istotna jest decyzja dotycząca częstotliwości przenoszenia danych z systemów transakcyjnych do systemu analitycznego. Dane w systemie analitycznym są stałe, tzn. nie są aktualizowane przez użytkowników w czasie pracy.

Systemy transakcyjne umożliwiają przyjmowanie dużej ilości szczegółowych danych, wprowadzanie w nich poprawek , wyszukiwanie danych, generowanie prostych zestawień i raportów opartych na danych zgromadzonych w systemie. Systemy analityczne służą m.in. do obliczania nowych wskaźników i zmiennych, symulacji efektów różnych zmian, wykrywania nieznanych wcześniej relacji, struktur i charakterystyk danych. Przechowywane w tych systemach dane są niezmienne i wykorzystywane w procesie podejmowania decyzji.

Zasobem danych, służącym podejmowaniu decyzji w systemach BI, jest hurtownia danych o następujących właściwościach:
- zorientowanie tematyczne,
- zintegrowanie,
- niezmienność,
- wielowersyjność czasowa.

Architektura hurtowni danych
W hurtowni danych można wyróżnić trzy podstawowe obszary działania:
- zasilanie,
- przechowywanie i zarządzanie danymi,
- eksploatacja hurtowni danych.

W schemacie architektury hurtowni danych można wyróżnić trzy główne obszary:
- na wejściu – dane operacyjne znajdujące się w różnych systemach transakcyjnych,
- centralnym punktem jest metabaza, zawierająca struktury danych przechowywania w hurtowni danych,
- na wyjściu – metody oraz narzędzia prezentacji i publikowania raportów.

Obszar zasilania danymi z systemów źródłowych to wszelkie mechanizmy związane z pozyskiwaniem danych z transakcyjnych systemów źródłowych, ich przekształcenie, kontrola poprawności, czyszczenie oraz ładowanie. Systemy źródłowe odpowiadają za finanse, logistykę, marketing, sprzedaż, produkcję i inne. Część z tych danych trafia wcześniej do bazy danych operacyjnych, wszystkie zaś dane potrzebne do dalszych analiz ładowane są do hurtowni danych i stanowią jej repozytorium.

Architektura ta może obejmować także hurtownie tematyczne (ang. data marts) dedykowane dla potrzeb konkretnych działów lub grup użytkowników. Są one zlokalizowane pomiędzy centralnym repozytorium a obszarem eksploatacji danych. Inna wersja architektury może obejmować także operacyjną składnicą danych (ang. operational data store, ODS) jako element pośredni pomiędzy transakcjami systemami źródłowymi a repozytorium centralnym. Operacyjna składnica danych służy do podejmowania operacyjnych decyzji i w odróżnieniu od hurtowni danych ten zbiór danych może być modyfikowany, a same dane powinny być przede wszystkim bieżące.

Zasilanie hurtowni danych stanowi proces przenoszenia danych z systemów transakcyjnych do hurtowni danych. Oznacza on ich przekształcenie do postaci właściwej dla hurtowni danych. Proces zasilania jest realizowany różnie, w zależności od liczby źródeł danych i sposobu, w jaki te dane są przechowywane. Ważna jest także wydajność.

Centralnym obszarem hurtowni danych jest przechowywanie danych i zarządzanie nimi. W jego kontekście należy rozważyć: stopień zagregowania danych, ich ziarnistość oraz modele hurtowni danych.

Dane przechowywane w hurtowni danych można uporządkować ze względu na ich stopień zagregowania: od danych bieżących, szczegółowych, do danych silnie zagregowanych. Szczególnym składnikiem hurtowni danych są metadane.

Metadane opisują dane zawarte w hurtowni danych w zakresie:
- ich przekształceń wykonanych podczas przeniesienia do hurtowni danych,
- ich agregacji,
- opisu znaczenia danych i sposobu ich wykorzystania,
- struktury i formatu danych,
- znaczenia,
- reguł opisujących sposób tworzenia i korzystania z danych,
- właściciela danych,
- innych atrybutów danych.

Dane wprowadzone z transakcyjnych systemów źródłowych mogą być z czasem usunięte, zagregowane lub zarchiwizowane.

Ziarnistość danych to stopień szczegółowości przechowywania danych.

Hurtownia danych nie musi zawierać szczegółowych danych czy wszystkich poziomów agregacji. W rzeczywistości najczęściej stosuje się rozwiązanie pośrednie, czyli różną ziarnistość danych dla różnych okresów, dane najświeższe są najbardziej szczegółowe, a najstarsze najbardziej zagregowane.

Klasyfikacja modeli hurtowni ze względu na zakres przechowywanych danych:
- korporacyjny model danych,
- tematyczny model danych.

Model korporacyjny zakłada istnienie centralnej kontroli nad wszystkimi danymi w hurtowni. Dane tworzą całość i umożliwiają globalne spojrzenie na przedsiębiorstwo.

Model hurtowni zazwyczaj składa się z niezależnych hurtowni tematycznych, opisujących poszczególne obszary działalności organizacji. Model konstruuje się, rozpoczynając od najbardziej ogólnych pojęć, następnie je uszczegóławiając.

Klasyfikacja hurtowni danych ze względu na wewnętrzną strukturę danych w hurtowni:
- modele relacyjne,
- modele wymiarowe.
Możliwe jest także połączenie obu koncepcji w jedno rozwiązanie.

Zaletą modeli wymiarowych jest możliwość szybkiego generowania raportów i uzyskania odpowiedzi na zadawane zapytania natomiast ich wadą – redundancja danych. Najbardziej popularnym modelem wymiarowym jest tzw. schemat gwiazdy. Podstawowym założeniem modelu jest rozdzielenie danych na dwie grupy – fakty i wymiary. Fakty to dane numeryczne. Wymiary to opisowe dane charakteryzujące fakty. W środku diagramu znajduje się tabela faktów, zawierająca dane numeryczne oraz klucze obce do tabel wymiarów, które widoczne są dookoła. Dane z tabeli faktów odpowiadają wartościom na raportach generowanych z hurtowni.

Tabela wymiarów albo referencyjne zawierają dane opisujące fakty, zwłaszcza atrybuty faktów. Dane w tabeli wymiarów są w postaci zdenormalizowanej. Dane te najczęściej odpowiadają nagłówkom kolumn i wierszy na raportach generowanych z hurtowni.

Modyfikacje schematu gwiazdy:
- model płatka śniegu wykorzystuje normalizację danych tabel wymiarów w hurtowni do stworzenia nowych wymiarów w postaci osobnych tabel połączonych relacjami z oryginalną tabelą wymiarów,
- model konstelacji to model zawierający więcej niż jedną tabelę faktów. Tabele te połączone są poprzez wspólne tabele wymiarów.

Trzeci obszar architektury hurtowni danych to jej eksploatacja, czyli dostęp do danych. Jest to zwykle największy i najbardziej zróżnicowany, ponieważ zależy od sposobu wykorzystania danych. Uwarunkowany jest strategią przedsiębiorstwa, określającą cele wykonywania analiz, użytkownikami hurtowni, a także specyfiką branży, w jakiej działa przedsiębiorstwo.

Wśród sposobów korzystania z hurtowni danych można wyróżnić:
- raporty statyczne – predefiniowane raporty, których definicje zostały określone przez użytkowników końcowych wraz z podaniem cyklu odświeżania tych raportów,
- raporty dynamiczne – udostępnienie użytkownikom możliwości parametryzacji raportów standardowych,
- udostępnienie narzędzi do zapytań i raportowania – użytkownik ma dostęp do zestawu danych i może z nimi pracować w sposób interaktywny,
- analizy wielowymiarowe – do wykonywania tych analiz wykorzystywane są dane znajdujące się w wielowymiarowych modelach hurtowni danych wraz z narzędziami, które ułatwia poruszanie się po tych danych, ukrywając przed użytkownikiem ich strukturę,
- systemy EIS (Executive Information Systems) – systemy informowania kierownictwa, które pozwalają na monitorowanie stanu przedsiębiorstwa przez obliczanie i śledzenie tendencji wskaźników opisujących różne obszary jego działania.

 

Rynek oprogramowania BI

15 gru

Analiza Gartnera jest oparta głównie na pogłębionych wywiadach z użytkownikami rozwiązań. Wynik analizy jest przedstawiony graficznie w postaci tzw. magicznego kwadratu, ukazując miejsce na rynku rozwiązań poszczególnych dostawców w określonym czasie. Brane są pod uwagę dwa kryteria:
- kompletność wizji (ang. completeness of vision,
- zdolność do dostarczenia tego rozwiązania (ang. ability to execute).

Pierwsze z tych kryteriów stanowi syntezę zaawansowania analizowanego systemu BI, a drugie ściśle łączy się z liczbą wdrożeń, ukazując więc, na ile proponowane rozwiązanie jest wykorzystywane w praktyce. Cztery obszary, ćwiartki kwadratu to: gracze niszowi, wizjonerzy, pretendenci i liderzy.

Brytyjski Datamonitor przedstawia rynek oprogramowania BI, biorąc pod uwagę trzy kryteria:
- zaawansowanie technologiczne – przedstawione na osi poziomej,
- opinie użytkowników – przedstawione na osi pionowej, na podstawie pogłębionych wywiadów z ponad 700 użytkownikami,
- wpływ na rynek – przedstawione na pomocą wielkości kul.

Każde z kryteriów mierzone jest w skali 0 – 10. W ten sposób Datamonitor wyróżnia 12 dostawców rozwiązań BI, dzieląc ich na trzy grupy:
- krótka lista najlepszych dostawców – najciemniejsze kule,
- dostawcy warci rozważenia – ciemne kule,
- pozostali, którym warto się przypatrywać – jasne kule.

 

Znaczenie i użyteczność Business Intelligence

14 gru

Rozwój BI to droga podążania technologii informatycznych za potrzebami biznesu. Można wyróżnić cztery etapy rozwoju tych systemów:
1) Akademickie początki,
2) Tworzenie i doskonalenie narzędzi BI i ich elementów składowych,
3) Tworzenie rozwiązań w odpowiedzi na konkretne potrzeby biznesowe,
4) Tworzenie rozwiązań dedykowanych dla poszczególnych branż z uwzględnieniem ich specyfiki.

I etap – lata 60. XX wieku, w dwóch ośrodkach uniwersyteckich tworzono niezależne systemy do analiz statystycznych. Z czasem stały się one komercyjnymi rozwiązaniami do analiz danych – SAS Institute i SPSS.

II etap – tworzenie firm specjalizujących się w oprogramowaniu tj,: SAP, Microsoft i SAS Institute, Oracle, Hyperion czy Cognos.

Business Intelligence (BI) to system doskonalenia właściwych informacji właściwym osobom we właściwym czasie, aby wspomagać procesy podejmowania decyzji przez analizę danych i w efekcie uzyskać przewagę konkurencyjną.

Systemy BI należą do klasy systemów wspomagania decyzji (SWD, DSS).

Hurtownia danych (ang. data warehouse) to zbiór danych, w których niezależne, zorientowanie tematycznie dane są przechowywane z oznaczeniem czasu ich wprowadzenia, a dane wprowadzone wcześniej nie mogą podlegać żadnym modyfikacją. Dane w hurtowni są przechowywane w postaci przetworzonej i przygotowanej na potrzeby raportów i analiz.

III etap – twórcami i właścicielami nowych rozwiązań w organizacji są osoby odpowiedzialne za IT, jednak odbiorcami i użytkownikami – osoby odpowiadające za biznes. Ze strony działów finansów, sprzedaży i marketingu czy kadr pojawiają się konkretne zapotrzebowania, a dostawcy systemów BI starają się implementować kolejne funkcjonalności zgodnie z zapotrzebowaniem użytkowników. Użytkownicy biznesowi oczekują uproszczenia narzędzi, łatwego intuicyjnego interfejsu, możliwości tworzenia raportów bez znajomości języków programowania.

Na rynku oprogramowania wyróżniono cztery wyraźne obszary, każde ze swoim liderem:
- aplikacje biurowe – Microsoft,
- bazy danych – Oracle,
- aplikacje biznesowe (ERP) – SAP,
- systemy analityczno-raportowe – SAS Institute.

IV etap – producenci rozwiązań zaczęli tworzyć narzędzia dedykowane dla poszczególnych branż z wykorzystaniem ich specyfiki.