質問 |
答え |
Big data to duże dane do analizowania, których liczbę należy maksymalizować w celu wydobycia określonych wartości informacyjnych. 学び始める
|
|
|
|
|
Big data to duże dane do analizowania, których liczbę należy minimalizować w celu wydobycia określonych wartości informacyjnych. 学び始める
|
|
|
|
|
Big data bazuje na koncepcji 3 atrybutów (3V) 学び始める
|
|
|
|
|
Big data bazuje na koncepcji 4 atrybutów 学び始める
|
|
|
|
|
学び始める
|
|
objętość (volume), różnorodność (variety) oraz szybkość przetwarzania (vielocity)
|
|
|
学び始める
|
|
objętość (volume), różnorodność (variety) oraz szybkość przetwarzania (vielocity), wiarygodność(veracity)
|
|
|
Dane w big data są różnorodne 学び始める
|
|
|
|
|
Dane w big data są z różnych źródeł z dużą prędkością? 学び始める
|
|
|
|
|
Dane w big data są generowane z jednego źródła? 学び始める
|
|
|
|
|
Dane w big data są z różnych źródeł z małą prędkością? 学び始める
|
|
|
|
|
Wymień 6 atrybutów big data 学び始める
|
|
objętość, złożoność, szybkość, wartość, różnorodność, zmienność
|
|
|
W big data dane traktowane są jako strumienie a nie zbiory 学び始める
|
|
|
|
|
W big data dane traktowane są jako zbiory a nie strumienie 学び始める
|
|
|
|
|
Data scientist musi posiadać wiedzę zarówno z zakresu analiz danych jak również z zakresu technologii informatycznych 学び始める
|
|
|
|
|
Data scientist musi posiadać wiedzę dotyczącą technologii informatycznych 学び始める
|
|
|
|
|
Objętość danych to ich pojemność, słuzy do wprowadzania nowych idei i pomysłów, wymaga odpowiedniej infrastruktury programistycznej 学び始める
|
|
|
|
|
Objętość danych to ich pojemność, słuzy do wprowadzania nowych idei i pomysłów, nie posiada dużych wymagań 学び始める
|
|
|
|
|
Różnorodność danych mówi że dane pochodzą z różnorodnych źródeł, często w różnych formatach oraz w różnej formie 学び始める
|
|
|
|
|
Zmienność mówi że dane pochodzą z różnorodnych źródeł, często w różnych formatach oraz w różnej formie 学び始める
|
|
|
|
|
Różnorodność danych to inaczej heterogeniczność 学び始める
|
|
|
|
|
Złożoność danych to inaczej heterogeniczność 学び始める
|
|
|
|
|
Złożoność danych powiązana z hetefogenicznością danych, różnym źródłem ich pochodzenia, różnym sposobem uporządkowania danych 学び始める
|
|
|
|
|
Zmienność danych powiązana z hetefogenicznością danych, różnym źródłem ich pochodzenia, różnym sposobem uporządkowania danych 学び始める
|
|
|
|
|
Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z ogromną prędkością, wymagające często analizy w czasie rzeczywistym 学び始める
|
|
|
|
|
Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z niską prędkością, wymagające często analizy w czasie rzeczywistym 学び始める
|
|
|
|
|
Wartość danych Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z ogromną prędkością, wymagające często analizy w czasie rzeczywistym 学び始める
|
|
|
|
|
Wysoki poziom zmienności danych związana jest z prędkością przepływu danych oraz ich różnorodnym charakterem 学び始める
|
|
|
|
|
Wartość danych jest to cecha wynikająca z pozostałych atrybutów. 学び始める
|
|
|
|
|
Szybkość napływu jest to cecha wynikająca z pozostałych atrybutów. 学び始める
|
|
|
|
|
Wartość danych jest zwiazana bezpośrednio z wartością dodaną, jaką można wygenerować na podstawie danych 学び始める
|
|
|
|
|
Wartość danych jest zwiazana pośrednio z wartością dodaną, jaką można wygenerować na podstawie danych 学び始める
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o określonej strukturze, o mieszanej strukturze oraz o określonej strukturze 学び始める
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o określonej strukturze, o mieszanej strukturze oraz o zgodnej strukturze 学び始める
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o zmiennej strukturze, o mieszanej strukturze oraz o określonej strukturze 学び始める
|
|
|
|
|
Wyzwania badawcze Big Data związane są bezpośrednio z atrybutami big data 学び始める
|
|
|
|
|
Wyzwania badawcze Big Data związane są bezpośrednio z metodami big data 学び始める
|
|
|
|
|
Wyzwania badawcze Big Data można podzielić na dotyczące technologii oraz dotyczące danych. 学び始める
|
|
|
|
|
Wyzwania badawcze Big Data można podzielić na dotyczące technologii oraz dotyczące problemów 学び始める
|
|
|
|
|
Wyzwania technologiczne związane są z opracowanie odpowiedniej architektury informatycznej 学び始める
|
|
|
|
|
Wyzwania technologiczne związane są z ich charakterem i różnorodnością 学び始める
|
|
|
|
|
Wyzwania badawcze Big Data związane są z opracowanie odpowiedniej architektury informatycznej 学び始める
|
|
|
|
|
Wyzwania dotyczące danych Big Data związane są z opracowanie odpowiedniej architektury informatycznej 学び始める
|
|
|
|
|
Wyzwania dotyczące danych Big Data związane sa z ich charakterem i różnorodnością 学び始める
|
|
|
|
|
Wyzwania technologiczne- architektura informatyczna: źródła danych -> pobór danych -> gromadzenie danych -> wstępne przetwarzanie danych -> rozdzielanie danych -> Analiza danych -> modelowanie danych -> wnioskowanie na podstawie wyników analiz 学び始める
|
|
|
|
|
Wyzwania technologiczne- architektura informatyczna: 学び始める
|
|
źródła danych -> pobór danych -> gromadzenie danych -> wstępne przetwarzanie danych -> rozdzielanie danych -> Analiza danych -> modelowanie danych -> wnioskowanie na podstawie wyników analiz
|
|
|
Charakter danych możemy podzielić na: różnorodnosć źródeł, różnorodność formatów, jakość, wielowymiarowość, pojemność informacyjna, wartość biznesowa 学び始める
|
|
|
|
|
Charakter danych możemy podzielić na: jakość źródeł, różnorodność formatów, wartość, wielowymiarowość, pojemność informacyjna, wartość biznesowa 学び始める
|
|
|
|
|
Charakter danych możemy podzielić na: różnorodnosć źródeł, różnorodność formatów, jakość, wielowymiarowość, pojemność informacyjna, wartość wynikowa 学び始める
|
|
|
|
|
Cloud computing to tzw przetwarzanie w chmurze 学び始める
|
|
|
|
|
Cloud computing to tzw przetwarzanie na serwerze 学び始める
|
|
|
|
|
Cloud computing możemy podzielić na Private Cloud, Hybrid Cloud oraz Public Cloud 学び始める
|
|
|
|
|
Cloud computing możemy podzielić na Private Cloud, Hybrid Cloud oraz Protected Cloud 学び始める
|
|
|
|
|
Architektura informatyczna to połaczenie sprzetu i odpowiedniego oprogramowania wspierającego proces przetwarzania danych Big Data 学び始める
|
|
|
|
|
Apache Hadoop jest to projekt którego celem jest rozwój oprogramowania typu "open-source" do przetwarzania rozproszonych dużych zasobów danych w klastrach serwerów przy uzyciu prostych metod programistycznych 学び始める
|
|
|
|
|
Zalety Hadoop: Skalowalność, elastyczność, opłacalność, bezawaryjność 学び始める
|
|
|
|
|
Zalety Hadoop w opszarze Big Data: Skalowalność, elastyczność, niska cena, bezawaryjność 学び始める
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwirnir dodania nowych węzłów bez konieczności zmiany formatów danych, jakie są ładowane (skalowalność) 学び始める
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwirnir dodania nowych węzłów z koniecznością zmiany formatów danych, jakie są ładowane (skalowalność) 学び始める
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy dodanie możliwości poboru wszelkich rodzajów danych, o dowolnych formatach, z różnych źródeł (elastyczność) 学び始める
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy dodanie możliwości poboru wszelkich rodzajów danych, o określonych formatach, z różnych źródeł (elastyczność) 学び始める
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwienie prowadzenie równolegle obliczeń na wielu serwerach (cost-reduced) (opłacalność) 学び始める
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwienie prowadzenie równolegle obliczeń na dwóch serwerach (cost-reduced) (opłacalność) 学び始める
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy w razie problemów z jednym węzłem jego zadania zostają przekierowane do innych jednostek (bezawaryjność) 学び始める
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy w razie problemów z jednym węzłem jego zadania zostają przekierowane do innych danych (bezawaryjność) 学び始める
|
|
|
|
|
Cecha NoSQL: jest to system nie posiadajacy relacji oraz zdefiniowanego jezyka 学び始める
|
|
|
|
|
Cecha NoSQL jest to system posiadajacy relacje oraz zdefiniowany język 学び始める
|
|
|
|
|
Cecha NoSQL wykorzystywany dla danych nie posiadających określonej struktury lub semi-strukturalnych 学び始める
|
|
|
|
|
Cecha NoSQL wykorzystywany dla danych posiadających określoną struktury lub semi-strukturalnych 学び始める
|
|
|
|
|
Cecha NoSQL Skalowalność i elastyczność bazy – możliwość zwiększania wydajności systemu wraz z rosnącym zapotrzebowaniem 学び始める
|
|
|
|
|
Cecha NoSQL Skalowalność i elastyczność bazy – możliwość zwiększania wydajności systemu wraz z malejącym zapotrzebowaniem 学び始める
|
|
|
|
|
NoSQL może być stosowany ze zwykłym SQLem 学び始める
|
|
|
|
|
NoSQL nie może być stosowany ze zwykłym SQLem 学び始める
|
|
|
|
|
Klasyczne narzędzia analizy danych Big Data: 学び始める
|
|
Przetwarzanie sieciowe (Grid-computing), przetwarzanie w bazie danych (in-database-processing), analityka w pamięci (in-memory analytics)
|
|
|
Klasyczne narzędzia analizy danych Big Data: Przetwarzanie sieciowe (Grid-computing), przetwarzanie w bazie danych (in-database-processing), analityka w pamięci (in-memory analytics) 学び始める
|
|
|
|
|
NoSQL – (non SQL) nierelacyjna baza danych, umożliwiająca przechowywanie i pobieranie danych w różnych formatach w nieograniczony sposób 学び始める
|
|
|
|
|
Cykl analizy Big Data: użytkownik biznesowy -> Administrator hurtowni danych ->Data scientist->Analityk Business Intelligence->Końcowy uzytkownik biznesowy 学び始める
|
|
|
|
|
Cykl analizy Big Data - użytkownik biznesowy jest odpowiedzialny za określenie i analizę wskaźników wydajności KPI oraz za formuowanie wymagań analitycznych odnośnie danych 学び始める
|
|
|
|
|
Cykl analizy Big Data - Uzytkownik biznesowy jest to osoba odpowiedzialna za zidentyfikowanie podstawowych procesów biznesowych 学び始める
|
|
|
|
|
Cykl analizy Big Data - Administrator hurtowni Danych odpowiedzialny za definiowanie, rozwój oraz obsługę hurtowni danych oraz zarządzanie narzędziami wspomagającymi Big Data 学び始める
|
|
|
|
|
Cykl analizy Big Data - Uzytkownik biznesowy odpowiedzialny za definiowanie, rozwój oraz obsługę hurtowni danych oraz zarządzanie narzędziami wspomagającymi Big Data 学び始める
|
|
|
|
|
Cykl analizy Big Data - Data Scientist - osoba odpowiedzialna za budowę modeli analitycznych oraz ich implementację w środowisko informatyczne wspomagające Big Data 学び始める
|
|
|
|
|
Cykl analizy Big Data - Końcowy użytkownik biznesowy – (final business user, end-user) osoba wykorzystująca w swojej pracy wszelkie informacje wygenerowane przez pozostałych uczestników cyklu analizy Big Data 学び始める
|
|
|
|
|
Cykl analizy Big Data - analityk BI - Końcowy użytkownik biznesowy – (final business user, end-user) osoba wykorzystująca w swojej pracy wszelkie informacje wygenerowane przez pozostałych uczestników cyklu analizy Big Data 学び始める
|
|
F (końcowy użytkownik biznesowy)
|
|
|
Cykl analizy Big Data - analityk BI - osoba odpowiedzialna za identyfikację, zarządzanie i publikowanie kluczowych wskaźników wydajności oraz raportów, zazwyczaj w czasie zbliżonym do rzeczywistego 学び始める
|
|
|
|
|
Cykl analizy Big Data - Końcowy użytkownik biznesowy – osoba odpowiedzialna za identyfikację, zarządzanie i publikowanie kluczowych wskaźników wydajności oraz raportów, zazwyczaj w czasie zbliżonym do rzeczywistego 学び始める
|
|
|
|
|
Zarządzanie bazą danych – wszelkie działania mające na celu usprawnienie procesu pracy z danymi, przyczyniające się do obniżenia kosztów obsługi danych, przechowywania danych, administrowania oraz eksploracji 学び始める
|
|
|
|
|
Zarządzanie bazą danych typu Big Data Działania na danych możemy podzielić na: 学び始める
|
|
Gromadzenie danych, próbkowanie, wstępne przetwarzanie
|
|
|