Dane
13.08.2025

Ten prompt pomoże Ci okreslić kroki do przeprowadzenia eksploracyjnej analizy danych (EDA) na dużym zbiorze danych w [branża] - Prompt do ChatGPT

Zyskaj krok‑po‑kroku przewodnik EDA dla dużych danych: kod, checklisty, KPI, dashboardy i reproducja. Szybciej odkrywaj wnioski i podejmuj trafniejsze decyzje.

Co robi ten prompt:

  • Generuje spersonalizowany plan działania (checklistę) do przeprowadzenia Eksploracyjnej Analizy Danych (EDA).
  • Dostosowuje kroki analizy do konkretnej branży, rodzaju danych i zdefiniowanego celu biznesowego.
  • Strukturyzuje proces EDA w cztery logiczne fazy, od przygotowania danych po formułowanie hipotez, co ułatwia systematyczne podejście.
PythonmetodologiaEDABig Data

Treść prompta do skopiowania

Dane wejściowe:
Nazwa Branży:
Rodzaj Danych:
Główny Cel Biznesowy Analizy:

Jesteś Senior Data Scientist z ponad 10-letnim doświadczeniem w pracy z dużymi zbiorami danych. Specjalizujesz się w przeprowadzaniu efektywnej Eksploracyjnej Analizy Danych (EDA), która szybko identyfikuje kluczowe wzorce, anomalie i potencjalne kierunki dla modelowania predykcyjnego.

Zadanie (Cel): Stwórz szczegółowy, uporządkowany plan działania (checklist) do przeprowadzenia Eksploracyjnej Analizy Danych (EDA) na dużym zbiorze danych. Dostosuj ten plan specyficznie do branży [Nazwa Branży], uwzględniając charakter [Rodzaj Danych] i dążąc do osiągnięcia [Główny Cel Biznesowy Analizy].

Format Odpowiedzi: Przedstaw plan w formie listy kroków, podzielonej na cztery kluczowe fazy. Każdy punkt musi być konkretnym, operacyjnym zadaniem.

Faza 1: Wstępne przygotowanie i czyszczenie danych (Data Cleaning & Preparation)

  • Krok 1.1: Weryfikacja typów danych i spójności formatu (np. daty, waluty).
  • Krok 1.2: Strategia obsługi brakujących wartości (np. usunięcie, imputacja średnią/medianą). Zaproponuj metodę adekwatną do [Rodzaj Danych].
  • Krok 1.3: Identyfikacja i wstępna analiza wartości odstających (outlierów) za pomocą metody IQR lub Z-score.

Faza 2: Analiza jednowymiarowa (Univariate Analysis)

  • Krok 2.1: Wygeneruj statystyki opisowe (średnia, mediana, odchylenie standardowe, kwantyle) dla kluczowych zmiennych numerycznych.
  • Krok 2.2: Stwórz histogramy lub wykresy gęstości, aby zwizualizować rozkład najważniejszych zmiennych ciągłych.
  • Krok 2.3: Przygotuj wykresy słupkowe pokazujące częstość występowania dla kluczowych zmiennych kategorycznych.

Faza 3: Analiza wielowymiarowa (Bivariate & Multivariate Analysis)

  • Krok 3.1: Oblicz i zwizualizuj macierz korelacji (np. za pomocą heatmapy), aby zidentyfikować zależności między zmiennymi numerycznymi.
  • Krok 3.2: Stwórz wykresy rozrzutu (scatter plots) dla par zmiennych o najwyższej korelacji, istotnych dla celu [Główny Cel Biznesowy Analizy].
  • Krok 3.3: Użyj tabel przestawnych lub wykresów pudełkowych do analizy relacji między zmiennymi kategorycznymi a numerycznymi.

Faza 4: Formułowanie Hipotez i Wniosków

  • Krok 4.1: Na podstawie analizy, sformułuj 3-5 kluczowych, wstępnych hipotez biznesowych powiązanych z [Główny Cel Biznesowy Analizy].
  • Krok 4.2: Zidentyfikuj potencjalne zmienne (features), które wydają się mieć największy wpływ na cel i mogą być użyte w dalszym modelowaniu.
  • Krok 4.3: Wskaż ewentualne problemy z jakością danych lub nieoczekiwane wzorce, które wymagają dalszego zbadania.

Najważniejsze: Kluczowe jest, aby każda czynność w ramach EDA była bezpośrednio powiązana z [Główny Cel Biznesowy Analizy]. Unikaj analizy dla samej analizy. Połóż maksymalny nacisk na wizualizację danych, ponieważ wykresy często ujawniają wzorce niewidoczne w surowych statystykach. Podkreśl, że EDA to proces iteracyjny – wnioski z jednej analizy powinny prowadzić do zadawania kolejnych, głębszych pytań.

5

Jak używać tego prompta:

Uzupełnij trzy kluczowe pola w nawiasach kwadratowych: [Nazwa Branży], [Rodzaj Danych] oraz [Główny Cel Biznesowy Analizy]. Pola te nadają kontekst całej analizie i kierunkują działania. Przykład uzupełnionych danych: Nazwa Branży: E-commerce, Rodzaj Danych: Dane transakcyjne klientów, Główny Cel Biznesowy Analizy: Zmniejszenie wskaźnika rezygnacji klientów (churn).

Dobrze wiedzieć

Ten prompt jest niezwykle użyteczny do standaryzacji procesu analitycznego w zespole data science. Używanie go jako szablonu zapewnia, że każdy analityk podchodzi do problemu w sposób metodyczny i kompleksowy, nie pomijając kluczowych kroków. Może to znacznie przyspieszyć proces wdrażania nowych członków zespołu i ułatwić przegląd (review) wyników analizy przez innych specjalistów, ponieważ struktura będzie im znana. Pamiętaj, że Eksploracyjna Analiza Danych to proces kreatywny i iteracyjny. Wygenerowany plan to mapa, ale to Ty jesteś odkrywcą. Nie bój się zadawać dodatkowych pytań, które nasuną Ci się w trakcie analizy, nawet jeśli wykraczają poza pierwotną listę. Często najcenniejsze odkrycia (insights) pochodzą z nieoczekiwanych korelacji lub anomalii, które wymagają głębszego zbadania.

Sprawdź również