본문 바로가기

Python8

[AI 부트캠프 18기] Day 6 Bayes' Theorem Bayes' Theorem (2023.02.21) 이번주는 통계 관련 내용을 학습한다고 한다. 오늘은 "조건부 확률"과 "Bayes' Theorem"에 대해 공부했다.[ 중요 개념 ] Probability(확률): 어떠한 사건이 일어날 가능성 전체 확률의 법칙에 의해 한 사건에 의해 발생한 모든 확률의 합은 1을 넘지 못한다. Binomial Distribution(이항 분포): 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 확률 분포 P(x) = nCx * p^x(1-p)^(n-x) Conditional Probability(조건부 확률): 어떤 사건 B가 일어났을 때 A가 일어날 확률 P(A|B) = P(AnB) / P(B) Bayes' Theorem(베이즈 정리): 사전 확률와.. 2023. 2. 21.
[AI 부트캠프 18기] Day 5 기록 Weekly Review (2023.02.20) 지난 한 주 동안 배운 내용을 점검하는 날이었다. 그래서 추가적으로 배운 내용은 없지만 스스로 복습하면서 조금 더 알게 된 내용에 대해 간단히 정리하려고 한다. [ Matplotlib을 이용한 시각화 ] Matplotlib 공식 홈페이지 : https://matplotlib.org/3.5.3/api/_as_gen/matplotlib.pyplot.html 그래프 그리기 import pandas as pd import numpy as np import matplotlib.pyplot as plt # 그래프 그리기 plt.plot([2, 3, 5, 10]) plt.show() 축 레이블 설정 (labelpad: 여백 지정, size: font 크기, weight.. 2023. 2. 20.
[AI 부트캠프 18기] Day 4 Data Wrangling Data Wrangling(2) (2023.02.17) 코드를 통해 어제 탐색한 데이터를 정제하는 작업을 진행했다.[ 중요 개념 ] Tidy data: 표준화된 규칙을 가지고 만든 분석하기 좋은 데이터 각 변수(variable)는 하나의 열(column)을 구성 각 관측치(observation)는 하나의 행(row)을 구성 각 유형의 관측 단위가 표를 구성 Long Format(=Tidy Data) - Wide Format: wide → long: .melt() long → wide: .pivot_table() 데이터 합치기: concat, merge 함수 사용[ 새롭게 알게 된 내용 ]melt 함수 : 식별자 id, 측정 변수 variable, 측정치 value 형태로 데이터를 재구성하는 함수pd.me.. 2023. 2. 17.
[AI 부트캠프 18기] Day 3 Data Wrangling Data Wrangling(1) (2023.02.16) 오늘은 EDA를 통해 이해한 데이터를 탐색하고 정제하는 과정인 Data Wrangling에 대해 학습하고 실습을 통해 직접 데이터를 정제하는 작업을 했다.[ 중요 개념 ] Data Wrangling: 데이터셋을 분석하기 좋은 깔끔한 형태로 정제, 변형하는 과정 데이터 수집: 데이터 불러오기 데이터 탐색: 데이터에 문제가 있는지 확인 데이터 정제: 데이터 탐색을 통해 발견한 문제들을 해결하여 데이터를 정제 => 데이터 정제가 중요한 이유? : 데이터 자체가 지저분할 경우에는 지저분한 결과가 나오기 때문 데이터 탐색 방법: 시각적 탐색 & 프로그래매틱 탐색 시각적 탐색: 프로그램을 활용해 시각적으로 데이터셋을 관찰 프로그래매틱 탐색: 코드를 사용하여 전.. 2023. 2. 16.