일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- qcc
- 파이썬
- MySQL
- 더해야지
- 시작
- 데이터분석가
- SQL기초
- 통계
- 매일발전하는
- 데이터분석가꿈나무
- 공부
- 20세기감자
- 파이썬왕초보
- 초보
- 어디까지공부
- 팀플
- 화이팅
- 꿈나무
- 데이터분석
- 내일배움캠프 일상
- 데이터분석 꿈나무
- 왕초보
- 도전
- SQL
- 팀프로젝트
- 내일배움캠프
- 일상
- 데이터분석꿈나무
- 해보자고
- 할수있다
- Today
- Total
목록통계 (2)
영차영차
1. 결측치 처리 기법삭제: 결측치 있는 행 혹은 열 제거 → df.dropna()데체: 평균값 mean / 중앙값 median / 최빈값 mode / 예측모델로 데체→ df.fillna(df.mean(numeric_only=True)) #숫자형 열에 대해서만 게산하겠다는 2. 이상치 탐지 및 제거통계적 기법 (Z-score): 데이터가 정규분포를 따른다는 가정 하에, 평균에서 ±3σ(표준편차) 범위를 벗어나는 값을 이상치로 간주박스플롯 (Boxplot):사분위수(IQR = Q3 - Q1)를 이용해 ‘Q1 - 1.5×IQR’, ‘Q3 + 1.5×IQR’를 벗어나는 데이터를 이상치로 간주머신러닝 기반:이상치 탐지 알고리즘, 복합적 패턴을 고려할 수 있음 3.정규화/표준화데이터들의 범위가 너무 다르거나,..
서론오늘은 기초 프로젝트가 끝나면서 팀이 다시 바꾸면서 새롭게 시작하는 주차!새로운 팀원분들 모두 적극적이시고 대화도 잘 되는것 같아서 감사했다. 전부 비전공자라는것도 재미있었다 ㅎㅎ이번주 부터는 통계 라이브 세션이 시작되면서 동시에 녹강도 제공받았다. 통계에 관해 거의 아무것도 모르는 수준이라서 단어만 들으면 겁이 나긴 했지만.. 데이터 분석가에게 필수적인 요소인 통계! 열심히 공부해보자 ㅎㅎ 초보자를 위한 강의이기 때문에 일단 시작! 본론1. 기술통계데이터를 요약하고 설명하는 방법평균, 중앙값, 분산, 표준편차 등 사용데이터를 특정 '대표값'으로 요약데이터에 대한 대략적인 특징을 간단하고 쉽게 알 수 있음.이상치는 항상 존재 할 수 있고 데이터의 모든 부분을 확인할 수 있는 것은 아니기 때문에 주의!..