☑️ Pandas 구조
- Series : 1차원 행렬/배열 형태 , 컬럼이 1개 행이 여러개
- DataFrame :2차원 행렬/배열 형태, 표 형태처럼 저장
☑️ 테이블 확인 하기
- `.head(n)` :테이블의 n행까지 출력
- `.info()` : 테이블 간단 정보 조회
- `.describe` : 테이블의 숫자 value 의 기초 통계 값 계산
df=pd.read_csv("temp/tips_data.csv",index_col=False)
# head :d 를 n행 까지 보여줌 -> limit 같은.. head() 이면 5개 출력됨.
df.head(n)
#.Info() : 테이블/컬럼 간단한 정보 조회(null값 갯수도 포함)
df.info()
#간단한 기초 통계 값들 계산, 최대/최소/표준편차 등..(숫자형만)
df.describe()
☑️ 인덱스 메소드
- `.sort_index()` :인덱스 기준 정렬
- `.index=`['1','2','3'] : 인덱스 설정/변경 하기
- `.set_index('컬럼명')` :인덱스에 컬럼명 지정
- `.reset_index` : 인덱스 초기화 0~n 으로 출력
df = pd.DataFrame({
'A' : [1,2,3],
'B' : ['a','b','c']
}, index =['idx1','idx2','idx3'])
df
# 정렬하기
df.sort_index() # 인덱스 기준 정렬하기 : 오름차
#인덱스 가져오기
df.index
#인덱스 컬럼명 지정 : set_index('컬럼명')
df.set_index('A')
#인덱스 설정/변경하기
df.index = ['1','2','3']
df
#reset_index -> 기존 값으로 돌려주기
#reset_index(drop=True) -> 원래 정수값으로
df.reset_index = ['1','2','3']
df
☑️ 컬럼 메소드
- `.columns` = ['컬럼1','컬럼2'] :컬럼명 변경 (테이블 순서대로)
- `.rename(columns = {'기존컬럼명' : '바꿀컬럼명','기존컬럼명2' : '바꿀컬럼명2'})`
- rename 메소드는 반환 x, 변수에 넣어 출력해야 함 (주의)
- `del` : 컬럼 삭제 하는 함수
# 컬럼 출력 : 테이블변수 [' 컬럼명' ]
df['name'] # 출력 :name 컬럼의 모든 행
# 컬럼명만 출력
df.columns # 출력 :모든 컬럼명
#컬럼명 변경1 (순서대로)
df.columns = ['이름','나이','성별']
df
#컬럼명 변경2 : rename 메소드는 변수에 넣어서 출력 해야 나옴
df = df.rename(columns={'이름' : 'name','성별' : '남/여'})
df
# 컬럼 추가/삭제
df['스포츠'] = '축구'
del df['나이']
☑️ 결측치(null 값) 확인하기
- `.isna()` = null 이면 True 아니면 False 출력
df = pd.DataFrame({
'A' : [1,2,3,4],
'B' : [5,6,7,None]
})
#결측치 확인
df.isna() # null이면 True, 아니면 False
#특정 컬럼 결측치 확인 시 : df['컬럼명'].isna()
df['B'].isna() #b컬럼의 행별로 t/f 값 반환
df[df['A'].isna()] #a컬럼이 null 값 행만 불러오겠다
☑️ 타입 메소드
- `.dtype` : 타입 확인해주는 메소드
- `.astype(타입)` : 타입 변경해주는 메소드 ( .astype(타입).astype(타입) 등으로 계속 변경 가능 )
df=pd.read_csv("temp/tips_data.csv",index_col=False)
df
# 타입 확인 함수 : dtype
df['total_bill'].dtype
#타입 변경 함수 : astype('변경할 타입')
df['total_bill'] = df['total_bill'].astype(str) #토탈빌 컬럼에 토탈빌을 str로 타입변경
#계속 변경 할때는 .astype().astype() ...
df['total_bill'] = df['total_bill'].astype(float)
df.info()
'PYTHON' 카테고리의 다른 글
데이터 전처리 | Pandas 기본 함수 3 (concat,merge,groupby,pivot_table,sort_value) (1) | 2024.12.17 |
---|---|
데이터 전처리| Pandas 기본 함수2 (loc, iloc,isin) (0) | 2024.12.17 |
코테 준비 | 프로그래머스 정수 내림차순으로 배치하기/정수 제곱근 판별 (Sorted/Join/Range) (0) | 2024.12.17 |
실습3 | 이상치 검사하기 ( IQR 기반/ numpy 라이브러리) (0) | 2024.12.16 |
실습2 | 이메일 유효성 검사(split,endswith,find) / 포인트 적립및 차감하기(CLASS) 문제풀이 (0) | 2024.12.16 |