데이터 분석
2-6. 행, 열 추가 및 삭제하기
HJ76
2023. 6. 8. 17:40
행, 열 추가 및 삭제하기
행 추가하기
- dict 형태의 데이터를 만들고, append() 함수를 사용하여 데이터를 추가함
- 반드시 ignore_index=True 옵션을 추가해야 에러가 발생하지 않음
dic1 = {
"이름" : "김사과",
"그룹" : "애플",
"소속사" : "apple",
"성별" : "여자",
"생년월일" : "2000-01-01",
"키" : 160,
"혈액형" : "A",
"브랜드평판지수" : 987654321
}
# append() 메소드를 통해 dic1을 행에 추가
df = df.append(dic1, ignore_index=True)
열 추가하기
- 통계학에선 컬럼을 변수라고 부르고
- 추가된 변수를 파생변수라고 부름
# 국적이라는 새로운 파생변수 생성 후, 대한민국으로 값을 채움
df["국적"] = "대한민국"
df
# "김사과"의 국적을 "미국"으로 변경 (단, loc를 사용하여 작성)
df.loc[df["이름"] == "김사과","국적"] = "미국"
df
열 제거하기
drop()
- 메서드는 원본 데이터를 변경하지 않고 삭제된 결과를 반환
- 원본 데이터를 수정하려면 inplace=True 옵션을 추가하여 사용해야 함
# 그룹 컬럼과 소속사 컬럼을 제거
# 기본값이 axis=0 이므로, 컬럼을 제거할 경우 axis=1로 설정
df.drop(["그룹", "소속사"], axis=1)
행 제거하기
# 15번 인덱스 행 삭제
df.drop(15)
# 1, 3, 5, 15 인덱스 행을 제거
df.drop([1, 3, 5, 15])