데이터 분석

2-6. 행, 열 추가 및 삭제하기

HJ76 2023. 6. 8. 17:40

행, 열 추가 및 삭제하기

 

행 추가하기

  • dict 형태의 데이터를 만들고, append() 함수를 사용하여 데이터를 추가함
  • 반드시 ignore_index=True 옵션을 추가해야 에러가 발생하지 않음

 

dic1 = {
    "이름" : "김사과",
    "그룹" : "애플",
    "소속사" : "apple",
    "성별" : "여자",
    "생년월일" : "2000-01-01",
    "키" : 160,
    "혈액형" : "A",
    "브랜드평판지수" : 987654321
}

# append() 메소드를 통해 dic1을 행에 추가
df = df.append(dic1, ignore_index=True)

 

열 추가하기

  • 통계학에선 컬럼을 변수라고 부르고
  • 추가된 변수를 파생변수라고 부름
# 국적이라는 새로운 파생변수 생성 후, 대한민국으로 값을 채움
df["국적"] = "대한민국"
df

 

# "김사과"의 국적을 "미국"으로 변경 (단, loc를 사용하여 작성)
df.loc[df["이름"] == "김사과","국적"] = "미국"

df

 

 

열 제거하기

 

drop()

  • 메서드는 원본 데이터를 변경하지 않고 삭제된 결과를 반환
  • 원본 데이터를 수정하려면 inplace=True 옵션을 추가하여 사용해야 함
# 그룹 컬럼과 소속사 컬럼을 제거
# 기본값이 axis=0 이므로, 컬럼을 제거할 경우 axis=1로 설정
df.drop(["그룹", "소속사"], axis=1)

 

행 제거하기

 

# 15번 인덱스 행 삭제
df.drop(15)

 

# 1, 3, 5, 15 인덱스 행을 제거
df.drop([1, 3, 5, 15])