본문 바로가기
AI Developer/AI Python Tech

[DataFrame] Pandas DataFrame 다루기 - 특징, 생성, column 수정, index 수정

by 성 언 2023. 8. 11.

판다스 데이터프레임에 대해 학습 후 정리한 포스팅 입니다.

 

이번 포스팅에서는 판다스 데이터프레임의 특징, 생성, column 수정, index 수정에 대해 학습합니다.

 

데이터프레임(DataFrame)은 데이터를 효율적으로 조작하고 분석하기 위한 2차원 데이터 구조입니다.

데이터프레임은 파이썬의 pandas 라이브러리에서 제공되며, 행과 열로 이루어진 테이블 형태의 데이터를 다루는 데에 유용하게 사용됩니다.

 

I) 데이터프레임의 특징

1. 2차원 구조: 데이터프레임은 행과 열로 이루어진 2차원 데이터 구조입니다. 각 행은 개별 데이터 관측치(레코드), 각 열은 해당 데이터 관측치의 특성(특징)을 나타냅니다.

2. 라벨링된 열: 각 열은 라벨(이름)을 가지고 있어 해당 열에 저장된 데이터의 의미를 표현합니다.

3. 유연한 데이터 타입: 각 열은 다양한 데이터 타입을 가질 수 있으며, 정수, 실수, 문자열, 불리언 등 다양한 데이터 형식을 저장할 수 있습니다.

4. 데이터 조작 및 변형: 데이터프레임은 데이터를 검색, 수정, 삭제, 추가, 변형하는 다양한 작업을 지원합니다.

5. 데이터 분석 도구: 데이터프레임을 사용하면 데이터의 패턴, 특징, 상관관계 등을 분석하고 시각화할 수 있습니다.

 

 

II) 데이터프레임 생성

1. 데이터를 직접 생성하여 데이터프레임을 생성할 수 있습니다.

import pandas as pd

# 샘플 데이터 생성
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 22, 28],
        'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']}

# 데이터프레임 생성
df = pd.DataFrame(data)

2. csv, excel 등의 파일을 불러와서 데이터프레임을 생성할 수 있습니다.

import pandas as pd

# CSV 파일 읽기
df = pd.read_csv("파일명(경로포함)", dtype=str)

print(df)

 

 

III) 데이터프레임의 column, index 수정

데이터프레임의 column 과 index는 수정할 수 있습니다.

먼저 데이터프레임의 column과 index를 출력해보면 다음과 같습니다.

#print(df.columns)의 결과
Index(['Name', 'Age', 'City'], dtype='object')

#print(df.index)의 결과
RangeIndex(start=0, stop=4, step=1)

 

column, index를 바꿔보는 코드는 다음과 같습니다.

#컬럼명 바꾸기
df.columns = ['이름', '나이', '도시']

#인덱스 바꾸기
df.index = ['사람1', '사람2', '사람3', '사람4']

print(df)
          이름  나이        도시
사람1    Alice   25     New York
사람2      Bob   30  Los Angeles
사람3  Charlie   22      Chicago
사람4    David   28      Houston

 

특정 열이나 인덱스만 바꾸고 싶으면 rename( ) 함수를 사용합니다.

  • rename 함수사용시 내부 파라미터로 inplace=True를 반드시 넣어줘야 dataframe 원본이 수정됩니다.
#특정 인덱스만 변경하기
df.rename(index={'사람1':'PERSON1', '사람3':"PERSON3"}, inplace=True)

#특정 컬럼명만 변경하기
df.rename(columns={'이름':'NAME', '도시':"CITY"}, inplace=True)
print(df)
            NAME  Age         CITY
PERSON1    Alice   25     New York
사람2        Bob   30  Los Angeles
PERSON3  Charlie   22      Chicago
사람4      David   28      Houston

 

 

<Summary>

- 데이터프레임 (특징, 생성, column 수정, index 수정)

 

*유의사항

- AI 산업기능요원이 공부하여 남긴 정리입니다.

 

댓글