[DataFrame] Pandas DataFrame 다루기 - 특징, 생성, column 수정, index 수정

2023. 8. 11. 15:00·Python
반응형

판다스 데이터프레임에 대해 학습 후 정리한 포스팅 입니다.

 

이번 포스팅에서는 판다스 데이터프레임의 특징, 생성, column 수정, index 수정에 대해 학습합니다.

 

데이터프레임(DataFrame)은 데이터를 효율적으로 조작하고 분석하기 위한 2차원 데이터 구조입니다.

데이터프레임은 파이썬의 pandas 라이브러리에서 제공되며, 행과 열로 이루어진 테이블 형태의 데이터를 다루는 데에 유용하게 사용됩니다.

 

I) 데이터프레임의 특징

1. 2차원 구조: 데이터프레임은 행과 열로 이루어진 2차원 데이터 구조입니다. 각 행은 개별 데이터 관측치(레코드), 각 열은 해당 데이터 관측치의 특성(특징)을 나타냅니다.

2. 라벨링된 열: 각 열은 라벨(이름)을 가지고 있어 해당 열에 저장된 데이터의 의미를 표현합니다.

3. 유연한 데이터 타입: 각 열은 다양한 데이터 타입을 가질 수 있으며, 정수, 실수, 문자열, 불리언 등 다양한 데이터 형식을 저장할 수 있습니다.

4. 데이터 조작 및 변형: 데이터프레임은 데이터를 검색, 수정, 삭제, 추가, 변형하는 다양한 작업을 지원합니다.

5. 데이터 분석 도구: 데이터프레임을 사용하면 데이터의 패턴, 특징, 상관관계 등을 분석하고 시각화할 수 있습니다.

 

 

II) 데이터프레임 생성

1. 데이터를 직접 생성하여 데이터프레임을 생성할 수 있습니다.

import pandas as pd

# 샘플 데이터 생성
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 22, 28],
        'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']}

# 데이터프레임 생성
df = pd.DataFrame(data)

2. csv, excel 등의 파일을 불러와서 데이터프레임을 생성할 수 있습니다.

import pandas as pd

# CSV 파일 읽기
df = pd.read_csv("파일명(경로포함)", dtype=str)

print(df)

 

 

III) 데이터프레임의 column, index 수정

데이터프레임의 column 과 index는 수정할 수 있습니다.

먼저 데이터프레임의 column과 index를 출력해보면 다음과 같습니다.

#print(df.columns)의 결과
Index(['Name', 'Age', 'City'], dtype='object')

#print(df.index)의 결과
RangeIndex(start=0, stop=4, step=1)

 

column, index를 바꿔보는 코드는 다음과 같습니다.

#컬럼명 바꾸기
df.columns = ['이름', '나이', '도시']

#인덱스 바꾸기
df.index = ['사람1', '사람2', '사람3', '사람4']

print(df)
          이름  나이        도시
사람1    Alice   25     New York
사람2      Bob   30  Los Angeles
사람3  Charlie   22      Chicago
사람4    David   28      Houston

 

특정 열이나 인덱스만 바꾸고 싶으면 rename( ) 함수를 사용합니다.

  • rename 함수사용시 내부 파라미터로 inplace=True를 반드시 넣어줘야 dataframe 원본이 수정됩니다.
#특정 인덱스만 변경하기
df.rename(index={'사람1':'PERSON1', '사람3':"PERSON3"}, inplace=True)

#특정 컬럼명만 변경하기
df.rename(columns={'이름':'NAME', '도시':"CITY"}, inplace=True)
print(df)
            NAME  Age         CITY
PERSON1    Alice   25     New York
사람2        Bob   30  Los Angeles
PERSON3  Charlie   22      Chicago
사람4      David   28      Houston

 

 

<Summary>

- 데이터프레임 (특징, 생성, column 수정, index 수정)

 

*유의사항

- AI 산업기능요원이 공부하여 남긴 정리입니다.

 

반응형
저작자표시 (새창열림)

'Python' 카테고리의 다른 글

[argparse] Python 스크립트 실행 시 인자 값 전달하기  (0) 2023.08.13
[DataFrame] Pandas DataFrame 다루기 - iloc & loc, 값 변경  (0) 2023.08.12
[파이썬] 정렬 함수 (sort VS sorted)  (1) 2023.02.04
[파이썬] 리스트 역순으로 저장/출력하기  (0) 2023.01.23
[딥러닝] 기본 용어 (Data, Model, Loss, Optimization Algorithm)  (0) 2023.01.13
'Python' 카테고리의 다른 글
  • [argparse] Python 스크립트 실행 시 인자 값 전달하기
  • [DataFrame] Pandas DataFrame 다루기 - iloc & loc, 값 변경
  • [파이썬] 정렬 함수 (sort VS sorted)
  • [파이썬] 리스트 역순으로 저장/출력하기
성 언
성 언
AI 학과 3학년 학생이자 RAG 기반 LLM 챗봇 개발 회사에서 근무 중입니다. AI 챗봇 개발과 관련된 기술, 연구, 그리고 실험 과정에서 얻은 인사이트를 공유합니다. 최신 AI 기술을 함께 탐구하며 성장해 나가요!
    반응형
  • 성 언
    AI EON
    성 언
  • 전체
    오늘
    어제
    • AII
      • NLP
      • AI Paper Review
      • MLOps
      • Python
      • Algorithm
      • Memo
      • Server Developer
        • Node.js
        • DataBase&Data Engineering
        • Server Basic
      • MATH
        • Linear Algebra
        • AI
      • etc
  • 블로그 메뉴

    • 홈
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    Ubuntu-20.04 APM 소스 설치
    그리디 알고리즘
    docx-template
    더티 읽기
    map 함수
    다중 버전 동시성 제어
    트랜잭션
    NVML
    c++
    스택
    문서 자동화
    node.js
    배열의 모양 변경
    더티 쓰기
    패스트캠퍼스 수강 후기
    파이썬 문서 자동화
    transaction
    word 자동화
    배타 잠금
    umc
    reranker
    리랭커
    팬텀 읽기
    Python
    비반복 읽기
    알고리즘
    [Numpy] squeeze & unsqueeze
    백준
    파이썬
    Signature 초격차 패키지
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
성 언
[DataFrame] Pandas DataFrame 다루기 - 특징, 생성, column 수정, index 수정
상단으로

티스토리툴바