반응형
SMALL
Pandas는 데이터 분석 기능을 제공하는 라이브러리로 csv, xls 파일 등의 데이터를 읽고 원하는 데이터 형식으로 변환해줍니다.
자주 사용되는 라이브러리 하나로 주로 pd라고 줄여 사용하게 됩니다.
1. Series
pd.Series는 1차원 데이터를 다룰 때 사용합니다. 변수를 출력해보면 인덱스 번호와 이름, 자료형도 함께 출력됩니다.
2. DataFrame
DataFrame은 Series와 달리 여러개의 column을 가질 수 있습니다.
DataFrame을 정의할 때는 2차원 리스트를 매개 변수로 전달하며 여러개의 Series 데이터를 합쳐 DataFrame을 만들 수도 있습니다.
Series / Data Frame 생성 함수
- Series(data, name) : data를 name이라는 이름의 Series 형태로 만들어 줍니다.
- DataFrame(data) : data를 DataFrame 구조로 만들어 줍니다.
import pandas as pd
def main():
# Series()를 사용하여 1차원 데이터를 만들어 봅시다.
# 5개의 age 데이터와 이름을 age로 선언해봅시다.
data = [19, 18, 27, 22, 33]
age = pd.Series(age)
# Python Dictionary 형태의 데이터가 있습니다.
# class_name 데이터를 Series로 만들어봅시다.
class_name = {'국어' : 90, '영어' : 70, '수학' : 100, '과학' : 80}
class_name = pd.Series(class_name)
print(class_name, '\n')
# DataFrame 만들기
# DataFrame()을 사용하여 2차원 데이터를 생성해보세요.
# index와 columns 값을 설정해보세요.
data = [['name', 'age'], ['철수', 15], ['영희', 23], ['민수', 20], ['다희', 18], ['지수', 20]]
data = pd.DataFrame(data[1:], index=[1, 2, 3, 4, 5], columns=['name', 'age'])
print(data, '\n')
if __name__ == "__main__":
main()
0 19
1 18
2 27
3 22
4 33
dtype: int64
국어 90
영어 70
수학 100
과학 80
dtype: int64
name age
1 철수 15
2 영희 23
3 민수 20
4 다희 18
5 지수 20
반응형
LIST
'Machine, Deep Learning > Machine, Deep Learning 실습' 카테고리의 다른 글
기울기와 절편 (0) | 2019.06.24 |
---|---|
Pandas 데이터 추출 및 추가 (0) | 2019.06.24 |
Numpy 함수로 행렬연산 다루기 (0) | 2019.06.24 |
Numpy 배열의 통계적 정보 나타내기 (0) | 2019.06.24 |
Numpy 배열의 특정요소 추출하기 (0) | 2019.06.24 |