from IPython.display import display, HTML
display(HTML("<style>.container { width:90% !important; }</style>"))
# 코드 입력창의 너비를 조정하는 코드입니다.


# pandas 라이브러리 임포트
import pandas as pd


data = [30, 6, 'Yes', 'No']


# 시리즈를 만든다
x = pd.Series(data= data)

x

0     30
1      6
2    Yes
3     No
dtype: object


# 인덱스 확인
x.index

RangeIndex(start=0, stop=4, step=1)


# 데이터 확인
x.values  # ndarray

array([30, 6, 'Yes', 'No'], dtype=object)


# 인덱스에 이름 붙이기
index = ['eggs', 'apples', 'milk', 'bread']


groceries = pd.Series(data= data, index= index)


groceries

eggs       30
apples      6
milk      Yes
bread      No
dtype: object


groceries.index

Index(['eggs', 'apples', 'milk', 'bread'], dtype='object')


groceries.values

array([30, 6, 'Yes', 'No'], dtype=object)


# shape 확인
groceries.shape

(4,)


# 차원 확인
groceries.ndim

1


# 데이터 갯수
groceries.size

4


# 저장된 데이터의 타입 확인
groceries.dtype  # ('O') => object (문자열)

dtype('O')


# 'apples' 가 groceries 안에 들어있나?
'apples' in groceries

True


# 'Yes' 가 groceries 안에 들어있나?
'Yes' in groceries.values

True


groceries

eggs       30
apples      6
milk      Yes
bread      No
dtype: object


groceries[0]

30


groceries['eggs']

30


groceries[-1]

'No'


groceries['bread']

'No'


groceries[ ['eggs', 'bread'] ]

eggs     30
bread    No
dtype: object


groceries['apples' : 'bread']  # index 이름으로 억세싱할때는 끝부분에 +1 하지 않는다

apples      6
milk      Yes
bread      No
dtype: object


groceries[1: ]

apples      6
milk      Yes
bread      No
dtype: object


groceries[ : 'milk']

eggs       30
apples      6
milk      Yes
dtype: object


index = ['apples', 'oranges', 'bananas']
data = [10, 6, 3,]


fruits = pd.Series(data= data, index= index)


fruits

apples     10
oranges     6
bananas     3
dtype: int64


# 전체 5개씩 증가되었다.
fruits = fruits + 5


fruits

apples     15
oranges    11
bananas     8
dtype: int64


# 오렌지가 2개 팔렸다
fruits['oranges'] = fruits['oranges'] - 2


fruits

apples     15
oranges     9
bananas     8
dtype: int64


# 사과랑 바나나가 3개씩 팔렸다
fruits[ ['apples', 'bananas'] ] = fruits[ ['apples', 'bananas'] ] - 3


fruits

apples     12
oranges     9
bananas     5
dtype: int64


# 불리언 인덱싱
fruits[fruits > 7]

apples     12
oranges     9
dtype: int64


import pandas as pd

# We create a dictionary of Pandas Series 
items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']),
         'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])}


# 데이터프레임 만들기
df = pd.DataFrame(data= items)

df


df.index

Index(['bike', 'book', 'glasses', 'pants', 'watch'], dtype='object')


df.columns

Index(['Bob', 'Alice'], dtype='object')


df.values

array([[245., 500.],
       [ nan,  40.],
       [ nan, 110.],
       [ 25.,  45.],
       [ 55.,  nan]])


df.shape

(5, 2)


df.ndim

2


df.size

10


df.info()  # info() 함수는 데이터에 대한 전반적인 정보를 알려준다

<class 'pandas.core.frame.DataFrame'>
Index: 5 entries, bike to watch
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   Bob     3 non-null      float64
 1   Alice   4 non-null      float64
dtypes: float64(2)
memory usage: 120.0+ bytes


df = pd.DataFrame(data= items)

df


df.to_csv('test.csv')


df2 = pd.read_csv('test.csv')

df2


df3 = pd.read_csv('test.csv', index_col = 'Unnamed: 0')

df3

	Bob	Alice
bike	245.0	500.0
book	NaN	40.0
glasses	NaN	110.0
pants	25.0	45.0
watch	55.0	NaN

	Bob	Alice
bike	245.0	500.0
book	NaN	40.0
glasses	NaN	110.0
pants	25.0	45.0
watch	55.0	NaN

	Unnamed: 0	Bob	Alice
0	bike	245.0	500.0
1	book	NaN	40.0
2	glasses	NaN	110.0
3	pants	25.0	45.0
4	watch	55.0	NaN

	Bob	Alice
bike	245.0	500.0
book	NaN	40.0
glasses	NaN	110.0
pants	25.0	45.0
watch	55.0	NaN

Pandas 활용(6) - 범주로 묶어 집계하기 groupby, agg (0)	2022.11.27
Pandas 활용(5) - 결측값(NaN) 처리 (0)	2022.11.27
Pandas 활용(4) - 인덱스명, 컬럼명 변경 (0)	2022.11.27
Pandas 활용(3) - 데이터프레임의 데이터 변경, 추가, 삭제 (0)	2022.11.25
Pandas 활용(2) - 데이터프레임의 Indexing, Slicing (0)	2022.11.25

Pandas 활용 (1) - Series/DataFrame 생성, read_csv, to_csv

Pandas의 특징¶

Panas Series¶

판다스 시리즈의 Indexing, Slicing¶

판다스 시리즈의 산수연산¶

Pandas Dataframe¶

dataframe을 csv 파일로 저장하기¶

csv 파일을 dataframe으로 불러오기¶

'Python > Pandas' 카테고리의 다른 글

티스토리툴바