네이버 부스트캠프 모각공 캠페인 7일차

Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

clear_uncertainty

네이버 부스트캠프 모각공 캠페인 7일차 - Pandas(2) 본문

네이버 부스트캠프 - AI Tech 3rd/꼭 알아야하는 파이썬 기초지식

네이버 부스트캠프 모각공 캠페인 7일차 - Pandas(2)

SOidentitiy 2021. 11. 16. 21:05

728x90

모든 설명 및 자료의 출처는 네이버 부스트코스의 <[부스트캠프 AI Tech 3기] Pre-Course>입니다.

(https://www.boostcourse.org/onlyboostcampaitech3/joinLectures/329424)

<꼭 알아야 하는 파이썬 기초 지식>

Pandas(2)

Groupby

SQL groupby 명령어와 같습니다.

split -> apply -> combine 과정을 거쳐 연산합니다

= index(key)가 같은 것끼리 묶어준 후 통계학함수를 거친 후 결과를 보여줍니다.

Hierachical index

groupby 명령의 결과물도 결국은 dataframe

두개의 column으로 groupby를 할 경우, index가 두개 생성

Hierarchical index - unstack()

group으로 묶여진 데이터를 matrix 형태로 전환

Index level을 변경할 수 있습니다.

Hierarchical index - operations

Index level 을 기준으로 기본 연산 수행 가능

groupby - gropued

groupby에 의해 Split 된 상태를 추출 가능합니다.

특정 key값을 가진 그룹의 정보만 추출 가능합니다. (=get_group)

추출된 group 정보에는 세 가지 유형의 apply 가 가능합니다.

Aggregation : 요약된 통계 정보를 추출
Transformation : 해당 정보를 변환
Filtration : 특정 정보를 제거하여 보여주는 필터링 기능

groupby - aggregation

groupby - transformation

groupby - filter

특정 조건으로 데이터를 검색할 때 사용

Case study

Data : 시간과 데이터 종류가 정리된 통화량 데이터

as_index = False 를 사용하면 month를 인덱스로 설정하지않습니다.

반대로, as_index=True를 사용하면 month를 index로 사용합니다.

Pivot Table

우리가 엑셀에서 보던 것

Index 축은 groupby와 동일

Column에 추가로 labeling 값을 추가하여 Value에 numeric type 값을 aggregation 하는 형태

Crosstab

특히 두 칼럼에 교차 빈도, 비율, 덧셈 등을 구할 때 사용

Pivot table의 특수한 형태

User-Item Rating Matrix 등을 만들 때 사용 가능

Merge & Concat

SQL에서 많이 사용하는 Merge와 같은 기능

두개의 데이터를 하나로 합침(무슨 기준으로 할 것이냐?)

join method

data

left join

right join

full(outer) join

inner join

index based join

concat

같은 형태의 데이터를 붙이는 연산작업

persistence

Database connection Data loading 시 db connection 기능을 제공

XLS persistence

Dataframe 의 엑셀 추출 코드

Xls 엔진으로 openpyxls 또는 XlsxWrite 사용

Pickle persistence

가장 일반적인 python 파일 persistence

to_pickle, read_pickle 함수 사용

출처

[부스트캠프 AI Tech 3기] Pre-Course

www.boostcourse.org

728x90

저작자표시 (새창열림)

'네이버 부스트캠프 - AI Tech 3rd > 꼭 알아야하는 파이썬 기초지식' 카테고리의 다른 글

네이버 부스트캠프 모각공 캠페인 6일차 - Pandas (0)	2021.11.14
네이버 부스트캠프 모각공 캠페인 5일차 - Numerical Python - numpy (0)	2021.11.12
네이버 부스트캠프 모각공 4일차 - Python Data Handling (0)	2021.11.11
네이버 부스트캠프 모각공 3일차 - File/Exception/Log Handling (0)	2021.11.10
네이버 부스트캠프 모각공 캠페인 3일차 - Module and Project (0)	2021.11.10

'네이버 부스트캠프 - AI Tech 3rd/꼭 알아야하는 파이썬 기초지식' Related Articles

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

clear_uncertainty

clear_uncertainty

네이버 부스트캠프 모각공 캠페인 7일차 - Pandas(2) 본문

네이버 부스트캠프 모각공 캠페인 7일차 - Pandas(2)

Pandas(2)

Groupby

Hierachical index

Hierarchical index - unstack()

Case study

Pivot Table

Crosstab

Merge & Concat

join method

concat

persistence

'네이버 부스트캠프 - AI Tech 3rd > 꼭 알아야하는 파이썬 기초지식' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역