박상원 깃헙블로그


  • 홈

  • 카테고리

  • About

  • 아카이브

  • 태그

  • 검색

[AWS] Glue Job

작성일 2020-12-10 | In AWS |

Crawler로 생성된 테이블을 기반으로 데이터를 추출, 가공, 적재하는 Job을 만들고 실행시켜보자.

더 읽어보기 »

[AWS] Glue Crawler

작성일 2020-12-09 |

Glue의 Crawler를 만들고 실행한 뒤, 메타 데이터 테이블이 만들어지는지 확인하고 여러 특성을 살펴본다.

더 읽어보기 »

[Python] 리스트에서 메모리 할당에 대한 생각

작성일 2020-12-05 | In python |

Python에서 list에 어떻게 메모리를 할당하는가에 대한 나름의 생각을 정리해본다. 확실한 사실을 향해 가도록 공식 문서와 자료들을 더 찾아보고 공부할 것이다.

더 읽어보기 »

[AWS] Glue 사용 사전조사

작성일 2020-12-05 | In AWS |

앞서 소개했던 ETL은 상당한 공수를 요구한다. ETL은 물론 중요한 작업이고 설계 및 아키텍쳐도 중요하지만 특별한 알고리즘을 요구하거나 분석 모델을 필요로 하지는 않는 작업이기 때문에 최대한 공수를 줄이는 것이 좋다.

더 읽어보기 »

[Data Engineering] ETL

작성일 2020-12-03 | In data |

여러 IT 기업들은 앞다투어 예측 솔루션을 개발하거나 서비스에 적용시키고 있다. 심지어 국비지원 수업에도 인공지능 / 머신러닝 등의 이름이 붙은 수업들이 우후죽순 나오고 있으니, 데이터의 중요성이 점점 커진다는 것은 자명하다.

더 읽어보기 »

[Python] Mutable / Immutable

작성일 2020-11-29 | In python |

mutable 객체는 생성 후에 값을 바꿀 수 없고, Immutable 객체는 생성 후에도 값이 변할 수 있는 객체이다.

더 읽어보기 »

[코딩 테스트] 2020 카카오 인턴십 동굴탐험

작성일 2020-11-29 | In 코딩테스트 |

카카오 2020 인턴십 문제 중 가장 어려웠다고 생각하는 동굴 탐험 문제입니다.

더 읽어보기 »

[Python] Python의 자료형과 크기

작성일 2020-11-29 | In python |

Python은 자료형이 없다. 없는건 아니고 프로그래머가 직접 자료형을 선언하지 않는다.

더 읽어보기 »

[자료구조] queue 구현

작성일 2020-11-28 | In 자료구조 |

Queue와 그 성질에 대해 알아보고, 직접 구현해보자

더 읽어보기 »

컴퓨터는 왜 2진수를 사용할까

작성일 2020-11-27 | In CS |

컴퓨터는 0과 1, 2가지 숫자만을 인식한다. 문자 하나든, 엄청나게 방대한 데이터든 결국 0과 1이다. 현대 사회에서 많은 사람들은 이 사실을 알고 있다.

더 읽어보기 »
1 … 4 5
psw

psw

Elegant theme for Jekyll.

50 포스트
12 카테고리
17 태그
RSS
© 2022 psw
Powered by Jekyll
Theme - NexT.Muse