박상원 깃헙블로그


  • 홈

  • 카테고리

  • About

  • 아카이브

  • 태그

  • 검색

[AWS] Kinesis 도입기 1. Data Stream과 Firehose

작성일 2021-08-03 | In AWS |

최근 실시간 로그 수집을 위해 kinesis를 도입했습니다. 앞단에서는 k8s 환경으로 배포된 fastapi 어플리케이션이 로그를 받고, 여기서 여러 군데로 로그를 전송하는데 그 중 하나가 kinesis입니다. 안정적으로 kinesis를 가용하기 위해 공부하고 테스트했던 사항들을 기록합니다.

더 읽어보기 »

[daily] 책 리뷰 - 프로그래머를 위한 파이썬

작성일 2021-07-20 | In daily |

저의 업무 환경은 Python입니다. Airflow와 AWS 서비스(lambda, batch, glue..) 전부 파이썬만을 사용하고 있습니다.

더 읽어보기 »

[spark] spark sql

작성일 2021-05-19 | In spark |

처음에 spark sql을 보고 스파크에서도 sql을 사용할 수 있구나! 정도로 생각했지만 spark sql은 이보다 좀 더 큰 범위의 기능을 제공합니다. spark sql은 단순히 sql을 사용하는 것은 물론, sql과 비슷한 개념으로 dataframe / dataset에서 데이터를 처리할 수 있도록 여러 메서드도 제공합니다.

더 읽어보기 »

[spark] Docker Ubuntu 컨테이너로 Spark 실습환경 만들기 3. spark application 실행

작성일 2021-05-14 | In spark |

worker와 master도 연결했으니 스파크 어플리케이션을 실행해보겠습니다.

더 읽어보기 »

[spark] Docker Ubuntu 컨테이너로 Spark 실습환경 만들기 2. master - worker 환경 구성

작성일 2021-05-09 | In spark |

worker 컨테이너를 띄우고 master 컨테이너와 연결해보겠습니다.

더 읽어보기 »

[spark] Docker Ubuntu 컨테이너로 Spark 실습환경 만들기 1. 컨테이너 준비

작성일 2021-05-08 | In spark |

최근 스파크를 공부하고 있습니다. 실무에서 aws glue를 사용하면서 직접 스파크 코드를 작성하기도 하지만, 단순히 문법이나 메서드보다는 spark의 클러스터 환경을 직접 구축해보고 경험해보는 게 더 값지고 재밌을거라 생각했습니다.

더 읽어보기 »

[airflow] Airflow - PythonOperator에서 execution_date 사용하기

작성일 2021-05-01 | In airflow |

airflow에서 DAG instance는 execution_date를 기준으로 생성됩니다. 주기적으로 발생하는 ETL 스케줄을 편리하게 task / dag 단위로 관리할 수 있다는게 airflow의 큰 장점입니다.

더 읽어보기 »

[AWS] glue에서 내 프로젝트 import하기

작성일 2021-04-02 | In AWS |

glue job을 사용하다보니 불편함을 느낀 점은 2가지입니다.

더 읽어보기 »

[Spark] reduce / fold

작성일 2021-03-16 | In spark |

Reduce

더 읽어보기 »

[airflow] airflow - depends_on_past / wait_for_downstream

작성일 2021-03-13 | In airflow |

airflow task 설정을 하다가, 이전 task에 의존적으로 실행 계획을 만들 수 있는 옵션 2개를 찾았습니다. 이전 task에 상관없이 실행 가능한 모든 task를 실행시키는 경우에는 이 옵션들이 의미가 없겠지만, task의 성공여부에 따라 ETL 계획에서 조건을 주고 싶은 경우에는 이 두가지 옵션이 도움이 될 것입니다.

더 읽어보기 »
1 2 3 4 … 6
psw

psw

Elegant theme for Jekyll.

53 포스트
12 카테고리
16 태그
RSS
© 2025 psw
Powered by Jekyll
Theme - NexT.Muse