[AWS] MWAA 사용기

작성일 2021-09-27 | In AWS |

8월 31일에 MWAA(Amazon Managed Workflows for Apache Airflow)가 서울 리전에도 출시되었습니다. 짝짝!!

[AWS] Kinesis 도입기 2. Lambda, Glue

작성일 2021-08-19 | In AWS |

firehose는 data stream의 consumer로 등록 가능한 aws 서비스입니다. broker인 data stream에 있는 데이터를 특정 목적지(s3, redshift, http…)로 보내주는 역할을 하는데, 중간에 끼워넣을 수 있는 transform 단계로 lambda와 glue catalog table이 있습니다.

더 읽어보기 »

[AWS] Kinesis 도입기 1. Data Stream과 Firehose

작성일 2021-08-03 | In AWS |

최근 실시간 로그 수집을 위해 kinesis를 도입했습니다. 앞단에서는 k8s 환경으로 배포된 fastapi 어플리케이션이 로그를 받고, 여기서 여러 군데로 로그를 전송하는데 그 중 하나가 kinesis입니다. 안정적으로 kinesis를 가용하기 위해 공부하고 테스트했던 사항들을 기록합니다.

더 읽어보기 »

[daily] 책 리뷰 - 프로그래머를 위한 파이썬

작성일 2021-07-20 | In daily |

저의 업무 환경은 Python입니다. Airflow와 AWS 서비스(lambda, batch, glue..) 전부 파이썬만을 사용하고 있습니다.

더 읽어보기 »

[spark] spark sql

작성일 2021-05-19 | In spark |

처음에 spark sql을 보고 스파크에서도 sql을 사용할 수 있구나! 정도로 생각했지만 spark sql은 이보다 좀 더 큰 범위의 기능을 제공합니다. spark sql은 단순히 sql을 사용하는 것은 물론, sql과 비슷한 개념으로 dataframe / dataset에서 데이터를 처리할 수 있도록 여러 메서드도 제공합니다.

더 읽어보기 »