AI Platform with Python at Karrot - Inference Pipeline Part(Pycon Korea 2025)

Overview This article covers our journey building a large-scale ML inference pipeline at Karrot (당근) using Python, Apache Beam, and Google Cloud Dataflow. The presentation was given at PyConKR 2025 by Park JunSeong and Byun Kyuhyun from the ML Infrastructure and ML Data Platform teams. AI Platform with Python (PDF) This browser does not support PDFs. Please download the PDF to view it: Download PDF Table of Contents Part 1: ML Infrastructure with Python (by Park JunSeong) Service Growth with AI Models ...

October 4, 2025 17 min

How to use multiple Cursor or VSCode by language

I’ve been using Cursor for a while and found it to be an excellent editor. However, when working on projects that require multiple programming languages, I often experience performance issues with the editor becoming sluggish. This reduces my productivity, so I’ve been searching for a way to use different editor setups for each language. Using Profiles In Cursor (an editor based on VSCode), you can use Profiles to apply different settings for each language. This method doesn’t involve using different settings for each language directly, but rather uses different profiles to manage settings for each language. ...

March 3, 2025 2 min

언어별로 여러 Cursor 또는 VSCode를 사용하는 방법

한동안 Cursor를 사용했고 이것이 훌륭한 에디터라고 생각한다. 하지만 여러 프로그래밍 언어가 필요한 프로젝트에서 작업할 때, 종종 에디터가 무거워지는 경우가 있었다. 이럴 때 생산성이 떨어져서 각 언어마다 다른 에디터 설정을 사용하는 방법을 찾고 있었다. Profile을 이용하는 방법 Cursor에서는 Profile을 이용해서 각 언어별로 다른 설정을 사용할 수 있다. 이 방법은 각 언어별로 다른 설정을 사용하는 것이 아니라, 각 언어별로 다른 프로필을 사용하는 것이다. cmd+shift+p 를 눌러서 >Profiles: New Profile... 를 선택하면 profile을 생성할 수 있다: ...

March 3, 2025 2 min

-10x 리더 되기, 그리고 10x 리더 되기

훌륭한 리더란 무엇인지, 팀의 성과와 잠재력을 진정으로 끌어올릴 수 있는 사람이 어떤 사람인지 고민하는 것이 중요하다. 이러한 고민은 “10x Leader” - 팀의 효율성을 10배로 높일 수 있는 리더라는 개념을 탐구하게 하는 계기가 되었다. “역발상: 어리석음을 피하는 힘” Charlie Munger의 개념은 매우 인상적이다. 이 친숙한 원칙에서 영감을 받아, -10x leader가 되는 것이 무엇인지부터 살펴보았다. 무엇을 추구해야 하는지 아는 것보다 무엇을 피해야 하는지 아는 것이 종종 더 가치있기 때문이다. -10x 리더 팀원들로부터 존경을 얻기 위해 리더가 피해야 할 중요한 점들이 있다. 다음은 리더가 피해야 할 핵심 측면들이다: ...

February 9, 2025 3 min

Becoming a 10x Leader: Learning from Inversion

I’ve been thinking about what makes a great leader - someone who can truly elevate their team’s performance and potential. This led me to explore the concept of a “10x leader” - a leader who can multiply their team’s effectiveness tenfold. I’ve long been fascinated by Charlie Munger’s concept of “Inversion: The Power of Avoiding Stupidity”. Drawing from this familiar principle, I’ll begin by examining what makes a -10x leader, as understanding what to avoid is often more valuable than knowing what to pursue. ...

February 9, 2025 4 min

AWS Hero가 선정한 2025년 클라우드 트렌드와 신규 서비스 - AWS re:Invent reCap 온라인 콘퍼런스

“AWS Hero가 선정한 2025년 클라우드 트렌드와 신규 서비스 - AWS re:Invent reCap 온라인 콘퍼런스” 에서 공유한 내용을 정리했다. Youtube Summary 주요 발표 내용 기본 빌딩 블록 강화: AWS는 컴퓨팅, 스토리지, 데이터베이스와 같은 기본적인 클라우드 서비스에 더욱 집중하는 모습을 보였습니다. 특히, 4세대 Graviton 칩을 예고하며 데이터베이스 및 웹 애플리케이션 구동 시 성능 향상을 강조했습니다. Amazon S3 테이블 기능 추가로 4K 데이터 처리를 위한 기능이 개선되었고, 글로벌 애플리케이션을 위한 멀티 리전 액티브-액티브 DB가 다수 발표되었습니다. ...

February 7, 2025 2 min

AWS Unified Studio 소개

Amazon SageMaker Unified Studio는 데이터 분석과 AI 도구를 단일 플랫폼으로 통합한 포괄적인 개발 환경이다. Unified Studio는 기존 SageMaker Studio의 단순한 진화가 아닌, AWS의 분석 및 AI/ML 서비스를 통합한 완전히 새로운 환경이다. Amazon Athena, Amazon EMR, AWS Glue, Amazon Redshift, Amazon MWAA 등 AWS의 친숙한 분석 도구들이 하나의 인터페이스로 통합되어 있다. 또한 Amazon Bedrock IDE가 통합되어 있어 생성형 AI 개발이 용이하며, Amazon Q Developer를 통해 개발 수명주기 전반의 작업을 가속화할 수 있다. 이를 통해 데이터 분석부터 AI/ML 모델 개발, 배포까지 전체 과정을 단일 환경에서 수행할 수 있다. ...

January 28, 2025 5 min

DORA 메트릭스: DevOps 성과 측정의 핵심 지표

업무를 하다 보면 성과를 정량적으로 측정하는 방법에 대해 고민하게 된다. 업무 효율이 향상되더라도 이를 명확한 지표로 나타내기는 쉽지 않다. 이러한 고민 속에서 DORA라는 방법론을 통해 업무를 측정할 수 있다는 것을 알게 되었다. 실제로 측정과 기록, 관리가 필요한 일이라 실무에 적용하기는 쉽지 않지만, 업무를 바라보는 관점을 이해하는 것은 중요하다고 생각한다. 이에 DORA 메트릭스에 대해 조사하고 정리해보았다. DORA(DevOps Research and Assessment) 메트릭스는 DevOps 팀의 성과와 효율성을 평가하는 4가지 핵심 지표이다. 이 지표들을 통해 소프트웨어 제공 프로세스의 품질을 객관적으로 측정할 수 있다. ...

January 13, 2025 2 min

회고 방법론 (Retrospective Methods)

회고를 진행할 때 활용할 수 있는 다양한 방법론들을 소개한다. 각 방법의 특징과 장점을 참고하여 상황에 맞는 방법을 선택하여 회고를 진행할 수 있다. 1. KPT (Keep, Problem, Try) 간단하면서도 실용적인 회고 방식으로, 개인 회고에 매우 적합하다. 때로는 가볍게 프로젝트 회고를 진행할 때도 유용하다. Keep: 잘했던 것, 유지하고 싶은 것 Problem: 문제점, 개선이 필요한 것 Try: 앞으로 시도해볼 것, 개선 방안 2. 5F (Fact, Feeling, Finding, Future, Feedback) 감정적인 부분까지 깊이 있게 돌아볼 수 있는 방법이라고 한다. 실제 업무에서 사용해본 적은 없다. 다만 감정을 느낀다는 측면에서 개인 회고에 적합하다고 한다. ...

January 1, 2025 3 min

AWS EBS, FSx, EFS for EC2: Storage Comparison (2024)

개요 ML Data platform engineering에서 Feature Store의 성능을 개선하기 위해 storage 옵션들을 검토하고 있다. Remote cache만으로는 network latency 문제가 있어서, disk storage를 활용하면 더 빠른 데이터 접근이 가능할 것으로 기대된다. 이 글에서는 AWS EC2에서 사용할 수 있는 주요 storage 옵션들을 비교 분석한다: Storage 최적화 EC2 인스턴스: 로컬에 직접 연결된 NVMe SSD로 최고의 I/O 성능 제공 EBS (Elastic Block Store): EC2에 연결되는 블록 스토리지로 높은 IOPS와 처리량 지원 FSx: 완전 관리형 파일 시스템으로 여러 EC2 인스턴스에서 공유 가능 EFS (Elastic File System): 완전 관리형 NFS 파일시스템으로 자동 확장/축소 지원 AWS EC2의 Storage 최적화 인스턴스 대용량 데이터셋에 대한 고성능 읽기/쓰기 작업이 필요한 워크로드를 위해 설계되었다. ...

November 15, 2024 9 min