채용공고 올리기

미리보기님을 응원해보세요!

지금 만족하고 있어요

미리보기

기본 정보

이름
미리보기
직업
Brand Protection을 위한 AI Engineering을 담당하는 데이터 사이언티스트 입니다.
간단 소개

브랜드 보호를 위한 AI 엔지니어링 전문 데이터 사이언티스트로, 첨단 머신러닝 기술을 활용하여 기업의 브랜드 가치를 수호하고 위조품 탐지 및 온라인 평판 관리 솔루션을 개발합니다.

자기소개

자기소개

안녕하세요, 저는 Taeyoon Kim입니다. 현재 영국 에든버러에서 활동 중인 데이터 사이언티스트로, 브랜드 보호를 위한 AI 엔지니어링에 특화된 전문가입니다.

Snapdragon Monitoring Limited에서 데이터 사이언스 및 AI 부서를 이끌고 있으며, 50개 이상의 글로벌 브랜드를 위한 ML 파이프라인을 설계하고 구축하는 책임을 맡고 있습니다. 이전에는 브랜드 보호 전문가로 일하며 이 분야에 대한 깊이 있는 이해를 쌓았습니다.

제 주요 프로젝트로는 브랜드 보호를 위한 로고 감지 시스템 개발, 이미지 및 텍스트 분류 ML 시스템 유지보수, 그리고 이미지 내 텍스트 인식(OCR) 모델 개발 및 배포가 있습니다. 이러한 프로젝트들을 통해 YOLOv8, AWS SageMaker, Keras, PaddleOCR 등 다양한 기술을 활용한 경험이 있습니다.

Python, SQL, 그리고 다양한 머신러닝/딥러닝 라이브러리를 능숙하게 다루며, 데이터 마이닝부터 모델 최적화, 특성 공학에 이르기까지 폭넓은 데이터 사이언스 기술을 보유하고 있습니다. AWS 공인 클라우드 실무자 자격증을 보유하고 있으며, MLOps와 생성형 AI에 대한 지속적인 학습을 통해 최신 기술 동향을 파악하고 있습니다.

에든버러 대학에서 경영학 석사 학위를, 광운대학교에서 경영학 및 법학 학사 학위를 취득했습니다.

빠른 학습 능력과 효과적인 의사소통 능력, 그리고 시간 관리 능력을 바탕으로 복잡한 비즈니스 문제를 해결하는 데 기여할 준비가 되어 있습니다. 제 기술과 경험이 귀사의 목표 달성에 큰 도움이 될 수 있을 것이라 확신합니다.

기술 스택

기술 스택

Python, AWS, SQL, NLP, 머신러닝, 컴퓨터 비전, Docker, VSCode, mlops, mlflow

경력

회사명

Snapdragon Monitoring Ltd

직급 | 부서 | 근무 유형

Data Scientist | Tech

근무 기간

담당 업무

빠른 학습 능력과 뛰어난 도메인 지식 습득 능력을 갖춘 데이터 사이언티스트로서, 복잡한 비즈니스 문제를 해결하기 위해 머신러닝 모델을 적용하는 데 전문성을 가지고 있습니다. 소프트웨어 엔지니어들과 협력하여 모델을 제품화하고 MLOps 시스템을 구축한 경험이 있으며, 비기술적 이해관계자들과 효과적으로 소통하여 복잡한 개념을 이해하기 쉽게 전달할 수 있습니다. 엄격한 시간 관리를 준수하면서도 동료들과 친근하고 편안한 관계를 유지하는 능력을 갖추고 있어, 역동적인 팀 환경에서 중요한 역할을 수행할 수 있습니다.

#### 주요 책임 및 성과:

1. 데이터 사이언스 및 AI 부서 리드

- 부서의 전략적 방향 설정 및 팀 관리

- AI 기술을 활용한 브랜드 보호 솔루션 개발 주도

2. ML 파이프라인 설계 및 구축

- 50개 이상의 글로벌 브랜드를 위한 생산 환경의 ML 파이프라인 책임

- 효율적이고 확장 가능한 파이프라인 구축으로 브랜드 보호 프로세스 최적화

3. 로고 감지 시스템 개발 및 배포

- Python, YOLOv8, AWS SageMaker를 활용한 로고 감지 시스템 개발

- OpenCV를 사용하여 이미지에서 로고 감지 구현

- 약 100개의 로고 이미지 수집 및 주석 처리 프로세스 간소화

- Amazon SageMaker에서 GPU (Tesla T80)를 사용하여 모델 학습

- ROCAUC 점수를 기반으로 모델 성능 평가 및 가중치를 S3에 저장하여 재현성 보장

4. 이미지 및 텍스트 분류 ML 시스템 유지보수

- Keras, AWS S3 & EC2, SkLearn, Pandas를 사용한 이미지 유사도 점수 시스템 개발 및 배포

- 3천만 개의 일일 스크래핑된 e-커머스 제품 리스팅에 대한 비정형 데이터 분류 모델 유지 및 개선

5. 텍스트 인식(OCR) 모델 개발 및 배포

- PaddleOCR, EasyOCR, PyTessract를 활용하여 이미지 내 특정 텍스트 추출 OCR 모델 개발

- 상표 침해 사례에서 이미지 내 워드마크 식별에 특화된 모델 구현

### 브랜드 보호 전문가

기간: 2020년 11월 - 2022년 7월 (18개월)

#### 주요 책임 및 성과:

- 브랜드 보호 전략 수립 및 실행

- 온라인 위조품 식별 및 대응 프로세스 개선

- 데이터 기반 의사결정을 위한 분석 보고서 작성

## 기술 스택

- 프로그래밍/소프트웨어: Python (Numpy, Pandas, NLTK, SKlearn, Matplotlib, PyTorch, TensorFlow/Keras, OpenCV2), SQL, PowerBI, Jupyter Lab, Git, VS Code, Excel(Analytics), Linux, Docker

- ML/DL: 데이터 마이닝, 데이터 처리, 데이터 분석, 데이터 시각화, 통계 모델링 (회귀 모델, 시계열, 의사결정 트리, 랜덤 포레스트), 군집화 (K-means, 계층적 군집화, PCA), 신경망 (CNN, RNN, LSTM), NLP (토큰화, 벡터화, 특성 추출, 로지스틱 회귀 분류기), CV & 객체 감지 (VGG16, ResNet, YOLOv3,5,6,8), 파인튜닝, 모델 최적화, 특성 공학

## 자격증 및 교육

- AWS - 공인 클라우드 실무자

- DeepLearning.AI - 생산을 위한 머신러닝 엔지니어링 (MLOps)

- DeepLearning.AI - 대규모 언어 모델을 이용한 생성형 AI

- Coursera - 생산 머신러닝 시스템

- Google - 데이터 분석 전문가 자격증

## 학력

- 에든버러 대학교, 영국 - 경영학 석사

- 광운대학교, 한국 - 경영학 및 법학 학사

이 경력기술서는 제가 데이터 사이언스 및 AI 분야에서 쌓은 전문성과 실질적인 프로젝트 경험을 상세히 보여줍니다. 특히 브랜드 보호를 위한 AI 솔루션 개발에 중점을 두고 있으며, 다양한 기술 스택을 활용한 실제 문제 해결 능력을 강조하고 있습니다.

프로젝트

프로젝트명

소속/기관명

프로젝트 기간

프로젝트 내용

## 1. 브랜드 보호를 위한 로고 감지 시스템 개발 및 배포

기술 스택: Python, YOLOv8, AWS SageMaker, OpenCV

프로젝트 기간: [기간 추가 필요]

목표: 브랜드 보호를 위한 효과적인 로고 감지 시스템 개발 및 배포

세부 내용:

1. 데이터 수집 및 전처리

- 약 100개의 특정 로고가 포함된 이미지 수집

- 주석 도구를 사용하여 이미지에 바운딩 박스 라벨링

2. 모델 학습

- Amazon SageMaker의 Tesla T80 GPU 인스턴스를 활용하여 YOLOv8 모델 학습

- 하이퍼파라미터 튜닝을 통한 모델 성능 최적화

3. 성능 평가

- ROCAUC 점수를 기반으로 모델 성능 평가

- 테스트 데이터셋을 통한 모델의 정확도 및 재현율 분석

4. 배포 및 유지보수

- 학습된 모델 가중치를 AWS S3에 저장하여 재현성 보장

- 실시간 예측을 위한 서빙 인스턴스 구축

결과:

- 로고 감지 정확도 [수치 추가 필요]% 달성

- 실시간 로고 감지 시스템 성공적 배포, 브랜드 보호 효율성 [수치 추가 필요]% 향상

## 2. 이미지 및 텍스트 분류 ML 시스템 유지보수

기술 스택: Keras, AWS S3 & EC2, SkLearn, Pandas, VGG16

프로젝트 기간: [기간 추가 필요]

목표: 클라이언트용 이미지 유사도 점수 시스템 개발 및 대규모 e-커머스 제품 리스팅 분류

세부 내용:

1. 이미지 유사도 시스템 개발

- 사전 학습된 VGG16 모델을 활용한 이미지 특성 추출

- 코사인 유사도 계산을 통한 이미지 랭킹 시스템 구현

2. 텍스트 분류 모델 개발

- 3천만 개의 일일 스크래핑된 e-커머스 제품 리스팅에 대한 분류 모델 구축

- 비정형 데이터(텍스트, 이미지) 처리를 위한 파이프라인 구축

3. 시스템 배포 및 유지보수

- AWS EC2 인스턴스를 활용한 모델 서빙

- 일일 데이터 업데이트 및 모델 재학습 프로세스 자동화

결과:

- 클라이언트의 참조 이미지 업로드 및 유사도 기반 랭킹 제공 시스템 성공적 구축

- 일일 3천만 개 제품 리스팅에 대한 자동 분류 및 예측 점수 제공 달성

## 3. 이미지 내 텍스트 인식(OCR) 모델 개발 및 배포

기술 스택: PaddleOCR, EasyOCR, PyTesseract

프로젝트 기간: [기간 추가 필요]

목표: 상표 침해 탐지를 위한 특화된 OCR 모델 개발

세부 내용:

1. 모델 선정 및 비교

- PaddleOCR, EasyOCR, PyTesseract 성능 비교 분석

- 특정 상표 워드마크 인식에 최적화된 모델 선정

2. 모델 최적화

- 선정된 모델의 파라미터 튜닝

- 특정 폰트 및 스타일의 워드마크에 대한 인식률 향상을 위한 추가 학습

3. 시스템 통합

- 기존 브랜드 보호 시스템과의 통합

- 실시간 이미지 처리 및 텍스트 추출 파이프라인 구축

결과:

- 이미지 내 워드마크 인식 정확도 [수치 추가 필요]% 달성

- 상표 침해 탐지 효율성 [수치 추가 필요]% 향상

각 프로젝트는 브랜드 보호라는 핵심 목표 하에 수행되었으며, 다양한 머신러닝 및 딥러닝 기술을 활용하여 실제 비즈니스 문제를 해결했습니다. 이러한 프로젝트들을 통해 데이터 과학 기술의 실제 적용 능력과 문제 해결 역량을 입증했습니다.

댓글