채용공고 올리기

권태혁님을 응원해보세요!

지금 만족하고 있어요

미리보기

기본 정보

이름
권태혁
직업
신입 데이터 엔지니어
이메일
snsk656@naver.com
간단소개

· 안녕하세요! 꾸준히 성장하는 개발자 권태혁입니다. · 실제 외주로 사용되었던 20개 이상의 주제를 크롤링을 통해 직접 데이터를 수집하고 변환, 적재하는 자동화 파이프라인을 구축해 데이터의 정확성과 품질을 높이려고 노력합니다. · 같은 기능이라도 여러가지 방식으로 비교해보며 발전하려고 합니다. · 한 번 시작한 일은 끝까지 완수를 해야 하는 성격 탓에 엉덩이가 무겁다는 말을 많이 듣습니다.

기술 스택

기술 스택

프로젝트

소속/기관명

프로젝트명

생성 AI를 이용한 패션 시착 프로그램

프로젝트 내용

온라인 쇼핑몰이 활발해지고 있지만 시착하지 못한다는 문제를 생성AI를 이용해 내 사진에 원하는 옷을 입혀보며 시착 경험 제공

팀 구성 : 모델 구축 1명, 웹 개발 1명, 데이터 전처리 1명

상세 역할 : 전반적인 웹 개발 및 데이터 전처리 보조, 전체적인 연동

- Django가 Python 기반이므로 AI 모델과의 연동이 자연스러울 거라 생각해 선택

- 이미지 생성 지연(약 30초)으로 인해 완료 페이지 진입 시 이미지가 로드되지 않는 문제가 발생 → 비동기 처리 및 로딩 화면을 적용하여 이미지 생성 완료 시점까지 사용자 이탈을 방지하고 UX를 개선

- 파이썬의 OpenPose 라이브러리와 Segmentation 기법을 활용해 옷과 모델의 영역을 추출하는 이미지 데이터 정제 작업

- 입력 모델 이미지를 세그멘테이션과 OpenPose 모델의 입력으로 넣어주고 생성 모델에 넘겨주는 파이프라인 구축

- 결과물이 부자연스러운 문제 발생 → 관련 논문을 통해 새로운 기술을 발견해 기존 세그멘테이션을 DensePose 기법으로 변경 → 입체감 있게 2D 에서 3D로 성능 향상

- 입력 옷 데이터, 모델 데이터(입력 옷x), 입력된 옷을 입고있는 모델 데이터쌍 셋 문제를 입력 옷 데이터, 모델 데이터(입력 옷o), 모델 데이터(입력 옷o) 로 대체하여 문제 해결

프로젝트 기간
2024.02. ~ 2024.06.
(5개월)
소속/기관명

개인

프로젝트명

웹 크롤링

프로젝트 내용

실전 연습 위해 실제 외주 프로젝트로 진행된 주제를 활용

- 정적 페이지 크롤링

- 동적 페이지 크롤링 - 자동 크롤링 차단 문제를 명시적 대기와 시간 간격을 주어 해결

- 셀레니움 크롤링 방법이 실행시간이 길어 패킷 스니핑을 활용한 크롤링을 통해 개선 (동적 페이지 크롤링 시간 1분 → 0.8초로 단축)

- 자바 스크립트로 데이터를 주고받는 사이트 크롤링

- 무신사 상품 상세페이지 크롤링중 특정 이벤트가 발생해야 데이터가 나타나는 문제가 발생 → element요소에서 script태그에서 사용자 정의 속성으로 데이터를 받는것을 발견 → 정규표현식을 이용해 json형태의 데이터만 추출

- 로그인이 필요한 페이지 크롤링

- selenium으로 로그인시 차단 당하는 문제를 pyperclip을 이용하여 복사 붙여넣기 커맨드를 통해 selenium 감지 우회

- 로그인된 사용자만 할 수 있는 행위를 세션과 쿠키를 크롤링해 넘겨주며 해결

프로젝트 기간
2025.02. ~ 진행 중
소속/기관명

개인

프로젝트명

경상남도 창원시의 상가 데이터를 이용한 상권 분석

프로젝트 내용

총 16만개의 상가 데이터를 정제해 상권을 분석

- 검색 기능 : 파이썬의 위젯 라이브러리를 이용한 검색 기능 구현, 키워드가 포함된 지 점만을 시각화, 카테고리별로 검색 가능

- 군집화 : 머신러닝을 사이킷런을 이용해 상권이 어디에 어느 정도 밀집되어 있는지 시각화

- 데이터 정제 : 필요한 컬럼만을 추출하고, 의미 있는 데이터로 만들기 위해 타입을 변 형 시키고 치킨, 한식, 중식 등으로 분류하는 소분류 컬럼 생성

- 시각화 : 위 기능들을 folium 라이브러리를 이용해 시각화된 지도에서 한눈에 확인 가능

프로젝트 기간
2024.05. ~ 2024.06.
(2개월)
소속/기관명

개인

프로젝트명

배추도 사 무도 사

프로젝트 내용

학교 개인 프로젝트로 나만의 쇼핑몰을 만들었습니다.

- 회원가입 및 로그인 : 쿠키와 세션을 이용해 데이터를 넘기면서 로그인이 유지되고 유저의 정보를 가져오게끔 구현 점만을 시각화, 카테고리별로 검색 가능

- 별점과 좋아요 기능 - 각 메뉴 테이블의 좋아요 속성과 유저 테이블의 좋아요 와 연계해서 카운트하는 식으로 구현

- 애니메이션 - CSS의 프레임과 자바스크립트를 활용해 슬라이드 배너, 메뉴바 등 다양한 눈길을 끄는 애니메이션을 삽입

- 포인트/적립 - 사용자가 물건을 구매하면 포인트가 쌓이고 포인트를 사용할 수 있도록 코드로 구현

프로젝트 기간
2022.10. ~ 2022.12.
(3개월)

포트폴리오

타입

URL

노션
링크

권태혁_데이터엔지니어_포트폴리오

깃허브
링크

깃허브

교육

소속/기관명

창원대학교

종류 | 전공

대학교(학사) | 정보통신공학과

재학 기간

2019.03. ~ 2025.02.

재학 상태

졸업

소속/기관명

웅상고등학교

종류 | 전공

고등학교 | 이공계

재학 기간

2016.03. ~ 2019.02.

재학 상태

졸업

대외활동

소속/기관명

정보통신산업진흥원

활동명

2023SW창의융합캠프

내용

클라우드 기반 이미지 분석 AI 실습
Chat GPT 프롬프트 엔지니어링 실습 Task
생성형 AI 모델 실습 Task

연도

2023

소속/기관명

아마존 웹 서비스

활동명

AWS TechCamp

내용

클라우드의 시작, AWS로 배우는 첫걸음
핵심 서비스로 배우는 AWS (VPC, EC2)
핵심 서비스로 배우는 AWS (EC2, RDS, S3)
Amazon Bedrock과 API Gateway를 활용한 AI 설계
Amazon Bedrock으로 RAG 및 GraphRAG 완벽 마스터
유통 및 소비재 산업을 위한 AI 디지털 혁신 기술
미디어 자산의 디지털 혁신: 데이터 관리에서 AI 서비스 구현까지

연도

2025

자격증

자격증명

정보처리기사

점수 | 발급기관

한국산업인력공단

취득연월

2024.09.

자격증명

SQLD

점수 | 발급기관

한국데이터산업진흥원

취득연월

2025.03.

자격증명

ADsP

점수 | 발급기관

한국데이터산업진흥원

취득연월

2025.03.

자격증명

컴퓨터활용능력 1급

점수 | 발급기관

1급 | 대한상공회의소

취득연월

2023.08.

자격증명

IoT지식능력검정

점수 | 발급기관

KIoTCP

취득연월

2024.06.

자격증명

TOEIC

점수 | 발급기관

705 | ETS

취득연월

2024.11.

자기소개

자기소개

●데이터 직무에 지원하는 이유

 

저는 대학에서 기계 학습, 머신러닝, 딥러닝과 같은 최신 기술을 접하며 신기술의 중요성을 깊이 깨닫게 되었습니다. 프로젝트에서도 이러한 기술을 적극적으로 활용하고자 노력했으며, 특히 생성형 AI를 활용한 프로젝트를 진행하면서 AI의 잠재력에 놀라움과 동시에 경외감을 느꼈습니다. 이 경험을 통해 신기술을 효과적으로 활용하는 것이 미래의 경쟁력을 좌우한다는 점을 명확히 이해하게 되었습니다. 데이터는 이러한 신기술의 성능과 정확도를 결정짓는 핵심 요소라고 생각합니다.

 

[AI의 핵심 : 데이터의 중요성]

AI를 활용함에 있어 데이터는 모델의 성능과 정확도를 좌우하는 중요한 요소라고 생각합니다. 이를 위해 데이터를 정제하는 프로세스 구축에 힘을 주어 품질을 개선하고 크롤링같은 도구를 활용해 데이터 수집, 전처리, 저장까지의 워크플로우를 자동화하고, 데이터 파이프라인의 성능을 지속적으로 모니터링 및 개선을 통해 AI 모델의 성능을 극대화하는 데 기여하고 싶습니다.

 

저는 최신 트렌드를 받아들일 준비가 되어 있으며, 끊임없이 탐구하고 도전하는 자세를 가지고 있습니다. 나날이 발전하는 기술과 함께 멈추지 않고 성장해 나가고 싶습니다.

 

 

●본인이 데이터 직무에 적합한 이유

 

Data Engineer직무는 단순히 데이터 기반의 시스템을 구축하고 관리하는것을 넘어서, AI 모델이 필요로 하는 데이터를 처리 및 자동화 기술을 요구하기 때문에, 데이터와 모델 간의 긴밀한 협업이 핵심이라고 생각합니다.

 

[생성형 AI를 이용한 패션 시착 프로젝트]

 

저는 이전에 생성형 AI 프로젝트를 진행한 경험이 있습니다. GMM 모듈과 U-Net 모델을 활용하여 사람 이미지에 패션 아이템을 시착하는 작업을 했고, 총 3명으로 구성된 팀의 일원으로 참여했습니다. 프로젝트에서 저는 웹 개발과 데이터 전처리를 담당했습니다. OpenPose를 이용해 모델의 자세를 추출하고, 세그멘테이션 기법을 통해 입력 이미지에서 필요한 영역만을 추출해 데이터를 학습시키는 파이프라인을 구축한 경험은 Data Engineer에서의 데이터 처리 과정과 많은 부분이 맞닿아 있다고 생각합니다.

 

특히, 프로젝트 중 발생한 데이터셋 문제로 AI 모델 학습을 위한 적절한 데이터셋을 구하는 것이었는데, 모델 이미지와 옷 이미지, 그리고 옷을 입은 모델 이미지를 포함하는 데이터셋을 확보하기 어려웠습니다. 이를 해결하기 위해 AI 모델이 무엇을 학습해야 하는지 고민한 후, 한 명은 데이터셋을 계속해서 찾는 역할을 맡았고, 나머지 팀원들은 차선책으로 옷을 입은 모델 이미지에서 모델과 옷을 분리해 데이터셋을 구축하고 학습시키는 작업을 분담했습니다. 결과적으로 차선책을 통해 만족스러운 결과를 얻어 데이터 중심의 문제 해결 능력을 키우는 데 큰 도움이 되었습니다.

 

또한, 프로젝트 기간과 시험 일정이 겹쳐 학업을 병행해야 했고, 오류가 발생할 때마다 팀원들이 프로젝트를 미루려는 경향이 있었습니다. 저는 문제를 즉시 해결해야 한다는 주의였지만, 팀원들의 상황을 이해하고 무리한 재촉 대신 스스로 먼저 오류를 조사하고 의견을 제시하며 팀의 작업에 대한 관심을 유지하려 노력했습니다. 이러한 노력을 통해 팀원들도 점차 적극적으로 참여해 마감 기한 이틀 전에 완성도 높은 결과물을 제출할 수 있었습니다.

 

 

 

[주도적인 개발]

최근 크롤링 기술에 관심을 가지게 되어, 크몽 사이트에서 진행되는 외주 프로젝트의 주제를 크롤링하며 실전 경험을 쌓고 있습니다. 이 과정에서 RISS 사이트에 주목하게 되었는데, AI에 질문했을 때 정확하지 않은 답변이 많고, 무료 논문을 찾는 데 번거로움이 있다는 점이 문제로 다가왔습니다. 이를 해결하기 위해 논문 내용을 요약하고, 무료 논문을 필터링하여 보다 신뢰도 높은 답변을 생성할 수 있지 않을까 생각하게 되어 프로젝트를 시작했습니다.

 

프로젝트를 통해 특정 주제의 논문 PDF 파일을 효율적으로 수집하는 크롤링 시스템을 구현했으며, 이를 통해 원하는 주제에 대한 100개 이상의 논문 데이터를 확보하는 데 성공했습니다. 그러나, 개인용 GPT 모델에 해당 데이터를 학습시키는 데 한계가 있어 실제 적용에는 이르지 못했습니다. 향후 더 강력한 AI 모델을 활용할 수 있는 환경이 갖춰진다면, 이를 기반으로 논문 정보를 학습하여 전문적인 지식을 제공하는 시스템을 개발해 보고 싶습니다.

 

이러한 경험을 통해 다양한 데이터를 다루는 역량과, 팀원들과 협력해 문제를 해결하는 능력을 배웠습니다. 이 역량들이 기업과 같이 성장하는 데 큰 도움이 될 것이라 확신합니다.

 

 

 

●한걸음 더 나아가기 위해 본인이 준비하거나 노력하고 있는 것들

 

저는 Data Engineer로서 기술적인 역량뿐만 아니라 팀원들과의 원활한 소통과 협업을 매우 중요하게 생각합니다. 이를 위해 다양한 팀 프로젝트에서 리더로 활동하며 리더십과 의사결정 능력을 꾸준히 발전시켜 왔습니다.

 

예를 들어, 오디오 잡음 제거를 위한 위너 필터 구현 프로젝트에서 4명의 팀원들과 함께 작업했으며, 제가 팀장을 맡았습니다. 초기에는 팀원들의 의욕이 다소 부족했으나, 각자에게 위너 필터와 관련된 논문 조사, STFT(단시간 푸리에 변환), PSD(전력 스펙트럼 밀도) 조사 등 부담스럽지 않은 세부 과제를 할당하여 점진적으로 문제를 해결하도록 이끌었습니다. 그 결과, 팀원들도 잘 따라와 주었고, 위너 필터 구현에서 SNR(신호 대 잡음비)을 평균 1.5배 향상시키는 성과를 달성할 수 있었습니다.

 

또한, 프로젝트 진행 시 Scrum 방법론을 도입해 스프린트 계획과 일일 스탠드업 회의를 통해 팀원들과 부담 없이 소통하며 프로젝트를 효과적으로 이끌었습니다. 이러한 경험은 팀워크와 소통 능력을 꾸준히 향상시키는 데 큰 도움이 되었습니다.

더불어, 학부 학생회 활동을 통해 다양한 사람들과의 교류 능력을 길렀습니다. 학기 말에는 학생들의 성적이 기재된 파일을 검토하는 과정에서 후배들의 성적이 이상하게 기록된 것을 발견했습니다. 후배들에게 성적을 직접 확인한 후 성적이 잘못 기입된 것을 알게 되었고, 이를 교수님께 보고하여 성적 오류를 방지할 수 있었습니다. 방학 중에는 전산실 컴퓨터에 필요한 프로그램을 설치하고 학과 학생들의 수강 학점 관리 등의 간단한 전산 업무를 도우며, 학과장님과 조교님의 추천으로 학과 장학금을 받을 수 있었습니다.

 

이러한 경험들은 제가 협업과 소통, 문제 해결 능력을 향상시키는 데 중요한 밑거름이 되었습니다.

댓글