미리보기
기본 정보
끊임없이 성장하며, 탁월한 결과로 팀과 조직에 가치를 더하는 열정적인 도전자입니다.
기술 스택
자기소개
“이 문제를 어떻게 풀 수 있을까?” 저는 어려운 문제를 마주할 때마다 이런 질문을 던지며 해답을 찾는 과정에서 즐거움을 느낍니다. 데이터가 단순한 정보의 나열에서 시작해 복잡한 문제를 해결하는 도구로 변모하는 과정은 늘 저를 흥미롭게 합니다. 데이터를 통해 세상을 더 잘 이해하고, 그 과정에서 새로운 가치를 만들어가는 데이터 사이언티스트가 되고자 합니다.
중고 전공서적 플랫폼을 개발하는 세미 프로젝트에서는 큰 위기를 겪은 적이 있습니다. 프로젝트 도중 팀원들이 이탈하며 업무가 몰렸고, 프로젝트의 완성 여부조차 불확실한 상황이었습니다. 하지만 상황을 탓하거나 좌절하기보다는, 남은 팀원들과 협력해 프로젝트의 핵심 기능을 다시 정의하고 우선순위를 재조정했습니다. 부족한 기술은 빠르게 익히며 작업의 효율성을 높였고, 끝내 프로젝트를 성공적으로 완수할 수 있었습니다. 이 경험은 단순히 기술을 익히는 것을 넘어 책임감과 소통의 중요성을 배우는 계기가 되었습니다. 또한 어려운 상황에서도 도전에 임하면 해결할 수 있다는 자신감을 키울 수 있었습니다.
데이터 사이언스를 공부하며 늘 스스로에게 두 가지 질문을 던졌습니다. 첫째, 데이터를 통해 어떤 문제를 해결할 수 있을까? 둘째, 이를 어떻게 현실적으로 구현할 수 있을까? 이 두 가지 질문은 제 학습과 경험의 방향을 정하는 기준이 되어주었습니다. 학업 과정에서는 통계적 분석, 데이터 시각화, 머신러닝 같은 기술을 배우며, 이를 실제 문제에 적용하는 연습을 꾸준히 해왔습니다. 예를 들어, 특정 지역의 소비 패턴을 분석하고 이를 바탕으로 마케팅 전략을 제안하는 프로젝트를 통해 데이터가 단순한 정보의 나열을 넘어 현실적인 문제 해결의 도구가 될 수 있다는 점을 직접 경험했습니다.
새로운 상황에서도 빠르게 적응하며, 끊임없이 배우는 자세는 저만의 강점이라고 생각합니다. 데이터 사이언스는 하루가 다르게 발전하는 분야로, 새로운 기술과 도구가 끊임없이 등장합니다. 저는 이를 부담으로 느끼기보다는 기회로 여기며 배우는 과정을 즐기고 있습니다. 특히 새로운 기술을 익히고 이를 프로젝트에 적용해 결과를 분석하며 얻는 성취감은 제가 이 분야에서 꾸준히 성장하도록 만드는 가장 큰 원동력입니다. 또한 데이터를 통해 도출한 결과가 실제로 사람들에게 긍정적인 영향을 미칠 때 큰 보람을 느낍니다.
저는 데이터를 분석하는 데 그치지 않고, 이를 기반으로 실질적인 가치를 만들어내는 데이터 전문가로 성장하고 싶습니다. 데이터를 활용해 조직의 성과를 높이고, 나아가 사회적으로도 유의미한 변화를 만들어내는 것이 제 목표입니다. 앞으로도 배우고 도전하며, 데이터를 통해 더 나은 결과를 만들어갈 수 있는 데이터 사이언티스트로 자리 잡고 싶습니다.
프로젝트
기타
중고 전공서적 플랫폼(Rebook)
본 프로젝트는 대학생과 졸업생들이 전공 서적을 안전하고 편리하게 거래할 수 있는 클라우드 기반 중고 전공 서적 e-커머스 플랫폼을 개발하는 것을 목표로 했습니다. 플랫폼은 사용자 간의 직접 거래를 지원하면서도, 거래의 안전성을 보장하는 데 중점을 두었습니다. 특히, AI 기반 채팅 모니터링 시스템을 구축해 거래 채팅에서 피싱, 외부 앱 유도, 계좌번호 전송 등 위험 요소를 실시간으로 감지함으로써 사용자 신뢰를 높이고자 했습니다.
프로젝트는 딥러닝 기반 다중 분류 시스템을 설계하고, FastAPI를 활용해 AI 모델을 실시간으로 작동할 수 있도록 구현하는 데 중점을 뒀습니다. 개인정보 보호 기준을 준수하며 데이터를 수집, 처리, 학습했으며, KcELECTRA 모델을 파인튜닝해 한국어 사용자 텍스트에서 발생하는 비정형 표현을 정확히 분류할 수 있도록 최적화했습니다.
프로젝트에서의 역할 및 기여
이 프로젝트에서 저는 데이터 수집부터 모델 설계, 구현, 실시간 배포까지 AI 시스템 개발의 주요 부분을 담당했습니다.
1. 데이터 수집 및 전처리
• 번개장터에서 전공 서적 관련 데이터를 크롤링해 모델 학습용 데이터로 사용했습니다.
• AI Hub와 ChatGPT를 활용해 부족한 데이터를 보완하고, 거래 대화 및 위험 메시지 데이터를 생성해 학습 데이터의 다양성을 확보했습니다.
• 불용어 제거, 특수문자 정리, 데이터 균형 조정 등의 작업을 통해 학습 데이터의 품질을 높였습니다.
2. AI 모델 설계 및 구현
• 한국어 텍스트 특성(구어체, 신조어, 오탈자 등)에 적합한 KcELECTRA 모델을 선택해 다중 분류 모델을 설계했습니다.
• 안전 메시지, 피싱, 외부 앱 유도, 계좌번호 전송 등 4개의 주요 클래스를 분류하는 모델을 학습하고, 학습률 조정과 데이터 증강 같은 최적화 기법을 적용해 F1-score 기준으로 높은 성능을 달성했습니다.
3. 경찰청 API 연동
• 사기 계좌 및 전화번호 여부를 실시간으로 확인할 수 있도록 경찰청 API를 연동해 사용자 안전성을 강화했습니다.
4. FastAPI 서빙 및 실시간 서비스 구현
• 학습한 AI 모델을 FastAPI로 배포해 플랫폼 사용자 메시지를 실시간으로 모니터링할 수 있도록 구현했습니다.
• API 요청과 응답 구조를 설계해 입력 메시지에 대한 결과를 실시간으로 제공하도록 설계했습니다.
5. 트러블슈팅 및 성능 개선
• 초기 모델에서 발생한 오분류 문제를 분석하고, 데이터를 보강한 뒤 모델을 재학습시켜 문제를 해결했습니다.
• 피싱 메시지와 안전 메시지의 유사성으로 인한 혼동을 방지하기 위해 GPT 생성 데이터를 통합해 모델을 개선했습니다.
• 영어 메시지 입력 문제를 해결하기 위해 GPT API를 활용해 영어를 한국어로 번역하는 처리 과정을 추가했습니다.
프로젝트 기여도
이 프로젝트에서 저는 데이터 수집과 처리, AI 모델 설계 및 구현, 그리고 FastAPI를 활용한 실시간 서비스 배포까지 핵심적인 역할을 수행했습니다. 특히, 데이터 부족 문제를 해결하기 위해 창의적인 방법을 모색하고, KcELECTRA 모델을 통해 한국어 채팅 데이터를 정확히 분류하는 데 성공했습니다. 또한, FastAPI와 경찰청 API 연동을 통해 사용자 안전성을 보장하는 시스템을 구축하는 데 기여했습니다.