미리보기
기본 정보
몰입하며 성장하는 개발자 김주성입니다.
자기소개
• 팀 프로젝트를 함께 진행했던 인원들 모두 저의 키워드를 몰입으로 꼽을 정도로 몰입력이 뛰어납니다.
• 현재 NLP와 머신러닝 분야를 공부 중이며 주로 사용하는 언어는 Python입니다.
• 대학교와 부트캠프에서 인공지능과 컴퓨터공학에 대한 기초지식을 쌓았습니다.
• 다양한 프로젝트를 진행해 보며 AI 서비스를 개발해 보았고, 협업을 경험해 보았습니다.
기술 스택
Python, 머신러닝, PyTorch, 딥러닝, NLP
프로젝트
코드 유사성 판단 시즌 2 AI 경진대회
개인 참가 해커톤
2024.03. ~ 2024.04.
사용 기술 스택
Python, PyTorch
프로젝트 설명
사용자 국가, 사용 OS, 브라우저 등 19개의 피쳐들을 이용해 조회수를 예측하는 프로젝트
EDA를 통해 데이터의 특성을 파악하였습니다.
파악한 데이터의 특성을 통해 모델을 선정하고 데이터의 전처리를 통해 모델 성능을 향상시켰습니다.
최종적으로 361명 중 2위의 성적으로 해커톤을 마무리하였습니다.
웹 로그 기반 조회수 예측 해커톤
개인 참가 해커톤
2024.02. ~ 2024.03.
사용 기술 스택
Python, Machine Learning, Pandas, Numpy
프로젝트 설명
두 C++ 코드를 입력받고 두 코드가 같은 기능을 하는 코드인지 구분하는 모델을 제작하는 프로젝트
기존의 언어가 아닌 코드를 처리하는데 좋은 성능을 보일 수 있는 모델을 탐색하였습니다.
코드의 특성에 맞게 데이터 전처리를 통해 성능을 향상시켰습니다.
최종적으로 133명 중 10위의 성적으로 해커톤을 마무리하였습니다.
Katering
팀 프로젝트
2023.08. ~ 2023.08.
사용 기술 스택
Python, PyTorch, HTML, CSS, JavaScript, FastAPI
프로젝트 설명
금융 기사를 요약하고 카테고리별로 제공하며 사용자의 관심사에 따라 기사와 금융 상품을 추천하는 서비스
Chat GPT를 이용해 금융 기사들을 요약한 뒤 Albert 모델을 통해 기사들의 카테고리를 분류하였습니다.
사용자가 원하는 카테고리별로 기사들을 볼 수 있고 사용자의 사용기록에 따라 추천 금융 상품과 기사들의 목록을 제공하는 서비스를 개발하였습니다.
웹사이트 개발을 프론트에서부터 백엔드까지 전담하였습니다.
AI야어여(발음 교정)
팀 프로젝트
2023.06. ~ 2023.07.
사용 기술 스택
Python, PyTorch, CSS 3, HTML 5, JavaScript, Flask
프로젝트 설명
외국인을 대상으로 한 한국어 발음 교육 서비스 제작 프로젝트
음성 인식 기능 구현을 위해 음성 모델의 탐색 및 성능 실험을 진행하였습니다.
• 서비스 배포를 위한 웹사이트를 프론트에서부터 백엔드까지 전담하여 개발을 진행하였습니다.
웹사이트상에서 추천 학습 단어와 현재 학습 중인 단어와 연관이 있는 단어를 제공하도록 하였습니다.
웹사이트상에서 사용자의 음성을 입력받고 음성을 파일로 변환하여 모델에서 인식하도록 하는 파이프라인을 제작하였습니다.
AI야어여
팀 프로젝트
2023.06. ~ 2023.07.
사용 기술 스택
Python, CSS 3, HTML 5, JavaScript, Streamlit
프로젝트 설명
생성형 AI를 이용한 아동 및 외국인 대상 한국어 교육 서비스 제작 프로젝트
생성형 AI를 활용해서 학습에 사용할 문장과 문제를 생성하는 기능을 개발하였습니다.
문장을 생성하는 과정에서 학습자의 수준을 고려하여 쉬운 수준의 문장을 생성할 수 있도록 프롬프트 주입을 하였고
문제 생성을 위해 문제의 예시를 제공하는 few-shot running을 활용하였습니다.
가끔 문제가 제대로 생성되지 않는 경우가 존재하여 문제가 제대로 생성된 경우에만 학습을 진행하도록 검증 기능을 개발하였습니다.
기계독해 : 질문 답하기
팀 프로젝트
2023.06. ~ 2023.06.
사용 기술 스택
Python, PyTorch
프로젝트 설명
대량의 텍스트 데이터에서 주어진 질문에 관한 내용을 탐색하여 답을 출력하는 모델을 제작하는 프로젝트
데이터들의 문자 포맷이 달라서 같은 포맷으로 통합하여 주었고 EM 점수 기준 53점에서 57점으로 약 4점의 성능 향상 효과를 가져왔습니다.
데이터에 개행 문자나 강조 표시 등 HTML 포맷에서 사용되는 문자들이 포함되어 있어서 삭제하였습니다.
문장 내 개체간 관계 추출
팀 프로젝트
2023.05. ~ 2023.05.
사용 기술 스택
Python, PyTorch
프로젝트 설명
주어진 문장 내에서 선정된 두 단어 간의 관계를 예측하는 모델을 제작하는 프로젝트
주어진 데이터셋의 문장에서 일부 단어를 삭제한 후 BERT 계열 모델의 MLM 기능을 이용해 새로운 문장을 생성하는 방법으로 데이터 증강을 시도하였습니다.
데이터 증강 과정에서 원래 문장의 의미를 잘 유지하는 데이터만 활용하기 위해 코사인 유사도를 활용하여 데이터를 선별하였습니다.
포트폴리오
교육
경남대학교
대학교(학사) | 컴퓨터공학과
2017.03. ~ 2023.02. | 졸업
약사고등학교
고등학교
2014.03. ~ 2017.02. | 졸업
대외활동
부스트캠프 AI Tech 5기
부스트캠프
학교에서 AI를 공부하는 과정에 자연어처리에 관심이 생겨 부스트캠프 AI Tech NLP 트랙에 지원하였고 5개월 동안의 학습 과정을 이수하였습니다.
부트캠프 과정에서 다양한 강의를 들으며 AI 지식과 서비스 개발에 대한 기초를 쌓았습니다.
다양한 프로젝트를 진행하며 배운 것들을 직접 활용해 보았고 팀과의 협업을 경험했습니다.
삼성SDS 대학생 알고리즘 특강
삼성SDS
프로그래밍 언어에 익숙해지고 컴퓨팅 사고력을 기르기 위해서 알고리즘 특강을 이수하였습니다.
DFS, BFS, 세그먼트트리 등 다양한 알고리즘을 알아보고 응용하며 개발을 할 때 효율적인 로직을 구현하기 위해 고민을 하는 방법을 배웠습니다.
자격증
정보처리기사
한국산업인력공단
2024.06.
SQLD
한국데이터산업진흥원
2024.04.
ADsP(데이터분석준전문가)
한국데이터산업진흥원
2022.09.
컴퓨터활용능력
1급 | 대한상공회의소
2021.07.