채용공고 올리기

송명근님을 응원해보세요!

지금 만족하고 있어요
책임감
협업 지향
분석적
열정적
긍정적

미리보기

기본 정보

이름
송명근
직업
데이터 사이언티스트
간단 소개

승부욕과 빠른습득력으로 러닝커브가 가파른 데이터 사이언티스트 송명근입니다. AI바우처, 데이처바우처 사업을 경험해보고 생성형AI분야 공모전에 참여한 경험으로 다양한 분야의 실무에 빠르게 적응하여 업무에 투입니 가능합니다.

기술 스택

기술 스택

Python, Pandas, Excel, SQL, 빅데이터분석기사, SQLD, Numpy, Scikit-Learn, Matplotlib, Seaborn, streamlit, GitHub, Slack, Notion

경력

회사명

데이터랩(주)

직급 | 부서 | 근무 유형

연구원 | -

근무 기간

2023.06. ~ 2023.12. (7개월)

담당 업무

AI바우처 사업참여

  • 빅데이터 기반 국제물류 운임/일정 예측 AI솔루션 제작 프로젝트

  • 화주들이 포워딩사에 견적을 요청할 시 영업사원이 직접 선사와 지사에 연락을 하여 견적을 받아 화주에게 견적을 제공함. 혹은 경험에서 나오는 감으로 대략적인 견적을 안내해 불확실하고 시간이 오래걸리는 문제가 있었습니다.

  • 빅데이터를 기반으로 운임/일정 예측 AI모델을 제작하게 되면 높은 정확도와 빠른 시간내에 화주들에게 견적 안내가 가능해졌습니다.

  • 고객사 내부의 ERP데이터(2000년대 초반 ~ 현재), 필요 외부데이터(유가, 환율, 선박운항정보, 기상 등)수집하여 결합했습니다.

  • 고객사 내부 데이터에서 필요한 column을 정의하는 작업, out-lier 데이터와 human error데이터를 정제하는 작업을 진행하였습니다.

  • pycaret을 이용하여 적합한 모델을 탐색하여 RandomForest Classifier모델을 사용하기로 결정하였습니다.

  • 구축된 AI모델을 웹페이지에서 서비스를 개시하였습니다.

프로젝트

프로젝트명

제주도 맛집추천 챗봇서비스 제작

소속/기관명

개인

프로젝트 기간

2024.09. ~ 2024.11.

프로젝트 내용

한국정보통신진흥협회 - 빅콘테스트 - 생성형 AI분야

  • 주최측에서 제공한 신한카드 가맹점정보 데이터를 기반으로 프로젝트를 진행했습니다.

  • 2023년 월별 데이터가 있었기 때문에 중복된 식당들의 수치데이터를 평균값을 이용하여 통합하였습니다. 이후 데이터 내부의 정보를 이용하여 휴무일과 영업시간 column을 생성하는 데이터 전처리 과정을 거쳤습니다. 추가적으로 필요한 데이터인 위/경도 데이터를 수집하기 위해 Naver map API를 이용해 위/경도 데이터를 수집하여 추가하였습니다. 마지막으로 완성된 data를 이용하여 embedding모델이 인식할 수 있도록 자연어 형태의 column을 제작하였습니다.

  • FAISS인덱스를 활용해 유사도 검색을 통해 사용자의 질문에 적합한 식당 정보를 추출하고, 생성형 AI 모델인 Gemini 1.5 flash를 통해 사용자 맞춤형 응답을 생성했습니다.

  • streamlit의 기능들을 이용하여 사용자의 위치, 방문예정 시간대와 요일에 따라 필터링 된 기능을 제공하여 사용자에게 맞춤형 식당을 찾아서 제공하는 기능을 제작하였습니다. 이후 github에 코드를 게시하였고 streamlit cloud를 통해 웹서비스로 배포해 실시간으로 사용자가 접근할 수 있는 형태로 구현하였습니다.

    결과물링크 - https://gen-jejusotre.streamlit.app/

포트폴리오

URL

link

https://pear-earwig-ad7.notion.site/Portfolio-65f8fd23f08c4ed8a28cb951604e7dc7?pvs=74

노션

교육

소속/기관명

태장고등학교

종류 | 전공

고등학교 | 인문

재학 기간 | 재학 상태

2013.03. ~ 2016.02. | 졸업

소속/기관명

수원대학교

종류 | 전공

대학교(학사) | 사학과

재학 기간 | 재학 상태

2016.03. ~ 2024.08. | 졸업

대외활동

활동명

데이터 사이언스 스터디

소속/기관명

모두의 연구소

연도

내용

pandas를 이용한 데이터 전처리하는 과정에 대해 스터디를 진행했습니다.
matplotlib, seaborn을 이용한 데이터 시각화하는 방법에 대해 스터디를 진행했습니다.
scikit-learn을 이용한 머신러닝 / GridSearch등을 이용한 하이퍼 파라미터 튜닝, 앙상블 기법 등 스터디를 진행했습니다.
pycaret을 이용한 AutoML에 대한 방법을 공부했습니다.

자격증

자격증명

SQLD

점수 | 발급기관

합격 | 한국데이터산업진흥원

취득연월

2024.06.

자격증명

빅데이터분석기사

점수 | 발급기관

합격 | 한국데이터산업진흥원

취득연월

2024.07.

댓글