채용공고 올리기

미리보기

직업
데이터 사이언티스트
이름
장지수
이메일
simonjisu@gmail.com
간단소개
데이터에서 발견한 인사이트를 통해 사람의 의사결정에 도움되는 애플리케이션을 만들고자 합니다. 저는 지능형 데이터 시스템, LLM 에이전트, 그리고 인간 중심의 분석 워크플로우를 연구하며, 복잡한 계산 과정을 더 신뢰할 수 있고, 점검 가능하며, 실질적으로 유용하게 만드는 데 초점을 두고 있습니다.

기술 스택

기술 스택
Python
PyTorch
huggingface
LangChain
MCP
GitHub
Docker

경력

회사명
(재)네이버커넥트
직책 • 부서
사원 • 부스트코스
근무 기간 (근무 형태)
2018.02. - 2019.08.
(1년 7개월 | 계약직)
담당 업무

역할: AI 교육 콘텐츠 기획 및 운영

업무 내용:

  • AI 강의 콘텐츠 퍼블리싱 및 운영: edwith/boostcourse 플랫폼에서 조경현 교수의 NLP 강의와 Andrew Ng 딥러닝 시리즈 1~4 등 총 5개 AI 강의 콘텐츠 운영에 참여했으며, 누적 수강생 약 3만명 규모의 학습 콘텐츠를 관리하며 복잡한 AI 개념을 학습자가 따라올 수 있는 구조로 재구성

  • 프로젝트형 딥러닝 학습 콘텐츠 기획: Deep Learning for Everyone Season 2 과정의 기획 및 운영을 지원하고, '파이토치로 시작하는 딥러닝 기초'와 '텐서플로우로 시작하는 딥러닝 기초' 강좌 운영에 참여했으며, 총 2만 5천명 규모의 실습 중심 딥러닝 교육 경험

  • 실습 코드 리뷰 자동화 설계: Introduction to Deep Learning with TensorFlow and PyTorch 과정에서 학습 환경 기획, 코드 리뷰 자동화를 담당했으며, 관련 공개 GitHub 저장소는 PyTorch, TensorFlow 합쳐서 총 1,639 stars를 기록했습니다(2026.03 기준).

프로젝트

프로젝트명
Strategy Map as Inference-Time Process Guidance for Agentic AI
소속/기관명
서울대학교
프로젝트 기간
2025.06. - 2026.06.
(1년 1개월)
프로젝트 설명

AI Agent가 장기 업무를 수행할 때 현재 실행 상태와 선행 조건을 관리할 수 있도록, 절차적 지식을 그래프 형태로 제공하는 Agent workflow 및 context engineering 연구


문제 정의
  • AI Agent가 관련 정보를 찾더라도 선행 조건을 확인하지 않고 상태 변경 도구를 호출하는 문제를 발견

  • 이를 단순한 모델 성능 문제가 아니라, “현재 업무가 어디까지 진행되었는지”를 관리하지 못하는 실행 상태 관리 문제로 정의

  • 장기 업무에서 완료된 단계, 현재 가능한 단계, 아직 차단된 단계를 구분하는 Working Map 구조 설계

Strategy Map 및 Agent Workflow 설계
  • 업무 절차를 milestone과 prerequisite edge로 표현하는 Strategy Map 설계

  • 각 milestone이 요구된 입력, 출력, 실행 조건을 만족할 때만 갱신되도록 상태 업데이트 구조 설계

  • 전체 Map을 한 번에 제공하지 않고, zoom-out / zoom-in view를 통해 필요한 수준의 절차 정보만 Agent에게 제공

Trace2Map 및 Context Engineering
  • 성공적인 reasoning trace에서 절차적 지식을 추출해 Strategy Map으로 변환하는 Trace2Map 연구

  • Agent 실행 중 현재 상태와 admissible milestone을 context로 제공하여 다음 행동 선택을 보조

  • Python, LangChain, OpenAI SDK, HuggingFace, MCP Server 기반으로 실험 파이프라인 구현

실험 설계 및 결과
  • S&OP 시나리오에서 7개 Task, 59개 tool, 5개 MCP Server 기반 벤치마크 구성

  • Strategy Map 적용 후 ReAct 정확도 42.6% → 65.5%, TRA 정확도 28.3% → 66.9%로 개선

  • EnterpriseOps-Gym에서 GPT-5.4-mini 기준 실행 성공률 14.1% → 27.8%, partial score 0.39 → 0.604로 개선

기술 스택
  • Agent / LLM: Python, LangChain, OpenAI SDK, Hugging Face, Qwen

  • Tool-use / Runtime: MCP Server, FastAPI, uvicorn

  • Database: PostgreSQL

  • Frontend / Demo: React, Vite, TypeScript (AI 이용하여 구현)

  • Research Engineering: Prompt Engineering, Context Engineering, Agent Workflow Design, Benchmark Evaluation

프로젝트명
Retrieval-Augmented NL2SQL Generation with Data-Centric Query Capsules for Enterprise Applications
소속/기관명
서울대학교
프로젝트 기간
2024.06. - 2025.12.
(1년 7개월)
프로젝트 설명

사용자의 SQL 실행 로그에서 재사용 가능한 비즈니스 로직과 SQL 구조를 추출해 NL2SQL 성능을 개선하는 데이터 중심 RAG 연구


Query Capsule 설계
  • 자연어를 SQL로 변환할 때 LLM이 비즈니스 로직과 스키마 사용 방식을 충분히 이해하지 못하는 문제를 발견

  • 검증된 SQL workload에서 Query Context와 SQL Template을 추출해, LLM이 재사용할 수 있는 Query Capsule 단위로 구조화

  • Query Context는 SQL이 담고 있는 비즈니스 의미를, SQL Template은 값이 제거된 재사용 가능한 SQL 구조를 표현하도록 설계

유용성 평가 Metric 설계
  • 단순히 Query Capsule을 많이 넣는 것이 아니라, 실제로 SQL 생성에 도움이 되는 지식을 선별하기 위해 Merit metric 설계

  • SQL의 구조적 유사도와 의미적 유사도를 함께 평가해 "유용한" Query Capsule을 QC Pool에 적재

  • 실행 정확도뿐 아니라 SQL 구조와 의미가 어떻게 개선되는지 정량적으로 분석

SQL 추론 과정
  • 사용자의 자연어 질문과 유사한 Query Capsule을 embedding 기반으로 검색

  • 검색된 Query Capsule을 schema 정보와 함께 LLM context로 제공하여 SQL 생성을 보조

  • Direct 방식과 Pipeline 방식의 SQL 생성 프로세스를 나누어 실험

    • Pipeline: 먼저 사용자 질문에서 키워드 추출 후, DB 에서 value 검색

실험 및 성과
  • Spider, BIRD benchmark 기반으로 Intra-domain 기준 학습 60%, 개발 20%, 테스트 20% 분할 후 실험 수행

  • Query Capsule 적용 시 BIRD 및 Spider benchmark에서 실행 정확도 평균 5.68%, 3.34% 개선, Merit 기준으로도 각각 6.54%, 5.24% 상대적 개선

기술 스택
  • Python, LangChain, OpenAI SDK, FAISS, HuggingFace,

    SQLite, DuckDB

  • NL2SQL, Embedding Retrieval, RAG Pipeline Design, Context Engineering, Query Evaluation

프로젝트명
AU-RAG: Agent-based Universal Retrieval Augmented Generation
소속/기관명
서울대학교
프로젝트 기간
2024.06. - 2024.12.
(7개월)
프로젝트 설명

문서, 테이블, API 등 다양한 데이터 source에서 필요한 근거를 찾고 답변을 생성하기 위한 Agentic RAG workflow 연구


데이터 접근 Workflow 설계
  • 기업 데이터가 문서, 테이블, API 등 여러 source에 분산되어 있어, 단순 text chunk 검색만으로는 의사결정에 필요한 근거를 충분히 제공하기 어렵다고 판단

  • 사용자 질문에 대해 어떤 source를 탐색할지, 어떤 방식으로 근거를 추출할지, 추출한 정보를 어떻게 답변 생성에 연결할지 Agent workflow로 설계

  • 검색, 계획, 도구 호출, 답변 생성을 하나의 RAG pipeline으로 연결

Agentic RAG 구조 구현
  • LangChain 기반으로 source selection, evidence retrieval, answer generation 흐름을 구성

  • 단순 문서 검색 중심 RAG를 넘어, 다양한 데이터 source를 Agent가 선택하고 활용하는 구조로 확장

  • LLM이 답변 생성 전에 필요한 근거를 수집하고, 이를 context로 활용하도록 설계

실험 및 성과
  • TAT-QA 기반 multi-source QA 실험을 설계하고, 30/90/270개 Source Object 및 Extraction Guide 환경에서 AU-RAG와 RAG+Reranker를 비교 평가

  • Source Object 수가 30개일 때 AU-RAG는 Retrieval Precision 53.41%로 RAG+Reranker 대비 +9.52%p, 90개 환경에서는 41.54%로 +10.45%p, 270개 환경에서는 30.28%로 +6.04%p 높은 precision을 기록

  • Source Object가 증가할수록 RAG+Reranker는 recall이 높았지만, AU-RAG는 false positive를 줄이며 더 정밀하게 source를 선택하는 특성을 보임

  • Extraction Guide 수를 30 → 90 → 270개로 늘리자 AU-RAG Retrieval F1이 31.51% → 31.83% → 33.06%로 개선됨

기술 스택
  • Python, LangChain, OpenAI SDK

  • RAG, Agent Workflow Design, Prompt Engineering, Context Engineering

포트폴리오

타입
URL
타입
첨부파일

교육

소속/기관
서울대학교
종류 | 전공명/전공계열
대학원(박사) | 데이터사이언스학
재학 기간 (재학 상태)
2022.03. - 2026.08. (졸업)
소속/기관
서울대학교
종류 | 전공명/전공계열
대학원(석사) | 데이터사이언스학
재학 기간 (재학 상태)
2020.03. - 2022.02. (졸업)
소속/기관
한양대학교
종류 | 전공명/전공계열
대학교(학사) | 경제금융학
재학 기간 (재학 상태)
2010.03. - 2018.08. (졸업)
소속/기관
중국 청도 2중
종류 | 전공명/전공계열
고등학교 | 인문계열
재학 기간 (재학 상태)
2006.09. - 2009.08. (졸업)

대외활동

활동명
A Guide to Building LLM-Based Applications: Prompt Engineering and RAG
소속/기관
서울대학교
활동 연도
2024
활동 상세 설명
  • 2024. 7. 18. - @ 24년 호남권 KOLAS 시험기관(SW분야) 기술 워크숍, “LLM 기반 어플리케이션 구축을 위한 가이드” 발표

  • 2024. 8. 9. - @ 전주정보문화산업진흥원 “LLM 기반 어플리케이션 구축을 위한 가이드” 강의,
    교육내용:

    • 자연어 처리 및 거대 언어 모델(LLM)의 발전 역사

    • 프롬프트 엔지니어링

    • 프롬프트 엔지니어링 실습

    • Retrieval-Augmented Generation

    • RAG 구축하기 실습

활동명
Introduction to DeepLearning with PyTorch
소속/기관
서울대학교
활동 연도
2022
활동 상세 설명
  • 2022.07. - @ 서울시립대, "파이토치로 시작하는 딥러닝" 강의

  • 2021.07. - @ 한경대학교, "파이썬과 파이토치로 시작하는 딥러닝" 강의

활동명
제11회 산업통상자원부 공공데이터 활용 BI 공모전
소속/기관
서울대학교
활동 연도
2023
활동 상세 설명
모두를 위한 자연어 기반 공공데이터 분석 솔루션, EIS
  • 인원: 2명

  • 역살: LLM을 이용하여 NL2SQL 파이프라인 개발

  • 성과: 제품 및 서비스개발 우수상

  • 개요: Large language model(LLM)의 코드 생성 기능을 활용하여, 자연어만으로도 데이터 베이스에 접근, 코드를 다룰 수 있도록 하는 것이 핵심적인 서비스

  • 활용데이터: 산업통상자원부 세계 섬유 수출 현황(WTO 기준), 산업통상자원부 외국인직접투자동향 국가별 산업별 대한 외국인직접투자 통계 등

외국어

언어명
영어
수준
비즈니스 회화 가능
언어명
중국어
수준
일상 회화 가능