본문 바로가기

전체 글

(31)
2024-11-08 수료식 드디어 약 7개월 동안의 교육이 끝나고 오늘 수료식을 했다. 시간이 참 빨리 간다. 나이 먹을수록 시간 가는 속도가 더 빨라지는 것 같다.올해 2월에 권고사직으로 10년 넘게 재직했던 회사에서 나와서 참 막막했었다.내가 사용했던 기술은 이제 게임잡이나 사람인에서 검색해도 1건도 안나온다..세상 변하는 속도도 엄청 빨라졌다. 이러던 와중에 문득 든 생각, 이왕 이렇게 된 거 평소에 궁굼했던 AI에 대해 공부를 해보면 어떨까?바로 HRD-Net에서 국비지원 교육을 찾아봤다. 그중에서 가장 내실이 탄탄해 보이는 과정이 바로 AI Lab 이었다. 입과를 하고, 열정적인 여러 강사님들의 수업을 들어보니 잘 선택했다는 생각이 들었다.처음 과정을 시작했을 때, AI가 도대체 뭘까? 허상이 아니라 진짜 있는 걸까? 이..
[책 스터디] LLM을 활용한 실전 AI 애플리케이션 개발 커리어 서비스 기간동안 팀원 두분과 함께 LLM을 활용한 실전 AI 애플리케이션 개발이라는 책을 스터디하기로 했다. https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=343185652 LLM을 활용한 실전 AI 애플리케이션 개발LLM의 기본 아키텍처에서 출발해 애플리케이션의 요구사항에 맞춰 LLM을 길들이고 제한된 컴퓨팅 환경에서 동작하게 경량화해서 원활하게 서빙하게끔 기초를 다진 다음에 RAG라는 LLM의 대표적인www.aladin.co.kr 총 3명이서 진행했고, Zoom 에서 만나서 각자 읽고 싶은 부분을 정하고 15~25분 동안 읽은 후, 각자 읽은 파트를 설명하는 방식으로 진행했다. 아래 내용은 스터디를 진행하면서 내가 작성한 내용이다.  읽고 싶은 부분..
대회용 Upstage Linux 서버에 ColBERTv2 (colbert-ai) 설치하기 IR(Information Retrieval) 대회에 참여 중인데, 수업 시간에 배웠던 ColBERT 를 대회용 Upstage linux 서버에 설치하고 싶었다. 삽질을 참 많이 했는데, 깔끔한 방법은 아니지만, 어찌 됐든 GPU 를 사용하여 인덱싱과 검색이 잘 되는 것을 확인했다. 홈 디렉터리는 /data/ephemeral/home 로 가정하고,git CLI 가 설치 되어 있다고 가정한다. ColBERT 공식 깃허브를 웹브라우저로 연다.https://github.com/stanford-futuredata/ColBERT GitHub - stanford-futuredata/ColBERT: ColBERT: state-of-the-art neural search (SIGIR'20, TACL'21, NeurIP..
Data Centric AI
[2024-08-29~2024-09-10] 일상 대화 요약 대회 이 글의 내용은 내가 시도 했던 것들만 작성했기 때문에, 우리 팀의 최종 결과와는 차이가 있다. 대회 개요 대회 결과우리 팀은 이번에도 12팀 중에서 1등을 하였다. (Public 1등, Private 1등) 나의 최고 점수는 Public 44.5466, Private 42.8397 로, 리더보드에 적용해보면 3등이다.  BaselineBaseline 코드에서 사용하는 모델은 digit82/kobart-summarization 이다. 학습 속도, 추론 속도가 빨라 일단 Baseline 에서 실험을 해보기로 했다. 아무것도 수정 안한 상태에서 서브미션 해보니 다음과 같은 점수가 나왔다.aihub.or.kr 한국어 대화 요약 데이터셋 사용https://aihub.or.kr/aihubdata/data/view..
Computer Vision Generation
Computer Vision Advanced
Computer Vision Basic