Project/DL 프로젝트 8

RAG(Retrieval-Augmented Generation) 시스템을 고도화하기 위한 몇 가지 핵심 기술과 방법

검색 개선 기술하이브리드 검색: 벡터 기반 검색과 키워드 검색을 결합하여 정확도를 높입니다.의미론적 청킹: 문서를 의미 있는 섹션으로 나누어 컨텍스트를 보존하고 노이즈를 줄입니다.다중 쿼리 기법: 사용자 쿼리를 여러 방식으로 재구성하여 검색 안정성을 높입니다.그래프 기반 검색: 지식 그래프를 활용해 복잡한 관계를 파악하고 다중 홉 추론을 수행합니다.생성 개선 기술주의 기반 융합: 검색된 데이터의 관련성에 따라 동적으로 가중치를 부여합니다.다중 홉 추론: 복잡한 쿼리를 작은 하위 질문으로 분해하여 단계적으로 해결합니다.RAFT(Retrieval-Augmented Fine-Tuning): 파인튜닝과 RAG의 장점을 결합하여 더 정확한 응답을 생성합니다.데이터 품질 향상데이터 구조화: 잘 정리되고 명확하게 포..

[논문] LLM을 활용한 QA 생성

이 콘텐츠는 LLM을 활용한 질문 생성의 새로운 방법론인 PFQS(Planning First, Question Second)를 소개합니다. PFQS는 Llama 2 모델을 사용하여 답변 계획을 먼저 생성한 뒤, 이를 기반으로 질문을 생성하는 접근 방식을 제시합니다. 본 연구는 기존 방법들과 비교하여 정확성과 일관성을 높인 결과를 보이며, 교육 평가에서의 활용 가능성을 강조합니다. 이를 통해 질문의 내용과 난이도를 동시에 조절할 수 있는 제어 가능성을 제공합니다. 이 콘텐츠는 교육적 가치 창출에 기여하는 질문 생성 시스템의 발전을 다루고 있습니다.핵심 용어LLM: LLM는 'Large Language Model'의 약자로, 대규모 자연어 처리 모델을 의미합니다. 이는 많은 텍스트 데이터를 학습하여 사람처럼..

BoardgameQA: A Dataset for Natural LanguageReasoning with Contradictory Information

이 자료는 모순된 정보를 다루는 자연어 추론에 대한 데이터셋인 BoardgameQA를 소개합니다. 이 데이터셋은 자동화된 추론의 필요성을 강조하며, 기계 학습 모델이 모순된 정보 조합에서 어떻게 결론을 도출하는지를 측정할 수 있게 설계되었습니다. 또한, 정보 출처에 대한 우선순위를 설정하여 모순 해결 방법을 제공합니다. 이 연구는 현재의 언어 모델들이 실제 상황에서의 모순된 정보 처리를 잘 수행하지 못함을 보여줍니다. BoardgameQA는 모순된 입력을 기반으로 한 다단계 추론의 최초 데이터셋으로, 인공지능 시스템의 강건성을 발전시키기 위한 기초 자료가 될 수 있습니다.핵심 용어모순된 정보: 모순된 정보는 서로 상반되거나 충돌하는 정보를 의미합니다. 두 개의 사실이 있을 때 하나는 옳고 다른 하나는 그..

[DL 프로젝트]보드게임 AI 챗봇 데이터 수집 검증 체계 구축 방안

보드게임 챗봇에 맞는 데이터를 수집하기 위해 한 가지 게임을 선정해서 질문들을 다양한 유형으로 나누어서 만들어 볼거야. 메뉴얼을 바탕으로 한 게임 설명 질문은 자동 생성을 할 수 있게 틀을 짜고, 진행 중에 생기는 질문은 직접 만들기 보드게임 챗봇에 적합한 데이터를 수집하기 위해 한 가지 게임을 선정하고, 질문들을 다양한 유형으로 나누어 생성하는 과정은 매우 체계적이고 효율적인 접근법입니다. 이 과정에서 자동 생성과 직접 생성을 결합하여 데이터의 다양성과 질을 높일 수 있습니다. 아래는 이 과정을 평가하고, 부족한 점과 괜찮은 점, 그리고 나아갈 점에 대한 피드백입니다.1. 괜찮은 점체계적인 접근: 게임 매뉴얼을 바탕으로 자동 생성 틀을 만드는 것은 규칙 기반 질문을 체계적으로 다룰 수 있는 좋은 방법입..

다중 모달 이미지 변환 (Multimodal Image Transformation)

다중 모달 이미지 변환(Multimodal Image Transformation)은 서로 다른 데이터 형식(예: 텍스트, 이미지, 음성 등)을 결합하거나 변환하여 새로운 정보를 생성하거나 기존 데이터를 더 효과적으로 활용하는 기술입니다. 이 기술은 다양한 분야에서 활용되며, 특히 의료 영상, 자율주행, 콘텐츠 생성 등에서 주목받고 있습니다.다중 모달 이미지 변환의 주요 원리와 기술다중 모달 이미지 변환은 일반적으로 다음과 같은 과정을 포함합니다:모달리티 간 데이터 융합: 서로 다른 데이터 형식(예: RGB 이미지와 열화상 이미지)을 결합하여 더 풍부한 정보를 제공합니다. 예를 들어, 의료 영상에서는 CT와 MRI 이미지를 결합하여 진단 정확도를 높이는 데 사용됩니다.임베딩 공간 공유: 텍스트와 이미지처럼..

DL 주제별 참고 자료 정리

@가연2. 포스터 디자인 생성Stable Diffusion 3Stability AI Stability AIActivating humanity's potential through generative AI. Open models in every modality, for everyone, everywhere.stability.ai 3. 사용자 캐릭터 @@ 사용자가 업로드한 사진 10~20장을 바탕으로 AI가 다양한 스타일의 아바타 생성 Lensa LensaTransform your photos with easelensa.app사용자의 사진을 바탕으로 3D 캐릭터를 생성Integrate an avatar creator into your game in days - Ready Player Me Integrate a..

Deep Learning 주제 정하기

Step1) 관심 분야 파악하기아래 20가지 중에 관심있는 분야 생각해보기!Self Driving Cars 자율 주행차딥러닝은 자율주행차의 핵심 기술로, 신경망과 컴퓨터 비전을 활용해 객체 감지, 도로 주행, 교통 표지판 인식, 장애물 회피 등을 가능하게 합니다.Entertainment 엔터테인먼트넷플릭스, 스포티파이, 유튜브와 같은 플랫폼은 딥러닝 기반 추천 시스템을 활용해 사용자의 시청/청취 패턴을 분석하고 개인화된 콘텐츠를 제공합니다.Visual Recognition 시각적 인식합성곱 신경망(CNN)과 같은 딥러닝 모델은 이미지 및 비디오에서 객체를 식별하고 분류하는 데 뛰어나며, 이를 보안, 의료, 소매업 등 다양한 산업에 적용할 수 있습니다.Virtual Assistants 가상 비서 시리, 구..

DL 프로젝트 주제 추천

1. 내가 가진 재료로 만들 수 있는 요리는??- 목적 : 간단한 재료 입력으로 요리 레시피를 추천받자재료 목록을 입력받아 딥러닝 모델로 간단한 요리 종류(파스타, 샐러드, 볶음밥 등)를 추천.요리 레시피 데이터셋을 전처리해 "재료 -> 요리 분류" 문제로 변환- 활용 : 요리에 관심이 많거나 있는 재료로 요리를 하고 싶은 사람들을 위한 요리 사이트, 앱 제작 가능- 기술 : 텍스트 데이터를 처리하는 방법을 학습하며, 딥러닝의 분류 모델 응용 가능.NLP 기반 텍스트 처리(Bag of Words/TF-IDF)간단한 Dense Neural Network 또는 Pre-trained NLP 모델2. 내가 찍은 사진의 최적의 구도는?? - 목적 : 내가 찍은 사진의 구도(회전,트리밍,크롭 등)을 통해 최적의 구..