[논문 리뷰] Certifiably Robust RAG against Retrieval Corruption
이번 시간에는 Retrieval corruption attack을 방어하는 RobustRAG를 제안한 Certifiably Robust RAG against Retrieval Corruption 논문에 대해 알아봅니다. 최근 공격자가 RAG
[논문 리뷰] Poisoning Retrieval Corpora by Injecting Adversarial Passages
이번 시간에는 Dense Retrieval 시스템의 취약점을 이용한 corpus poisoning attack을 제안한 “Poisoning Retrieval Corpora by Injecting Adversarial Passages” 논문을 살펴봅니다.
[논문 리뷰] Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More?
이번 시간에는 Long-context language model(LCLMs)의 장점과 이를 평가할 수 있는 벤치마크인 LOFT를 제안한 Can Long-Context Language
[논문 리뷰] Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach
이번 시간에는 RAG와 Long-Context LLMs의 성능을 비교하고, 두 방법을 혼합한 Self-Route를 제안한 논문을 살펴봅니다. 최근에 출시된 Gemini 1.
[논문 리뷰] Gecko: Versatile Text Embeddings Distilled from Large Language Models
이번 시간에는 구글 딥마인드에서 발표한 Gecko 논문을 리뷰합니다.
Gecko는 LLMs로부터 지식 증류 (knowledge distillation)를 통해 학습한 text embedding 모델입니다.
[논문 리뷰] Rethinking the Role of Token Retrieval in Multi-Vector Retrieval
이번 시간에는 구글 딥마인드 팀에서 발표한 “Rethinking the Role of Token Retrieval in Multi-Vector Retrieval” 논문을 소개하고자 합니다. 최근
AI 모델에게 특정 기억을 잊게 할 수는 없을까? - Unlearning
모두의 연구소 PERSONA LAB에서 진행한 세미나의 내용들을 참고하여 정리하였습니다 😄
들어가며
이번에 NeurIPS’23에서 구글이 무려 $50,000 상당의 캐글 컴페티션을
[논문 리뷰] Generative Agents: Interactive Simulacra of Human Behavior
들어가며
이번 시간에는 Generative Agents: Interactive Simulacra of Human Behavior 논문에 대해 함께 알아보도록 하겠습니다. 논문 링크
본 논문은 인간의
[논문 리뷰] DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter
이번 시간엔 BERT의 지식 증류 버전인 DistilBERT를 살펴봅니다. 최근 모델 사이즈가 커짐에 따라 성능도 비약적으로 향상하였지만, 컴퓨팅 자원이 많이 들고,
[논문 리뷰] Fine-tune BERT for Extractive Summarization
이번 시간에는 추출 요약을 수행하는 BERTSUM 모델에 대해 알아보겠습니다. 기존 BERT 구조에서 큰 변화없이 단순한 응용으로 추출 요약이 가능한 것이