2026/06/12/pixelrag-beats-text-parsers-on-accuracy-and-cuts

PixelRAG, 웹페이지를 텍스트 대신 스크린샷으로 색인해 RAG 정확도 높이고 AI agent 토큰 비용 10분의 1로 절감

2026년 6월 12일 PM 03:39·VentureBeat

편집자 요약

UC Berkeley, Princeton University, EPFL, Databricks 연구진은 웹페이지를 텍스트로 파싱하지 않고 스크린샷 타일로 색인하는 PixelRAG를 공개했습니다. Wikipedia 전체에 해당하는 3,000만 개 스크린샷 타일 실험에서 6개 벤치마크 기준 텍스트 기반 RAG보다 정확도가 최대 18.1% 높았습니다.

인사이트

본 기사는 enterprise RAG의 병목이 LLM 자체보다 HTML parsing과 전처리 단계에 있을 수 있음을 보여줍니다. VLM이 성숙하면서 레이아웃, 표, 강조, 이미지 같은 시각적 검색 신호를 직접 활용하는 방식이 복잡한 사이트별 파서 개발을 대체할 가능성이 커지고 있습니다.