2026/06/23/futo-releases-a-1m-swipe-english-typing-dataset
FUTO, MIT 라이선스 100만 건 QWERTY 영어 스와이프 데이터셋 공개…새 swipe typing 모델 학습·평가 기반 마련
편집자 요약
FUTO는 2024년 8월 swipe.futo.org에서 QWERTY 영어 스와이프 입력 데이터를 자발적으로 수집해 100만 건 이상의 샘플을 확보했습니다. 저품질 데이터를 걸러낸 뒤 2025년 3월 100만 건 규모 데이터셋을 MIT 라이선스로 HuggingFace에 공개했으며, 이를 새 swipe typing 모델 학습과 평가에 활용했습니다.
인사이트
모바일 키보드 입력 데이터는 대형 플랫폼 내부에 갇혀 있는 경우가 많아, 공개 데이터셋은 연구 재현성과 벤치마킹 측면에서 의미가 큽니다. FUTO의 접근은 오픈 데이터셋을 기반으로 온디바이스 입력 모델과 대안 키보드 생태계를 확장하려는 흐름을 보여줍니다.
댓글
토론
> geekhaus:~$ 다음 읽을거리?
