Fillin Labs필인랩스

Technology

온디바이스 실행을 목표로 설계된 경량 다국어 LLM과 그 위에서 동작하는 로컬 런타임/엔진을 연구합니다.

Fillin LLM

  • 전면 오프라인
  • 모바일 추론 최적화
  • Hybrid quantization
  • Multi-language capability
  • Reproducible inference

Fillin Kernel

  • Latency 지향 구조
  • 메모리 최적 배치
  • CPU-only / GPU-optional
  • AES-secured model bundle

Fillin Engine

  • Fully offline translation
  • 단일 번들(O1D) 구조
  • Device-grade memory footprint
  • OTA/rollback 안전성 포함