Technology
온디바이스 실행을 목표로 설계된 경량 다국어 LLM과 그 위에서 동작하는 로컬 런타임/엔진을 연구합니다.
Fillin LLM
- 전면 오프라인
- 모바일 추론 최적화
- Hybrid quantization
- Multi-language capability
- Reproducible inference
Fillin Kernel
- Latency 지향 구조
- 메모리 최적 배치
- CPU-only / GPU-optional
- AES-secured model bundle
Fillin Engine
- Fully offline translation
- 단일 번들(O1D) 구조
- Device-grade memory footprint
- OTA/rollback 안전성 포함