생성AI 활용이 확산되면서 최신 대규모 언어모델(LLM)을 다양한 디바이스에 적용하려는 수요가 높아지고 있다. 그러나 고성능 하드웨어 교체 비용은 기업의 부담 요인으로 작용해, 기존 장비에서도 효율적으로 LLM을 구동할 수 있는 최적화 기술이 주목받고 있다.
AI 최적화 및 경량화 기술 기업 노타(대표 채명수)가 낮은 사양의 디바이스에서도 LLM을 구현할 수 있는 LLM 최적화 서비스를 오픈했다고 25일 밝혔다.
이번에 선보인 LLM 최적화 서비스는 디바이스 사양에 관계없이 LLM과 비전-언어모델(VLM)을 최적화해 모델의 성능은 유지하면서 빠른 추론 속도를 보장한다.
생성AI가 하드웨어에 빠르게 적용되는 시장 환경에 맞춰 클라우드 또는 온디바이스 환경에 관계없이 최적화 개발을 할 수 있어 가전제품, 모빌리티 등 하드웨어 교체 비용이 부담되는 기업에서 최신 성능의 LLM 서비스 적용이 가능하다.

LLM 최적화 서비스는 ▲다양한 칩셋에서 호환가능 ▲복잡한 파라미터를 가진 LLM의 높은 최적화 난이도 극복 ▲LLM 경량화로 메모리/연산 효율 향상 ▲LLM 사용에 따른 디바이스 전력 비용 절약 ▲LLM 사용에 따른 클라우드 운영비용 절감 등의 효과를 제공하며, 이를 통해 제품에서 빠른 추론 속도와 높은 LLM 성능을 구현할 수 있다.
더불어 기존 사양의 하드웨어를 그대로 사용하기 때문에 별도의 인프라 투자 없이 새로운 LLM 모델을 적용할 수 있다는 점에서 비용 효율성이 높고 기술 경쟁력 확보에도 유리하다.
노타는 LLM 최적화 서비스 오픈을 기념해 홈페이지를 통해 무료 컨설팅 이벤트를 진행 중이다. LLM 최적화 서비스 홈페이지에 접속 후 문의하기를 통해 신청 가능하다.
노타 채명수 대표는 “별도의 하드웨어 교체 없이 최신 언어모델을 안정적으로 적용해 비용 부담을 줄이고, 한층 향상된 사용자 경험을 제공할 수 있다는 점에서 차별화된 의미가 있다.”라고 말했다.
관련기사
- 노타, 비전언어모델 기반 영상 관제 솔루션 ‘NVA’ 공개
- 노타, 생성AI 기반 ITS 기술로 글로벌 교통 혁신 시장 본격화
- 노타, VLM 기반 실시간 영상 관제 솔루션 ‘NVA’ 본격 상용화
- 노타, 코스닥 예비심사 통과...AI 최적화 상용화 성과 기반 상장 본격화
- 노타, 르네사스 MCU ‘RA8P1’에 AI 최적화 기술 탑재...50FPS 실시간 운전자 모니터링 구현
- 노타, AI 모델 최적화 플랫폼 ‘넷츠프레소’ 산업부 첨단기술제품 인증 획득
- LLM이 직접 컴퓨트 인프라 제어...파일·토큰 제약 없는 실시간 데이터 분석 시대
- 노타, ‘LLM·VLM 최적화 서비스’로 에지 AI 확산 가속
- 노타, KISA 지능형 CCTV 성능 인증 획득
- “스마트폰으로 폐렴 조기진단”...노타, AI 호흡음 분석 기술 실증 완료
- 노타, ‘2025 MAD 랜드스케에프’ 에지 AI 부문 선정
- 노타, ‘자율주행차 M.AX 얼라이언스’서 차량용 온디바이스 AI 고도화 지원
- 노타, UAE와 차세대 ITS 협력 확대...온디바이스 AI로 사고·위험 대응 강화
- 노타, 텔레칩스 ‘돌핀5’ NPU 최적화된 안면인식 AI 모델 적용...피지컬 AI 활용 확장
