2024년 시맨틱 기술은 다양한 기술 개선을 기반으로 변화할 것이다. 챗GPT의 도입은 시맨틱 기술과 이를 사용하는 산업에 여러 가지 효과를 가져왔다. 챗GPT는 AI의 언어 사용과 이해를 크게 향상시킨다.

시맨틱 기술은 ‘형식적 의미론’을 사용해 여러 유형의 데이터에 의미를 제공한다. 시맨틱은 언어와 그 기본 구조에 대한 공식적인 연구다. 단어와 구, 그리고 의사소통 중 서로 간의 관계를 다룬다. 의미와 맥락은 사용되는 여러 유형의 데이터에 적용된다.

시맨틱 웹과 자연어 처리는 모두 시맨틱 기술의 형태이지만 데이터 관리 프로세스에서 각각 서로 다른 지원 역할을 한다.

자연어 처리(NLP)는 인공지능의 한 분야로, 머신러닝을 사용해 인간의 언어(텍스트, 음성)와 데이터를 이해하고 처리한다. 자연어 처리 애플리케이션을 사용하면 데이터를 분석하고 뉴스, 사람, 장소, 이벤트에 대한 정보를 추출할 수 있다. NLP는 현재 외국어 번역 앱, 음성 인식 디지털 도우미, 스팸 검색 이메일 프로그램 등 다양한 일상 서비스와 제품에 사용되고 있다.

시맨틱 웹(semantic web)은 월드와이드 웹 컨소시엄(World Wide Web Consortium)에서 개발한 표준을 이용해 월드와이드웹에 적용되는 프레임워크다. 이 시맨틱 웹 프레임워크는 컴퓨터가 인터넷 데이터를 읽을 수 있도록 만든 것이다. 시맨틱 웹은 메타데이터에 크게 의존한다.

시맨틱 기술은 기업들이 더 스마트한 데이터를 찾아내고, 대량의 원시 데이터에서 정보를 추출하고, 관계를 발견하는 데 도움을 줄 수 있다. 시맨틱 그래프 데이터베이스를 사용하면 컴퓨터가 데이터를 더 쉽고 효율적으로 통합∙처리∙검색할 수 있다.

챗GPT와 시맨틱 테크놀로지

챗GPT는 꽤 유명해졌다. 이는 챗봇을 기반으로 하며 2022년 오픈AI가 만든 대규모 언어 모델을 사용한다. 신경망을 사용해 다양한 음성 언어, 수학 방정식, 프로그래밍 언어를 포함해 인식 가능한 모든 문자 시퀀스에 대한 응답을 처리하고 생성한다.

이 새로운 형태의 챗봇은 영어로 의사소통이 가능하며, 새로운 소프트웨어 개발이나 연설문 작성과 같은 광범위한 작업에 사용되는 것으로 나타났다. 챗GPT는 조사를 수행한 다음 우수한 영어, 일본어, 독일어로 보고서를 작성할 수 있다. 새롭고 더 똑똑해진 챗봇은 음악, 시각 예술, 비디오, 기능적인 컴퓨터 코드를 만드는 데에도 사용될 수 있다.

챗GPT는 사용자의 메시지를 이해하려고 시도한 다음 최선이라고 생각되는 응답을 제공한다.

대형 언어 모델

LLM(대형 언어 모델)은 신경망 역할을 하며 여러 자연어 처리 작업을 수행할 수 있는 딥 러닝 알고리듬이다. 트랜스포머 모델을 기반으로 하며 거대한 데이터 세트로 훈련된다. 이러한 알고리듬, 즉 신경망은 인간 두뇌의 뉴런과 유사한 노드 네트워크를 사용한다.

널리 사용되는 대형 언어 모델의 예로는 바드, 코히어, PaLM, GPT-4가 있다. 이들은 창의적인 콘텐츠 개발, 코드 생성, 언어 번역과 같은 작업에 매우 유용하다. 최신 LLM은 매우 유연하며 질문에 답변하는 것부터 언어 번역까지 다양한 작업을 수행할 수 있다. LLM을 사용하는 챗GPT는 인간 작가를 대체하고 사람들이 가상 비서와 검색 엔진을 사용하는 방식을 바꿀 가능성이 있다.

한편 대형 언어 모델이 터무니없거나 오해의 소지가 있는 콘텐츠를 제공할 수 있다는 우려도 있다.

지식 그래프

지식 그래프는 기계가 읽을 수 있는 형식을 사용해여 구조화된 정보를 구성하고 표시하는 데 유용한 도구가 됐다. 시맨틱 네트워크라고도 하는 지식 그래프는 실제 개체(객체, 개념, 이벤트, 상황)를 표현하고 이들 간의 관계를 보여주는 데 사용된다. 이 데이터는 일반적으로 그래프 데이터베이스 내에 저장되며 그래프 구조로 표시된다.

대형 언어 모델과 지식 그래프의 결합으로 인공지능 시스템의 능력과 이해도가 크게 향상됐다. 지식 그래프는 엔터티, 해당 관계 및 속성을 식별하고 연결하는 데 필요한 구조화된 프레임워크를 제공한다. 대형 언어 모델과 지식 그래프가 지원하는 구조화된 프레젠테이션의 조합은 상황 인식 AI 시스템을 구축하는 데 사용됐다.

지식 그래프는 구조화된 정보를 구성하고 제시해 효율적인 데이터 검색과 관계 추론을 촉진한다.

웹 3.0

시맨틱 기술이 결합된 시맨틱 웹은 웹 3.0 개발의 핵심 개념이다. 시맨틱 웹은 인터넷이 구조화되고 레이블이 지정돼 컴퓨터가 더 쉽게 이해하고 검색할 수 있어야 한다는 개념을 기반으로 구축됐다.

예를 들어, 구글에서 ‘소설’이라는 단어를 검색하면 오디오, 전자책 공급 업체, 도서 유형 또는 ‘신작’ 개념에 대한 검색 결과가 표시된다. 그러나 웹 3.0(웹3이라고도 함)에서는 검색 엔진이 이전에 얻은 정보를 사용해 쿼리의 의미와 맥락을 평가한다. 검색 엔진은 어떤 ‘사과’를 찾고 있는지 결정하고 더 정제된 결과를 제공한다.

또한 웹 3.0은 분산화와 블록체인을 지원하는 개념과 기술을 사용한다.

가상 비서

오픈AI 챗GPT는 적절한 수정을 통해 가상 비서로 변환될 수 있다. 뉴욕타임즈에 글을 쓰고 있는 브라이언 X. 첸(Brian X, Chen)은 챗GPT를 구글의 바드와 비교한 결과 챗GPT가 분명히 더 낫다는 것을 알았다. 아론 하이니클(Aaron Heienickle)은 ‘챗GPT를 개인 비서로 전환하는 방법’ 기사에서 적절하게 수정하는 방법을 설명한다.

구글의 바드(Bard), 아마존의 알렉사(Alexa), 애플의 시리(Siri) 등 기존 가상 비서들은 10년 넘게 개선이 필요했지만 결국 정체됐고, 현재는 음악 재생, 타이머 역할로만 사용되고 있다.

챗GPT 가상 비서는 소셜 미디어 보고서 작성, 마케팅 분석, 모범 사례 제안 등 다양한 작업을 수행할 수 있다. 가상 비서 기능은 적절한 도구와 통합되면 생산성 향상에 유용하다.

향상된 고객 서비스 기대

새로운 고객 서비스 챗봇은 대규모 언어 라이브러리를 사용하며 훨씬 더 광범위한 질문에 답할 수 있다. 그러나 이전에 경험하지 못한 질문에 대해서도 답변을 조사할 수 있어야 하지만 현재 조사된 답변은 못 미더울 수 있다.

GPT 버전의 챗봇은 인간의 대화를 훨씬 더 잘 모방하고 인간과 유사한 질문과 답변으로 응답할 수 있다. 그들은 더 복잡한 양방향 대화에 참여할 수 있고, 덜 발달된 챗봇에 대해 고객이 느끼는 좌절감을 줄일 수 있다.

생성AI의 사용과 개발 증가

생성AI가 대규모 라이브러리 모델과 결합돼 챗GPT를 형성한 결과, 생성AI가 더 자주 사용되고 더 많은 관심을 받고 더 많은 실험을 하고 있다. 생성AI가 점점 더 많이 사용되고 계속 진화할 것이라는 것은 비교적 안전한 예측이다.

가트너는 생성AI가 범용 기술이 되어 인터넷, 전기, 증기 기관이 그랬던 것처럼 인간의 삶을 향상시킬 것이라고 예측하고 있다. 사람과 조직이 새롭고 더욱 혁신적인 애플리케이션을 발견함에 따라 생성AI의 영향력은 계속 증가할 것이다.

 

(*이 칼럼은 GTT KOREA의 편집 방향과 다를 수 있습니다.)

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지