듣는 것에서 '보는 것'으로…AI 서비스의 진화
듣는 것에서 '보는 것'으로…AI 서비스의 진화
이 기사를 공유합니다

▲ 주요 시각 인공지능 기기·서비스 (표=정보통신기술진흥센터)

지난해 구글렌즈·아마존 에코룩· MS 씨잉·빅스비 비전 등 출시

[서울파이낸스 이호정 기자] 지난해 IT업계에 큰 화두 중 하나는 인공지능(AI) 스피커였다. 인간의 음성을 듣고 이해하며, 다시 음성으로 대답하는 이른바 '듣는 인공지능' 기술이 인기를 끌었다.

이에 업계에서는 앞으로 이러한 듣는 인공지능에서 한 발짝 더 나아가 카메라에 촬영되는 대상을 이해하는 '보는 인공지능'으로 한 단계 더 진화할 것으로 전망하고 있다.

16일 정보통신기술진흥센터에 따르면 보는(시각) 인공지능은 이미 머신비전/컴퓨터비전이라는 기술로 산업 현장에서 제한적으로 사용되고 있다. 또 최근에는 업체들이 속속 시각 인공지능 서비스를 출시하며 이용 분야를 넓혀가고 있다.

먼저 지난해 구글 개발자 회의에서 발표된 '구글렌즈'는 구글이 머신러닝과 컴퓨터 신경망을 이용해 개발한 앱이다. 구글렌즈는 스마트폰 카메라로 비춘 피사체를 자동 인식, 정보를 노출하고 작업을 수행한다. 꽃을 향하면 꽃의 종류를, 음식점 간판을 향하면 음식점 메뉴와 가격 등을 알려준다. 영화나 책, 예술 작품도 인식하며 QR·바코드 및 명함 스캔도 가능하다.

아마존 에코룩은 카메라를 탑재한 AI 스피커다. 음성 명령으로 전신을 촬영해 현재 입은 옷이 얼마나 잘 어울리는지 스타일 수치를 제시하며, 날씨에 따라 어떤 옷을 입어야 할지 조언하거나 아마존에서 판매하는 옷 중 어울리는 상품도 추천한다.

마이크로소프트(MS)의 '씨잉(Seeing AI)' 앱은 인공지능 기술을 이용해 시각장애인에게 주변 환경, 인물, 사물, 텍스트, 이미지 등을 설명해준다. 사람의 경우 스마트폰 카메라로 비추면 성별, 나이, 행동, 감정 등을 분면 묘사해주며, 메뉴나 표지판은 물론 필기체도 읽어준다.

국내에서는 삼성전자의 '빅스비 비전'이 있다. 빅스비 비전은 '갤럭시S8' 스마트폰 출시와 함께 발표된 AI 비서 '빅스비'에 포함된 기능으로, 문자/제품/랜드마크 등을 인식하고 검색/번역이 가능하다.

업계 관계자는 "앞으로 듣는 인공지능에서 보는 인공지능까지 사용자의 환경이 지금보다 훨씬 더 편리해질 것으로 보인다"며 "특히 시각 인공지능의 경우 앞으로는 활용 범위가 좁더라도 활용 가치가 높은 전문화된 인공지능 서비스로의 출시가 기대된다"고 말했다. 


이 시간 주요 뉴스
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.