아이뉴스24 뉴스
아이뉴스24 홈 오피니언 프리미엄 엠톡 콘퍼런스
연예.스포츠 포토.영상 게임 아이뉴스TV 스페셜
뉴스 홈 IT정책 컴퓨팅 통신미디어 과학 글로벌 디지털기기 기업 자동차 증권·금융 유통 경제 게임 정치 사회 문화 생활
Home > 뉴스 > 컴퓨팅
LG CNS, AI 학습용 한국어 표준데이터 10만개 무료 개방
코쿼드 2.0 출시, 장문의 답변 가능한 AI 개발 지원
2019년 09월 05일 오전 09:13
  • 페이스북
  • 0
  • 트위터
  • 0
  • 구글플러스
  • 0
  • 핀터케스트
  • 0
  • 글자크게보기
  • 글자작게보기
  • 메일보내기
  • 프린터하기
[아이뉴스24 김국배 기자] LG CNS가 인공지능(AI)의 자연어 이해를 위한 한국어 표준 데이터 10만여 개를 제작해 무료 개방한다.

LG CNS는 5일 서울 강서구 마곡 LG사이언스파크에서 300여 명의 AI 전문가들을 초청한 가운데 AI 커뮤니티 행사 'AI 테크톡 포 NLU'를 열고 한국어 표준 데이터 '코쿼드 2.0'를 출시했다.

앞서 LG CNS는 지난해 12월 위키백과 정보를 기반으로 AI 학습용 한국어 표준 데이터 7만 개가 탑재된 '코쿼드 1.0'를 공개한 바 있다.

이주열 LG CNS AI·빅데이터 연구소장이 5일 열린 AI 커뮤니티 행사에서 '코쿼드 2.0'을 소개하고 있다. [사진=LG CNS]


그간 해외는 미국 스탠포드대학, 마이크로소프트 등이 제작한 영문 표준 데이터가 존재하나 국내는 표준 데이터가 없어 영문을 번역하거나 자체적으로 데이터를 마련해야 했다는 게 회사 측 설명이다.

LG CNS는 표준 데이터를 제작해 자사 AI 개발에 활용할 뿐 아니라 외부에 개방, 국내 AI 기술 발전에 기여한다는 계획이다.

코쿼드 2.0은 한국어 표준 데이터가 기존 7만 개에서 10만개로 확대된 것이 특징이다. 단답형을 넘어 장문의 답변이 가능한 AI를 개발할 수 있도록 데이터를 강화했다.

가령 '대한민국의 수도와 그 면적은?'이라는 질문에 '서울 특별시, 605.25km2입니다'라고 답하는 AI는 코워드 1.0을 학습하는 것만으로 개발할 수 있지만, '서울특별시의 특징은?'이라는 질문에 '도시 중앙으로 한강이 흐르고 북한산, 관악상, 도봉산 등의 여러 산들로 둘러싸인…'이라는 장문의 답을 위해서는 코쿼드 2.0으로 AI를 학습시켜야 한다.

또한 코쿼드 2.0은 AI가 표나 리스트 형태에 담긴 정보를 읽어 답변할 수 있게끔 표준 데이터 범위도 확대했다. 이번에 출시한 한국어 표준 데이터는 코쿼드 2.0 웹사이트에서 누구나 다운로드할 수 있다.

현신균 LG CNS 최고기술책임자(CTO)는 "응용분야가 무궁무진한 AI 언어 개발 분야에서 내부적으로 쌓은 데이터를 AI 업계 전체에 개방해 국내 AI 연구자들 간 상생을 위한 AI 개방형 생태계 조성에 기여코자 한다"고 설명했다.

/김국배 기자 vermeer@inews24.com

포토뉴스

 
가장 많이 본 뉴스
IT 시사 문화 연예 스포츠 게임 칼럼
    • 아이뉴스24의 뉴스를 이메일로 받아보세요.

    브랜드웹툰홈바로가기
    카드뉴스 더보기 >

    SPONSORED

    칼럼/연재
    프리미엄/정보

     

    아이뉴스24 TV