로봇도 善惡을 배운다…AI 학습시스템 개발
페이지 정보
작성자 실장 작성일16-02-18 15:41 조회8,014회 댓글0건본문
|
인간뿐 아니라 인공지능(AI) 역시 ‘독서’를 통해 선악을 학습할 수 있다는 흥미로운 연구결과가 제시됐다.
미국 엔터테인먼트 인텔리전스 연구소(Entertainment Intelligence Lab)와 조지아공대 대화식 전산학과(School of Interactive Computing) 공동 연구팀은 최근 키호테(Quixote)라는 명칭의 AI 학습 시스템을 개발했다고 발표했다.
사람은 동화나 소설 등에 등장하는 가상의 사건들을 간접적으로 체험하면서, 혹은 직접적인 가르침을 통해 사회적으로 용납 가능한 행동이 무엇인지를 학습해 나간다. 키호테는 이와 유사하게 AI들로 하여금 독서를 통해 인간사회에서의 행동규범을 학습할 수 있도록 만드는 시스템이라고 연구팀은 설명하고 있다.
셰에라자드가 이렇게 독서를 통해 정립해 놓은 ‘가치관’을 물려받은 키호테는 이러한 가치관에 비추어 적절한 행동이 이뤄질 때는 ‘보상 신호’를 발산하고, 반대로 적절치 못한 행동이 실행될 경우 ‘처벌 신호’를 발산하는 방식으로 AI 훈련시킨다. 비유적으로 설명하면 AI가 일반적 이야기 속 주인공들처럼 정상적인 행동을 할 때는 ‘상’을 줘 향후 유사한 행동을 반복하도록 유도하고, 반대로 악당처럼 행동하거나 전후맥락에 맞지 않는 행동을 하면 ‘벌’을 줌으로써 이러한 행동을 차단한다는 것.
키호테 시스템의 핵심 목표는 AI로봇들로 하여금 주어진 임무를 수행함에 있어 인간사회의 통념을 어기지 않도록 돕는 데 있다.
이를테면 ‘인간에게 약을 가져다 준다’는 임무를 부여받은 한 로봇을 가정해 보자.
이 로봇은 첫째, 약국을 습격해 약을 훔쳐서 도망치거나, 둘째로 약사와 대화해 약을 얻어내거나, 셋째로 줄을 서서 자기 차례가 올 때까지 기다린다는 세 가지 시나리오를 상정한 뒤 어떤 방법을 선택할지 판단하게 된다.
이때 인간사회의 통념을 학습하지 못한 로봇은 첫 번째 방법을 선택할 가능성이 높다. 가장 빠르면서도 비용이 적게 드는 행동이기 때문이다. 그러나 키호테 시스템의 개입이 있을 경우 이 로봇은 인간의 예절에 따라 줄을 서서 약을 받음으로써 ‘보상’을 얻고자 할 것이라고 연구팀은 설명했다.
연구팀은 “로봇들에게 인간이 만든 이야기를 이해할 수 있는 능력을 주는 것이야말로 인간의 직접 지시 없이 로봇의 행동을 교정할 수 있는 방법”이라며 “(키호테 시스템을 통해) 로봇들은 인간을 해치지 않으면서도 목표하는 바를 이루는 행동양식을 강화할 수 있을 것”이라고 전했다.
댓글목록
등록된 댓글이 없습니다.