Chinese Room, Syntax and Semantics by SHIMIAN


영어 단어 syntax 는 그리어스어에서 비롯된 것으로, syn 은 '함께(together)', tax 는 '배열/나열하다(arrange)', 합치면 '함께 배열한다'라는 의미가 된다.

언어학에선 'syntax' 를 일러 'symbol manipulation' 이란 표현을 종종 사용하는데, 간단히 말하자면, '영희', '철수', '좋아한다'라는 각각의 symbol 들을 이리저리 섞어 묶어, '영희는 철수를 좋아한다' 라는 문장으로 만드는 과정, 그 과정이 바로 syntax 란 것이다.

(미국) 철학자 John Searle (1932- )은, 인간의 의식과 관련된 문제가 뇌의 (신경 해부학적) 문제로 모두 환원될 수는 없다고 주장하는데, 관련해서 이런 (유명한) 비유를 들고 있다. 일명, Chinese Room. (일견, Turing Test 와도 많이 닮은)
그림에서처럼 밀폐된 방 안에 누군가 들어가 있다 생각해보자 (그(녀)를 X 라 부르자) - 당신은 X 의 정체에 관해 전해 들은 바가 전혀 없다. 자, 이제 당신에게 주어진 임무(?)는 X 가 과연 한국어를 아는 사람인가 아닌가를 판단하는 것. 그리고 그 판단을 위해 당신이 취할 수 있는 유일한 방법은, 묻고 싶은 내용들을 한국어로 적어 그 종이를 밀폐된 공간 속으로 밀어 넣은 후, 잠시 후 OUT 구멍으로 나오는 대답을 살펴 보는 것이다.

예를 들어, '안녕하세요' 라고 (한국어로) 적어 넣었더니, '안녕하세요'라고 (한국어가) 적힌 종이가 나온다. '오늘 점심은 뭘 먹었어요?' 라고 적어 넣었더니, '너무 바빠서 먹을 시간이 없었어요' 라는 한국어가 적힌 종이가 튀어 나온다. 뭐, 이런 식으로 계속, 일종의 '필답'을 주고 받는 것인데, 그렇게 충분한 시간 필답을 주고 받은 후, 최종 판단을 내리는 것이다 - '방 안에 있는 X 는 과연, 한국어를 아는 사람인가?'  

예든 바와 같이 '정상적'으로 대화가 이루어지면, 당신은 십중팔구 이렇게 생각할 것이다 - 방 안에 있는 X 는 한국어를 아는 사람이다. 근데, 바로 여기서 첫번째 반전이 등장한다.

'오늘 점심은 뭘 먹었어요' 라는 쪽지를 받아 보고, '너무 바빠서 먹을 시간이 없었어요' 라는 쪽지로 응수했고, 따라서 그걸 받아 본 당신은, 방 안의 X 가 한국어를 알고 있다고 생각했지만, 사실 방 안에 있던 X 가 한 일은 이런거다 - X 에게는 어떤 '매뉴얼' 같은 게 있어서, (예를 들어) '오늘 점심은 뭘 먹었어요' 라는 동그라미, 네모 등등의 기호들로 이루어진 문자들이 들어오면, 그걸 매뉴얼에 하나 하나 맞춰서 그 매뉴얼에 따라 '너무 바빠서 먹을 시간이 없었어요' 라고 적힌 (예를 들어) 13 번 쪽지 꺼내 밖으로 보낸 것이다.  

간단히 말해, X 는, 우리가 흔히 말하듯, 한국어를 '아는' 것, 즉, 한국어로 적힌 문장의 '의미'를 아는 것이 아니라, 들어온 문자들의 나열을 (빛의 속도로) 매뉴얼에서 찾아낼 수 있고, 또 그에 상응하는 문자들의 나열을 (빛의 속도로) 골라낼 수 있는 그런 능력을 지녔을 뿐이라는 것 - 한국말을 할 줄 '알아서' 저렇게 대답한 것이 아니라, 그저 매뉴얼에 따라 기계적으로 반응한 것 뿐이라는.

하지만, 방 안에서 무슨 일이 벌어지는 지 (전혀) 알지 못하는 바깥의 당신은, X 는 한국어를 아는 사람이라고 믿어 의심치 않을 것인데, 자, 여기서 두번째 반전 - 저 방 안에 있는 건 사실 '사람'이 아닌 '로봇', 혹은, 저 공간 자체가 실은 일종의 (거대한) AI 프로그램이었다면 어쩔까? 그 로봇/AI 는 한국어를 '안다'고 말할 수 있을까?

Searle 은 말한다 - 인간이 언어를 '안다'는 것은, syntax 를 너머 semantics 까지 아는 것이지만, AI 의 (자연) 언어 구사는 (사실) syntax 가 전부다. 바꿔 말해, (semantics 가 결여된) AI 는 (인간이 알듯) '아는' 것이 아니라, 아는 '것 처럼' 보이는 것 뿐이라는 것이요, 마찬가지로, AI 는 의식이 '있는 것'이 아니라, 의식이 있는 '것처럼' 행동하는 것 뿐이라는 것이다. 

(인간 혹은 자연) 언어에 대한 위와 같은 Searle 의 입장은, (짐작컨대) 언어 철학에 종사하는 철학자들(과 현대의 인공 지능 관련 종사자들) 상당수, 혹은 대다수가 공유하는 입장인데, 그들에게 언어 지식의 본질은 '의미'요, 따라서 그들의 연구는 지배적으로 semantics 와 관련된 것이다. 하지만, 언어 철학자들의 이와 같은 (의미 중심의) 입장은, 현대 언어학, 특히, Chomsky 를 중심으로 하는 생성 문법의 관점과는 상당히 대조적이다 - 생성 문법은, 언어 지식의 본질이 (semantics 가 아닌) syntax 에 있다는 입장이요, 심지어는 한 걸음 더 나아가, 전통적으로 semantics 라 일컬어졌던 영역 역시, 실은 symbol manipulation, 즉, syntax 의 일종일 뿐이라는 입장을 취한다.

어쨌든, 철학자들 (그리고 AI 연구자들) 의 관점이 저와 같다 보니, AI 연구의 대가 Marvin Minsky (1927-2016) 역시 이런 말을 하는 것도 어쩌면 당연지사:


"... beautiful, elegant, but irrelevant ..."

덧글

  • Fedaykin 2018/02/05 18:32 #

    요즘 연구되는 인공신경망을 통한 딥러닝 쪽에서도 재미있었던게, 이미지를 분류하는...음 예를 들면 이미지에서 사람을 찾아내는 딥러닝 머신을 만들어 학습을 시켰더니 한 인식율이 98%인가 해서 사람보다 더 잘 찾게 됐는데, 그게 내부적으로 어떻게 돌아가는지 궁금해서 그걸 잘 뜯어 보니까 딥러닝도 결국 외곽선을 추출해서 사람의 머리, 사람의 다리, 사람의 몸뚱이랑 얼마나 비슷한지 찾아보고 그걸 이용해서 사람인지 아닌지 판단을 하더라 하는 연구가 있습니다. syntax만 있는줄 알았는데 알고보니 syntax들이 쌓이고 쌓여서 스스로 semantic한 걸 만들었다고 할수있을까요.
    언어쪽 딥러닝은 잘 모르겠지만....제가 촘스키 선생님의 주장을 잘 몰라서 하는 소리 일 수도 있지만, 결국우리가 semantic 하다고 생각한 언어(나아가서는 의식이나 사고) 같은 것들도 결국 파보니까 syntax가 엄청 쌓여서 semantic한 결과가 나오더라..라고 밝혀지면 상당히 재미가 있겠네요.
  • SHIMIAN 2018/02/05 23:34 #

    '외곽선을 추출해서 .... 판단'하는 방식이 어찌해서 (syntax 를 너머) 'semantic 한 걸' 터득한 결과가 되는건지 저로서는 오리무중입니다만, 잘 아시는 분일테니, syntax 가 쌓이면 semantic 한 결과가 나오더라 ... 라는 게 있다는 정도로 이해하면 되려나요?
  • Fedaykin 2018/02/06 17:17 #

    네! 이미지 처리쪽에서는 syntax한 결과를 최대한 모사하도록 학습을 시켰더니 자기 스스로 내부에는 semantic 한걸 만들어내는 현상이 관측된것 같습니다.
    자연어를 딥러닝으로 처리 하는 연구도 있는데, 그쪽에서도 비슷한 결과가 나오면 참 재미있을것 같습니다.
  • SHIMIAN 2018/02/08 15:23 #

    그렇군요. 여전히 잘 모르겠지만, 그런 것도 있구나 하게 되었습니다.
※ 로그인 사용자만 덧글을 남길 수 있습니다.