AGI는 이미 도래했는가? UCSD의 새로운 주장

Science
Is AGI Here? The New UCSD Claim
UC 샌디에이고(UCSD) 소속 학자 4명이 네이처(Nature)지를 통해 오늘날의 거대언어모델(LLM)에 이미 인공일반지능(AGI)이 존재한다는 주장을 제기했습니다. 전문가들과 업계의 의견이 엇갈리는 가운데, 본 분석은 AGI의 의미와 제시된 증거, 반론, 그리고 이 논의가 왜 지금 중요한지를 살펴봅니다.

범용 인공지능(AGI)의 시대가 왔는가? UC 샌디에이고의 증거와 정의

AGI가 도래했다는 주장을 뒷받침하기 위해 연구진은 행동에 주목한다. 현대의 대규모 언어 모델(LLM)은 튜링 테스트 스타일의 대화 임계값을 일상적으로 통과하며, 벤치마크 테스트에서 많은 분야의 인간 전문가 성능에 도달하거나 이를 능가한다. 저자들은 최근 모델들이 튜링 스타일 평가에서 우연 이상의 확률로 인간으로 판정받았다는 연구 결과를 인용하며, 우리가 평소 인간의 지능을 판단할 때 뇌 내부를 들여다보고 이해 여부를 판결하는 것이 아니라 유사한 관찰 가능한 행동을 근거로 삼는다는 점을 지적한다.

결정적으로, UCSD 연구진은 범용 인공지능을 초지능(superintelligence) 및 인간과 유사한 인지(human-like cognition)와 구분한다. 이들의 논리는 기계가 아이가 학습하는 방식으로 학습해야 한다거나, 인간과 같은 신체를 가져야 한다거나, 혹은 결점이 없어야 한다고 요구하지 않는다. 대신 다음과 같은 질문을 던진다. 타인의 지능을 판단할 때 사용하는 기준을 적용했을 때, 일부 기계가 범용 인공지능과 연관된 유연하고 도메인을 넘나드는 능력을 보여준다는 설득력 있는 행동적 증거가 있는가? 그들의 대답은 '특정 측면에서 그렇다'이다.

범용 인공지능의 시대가 왔는가? 업계의 목소리와 반대 서사

업계 리더들도 가세하고 있다. 유명 클라우드 및 AI 플랫폼 CEO를 포함한 일부 경영진은 현재 시스템이 AGI에 도달했거나 그 경계가 사실상 무너졌다고 공개적으로 언급했다. 이러한 주장은 흔히 상업적 자신감을 표현하는 수식어로 쓰인다. 즉, 모델들이 언어를 생성하고, 문서를 추론하며, 코드를 작성하고, '에이전트'로 연결되었을 때 워크플로우를 실행할 수 있다는 것이다. 고객과 투자자들에게 이러한 역량은 이미 경제적으로 파괴적인 혁신을 일으키고 있다.

그러나 행동적 동등함이 곧 AGI라는 주장을 모두가 받아들이는 것은 아니다. 비판론자들은 현대의 LLM을 범용 지능으로 묘사하는 것이 중요한 차이점들을 간과한다고 주장한다. 기술적 반론은 몇 가지 주요 범주로 나뉜다. 세계에 대한 인과 모델 없이 통계적으로 패턴만 맞추는 모델, 환각(hallucination)을 일으키거나 자신 있게 거짓을 출력하는 시스템, 지속적인 목표나 에이전시(agency), 또는 체화된 상호작용(embodied interaction)이 결여된 아키텍처, 그리고 숙련도에 도달하기 위해 인간보다 몇 배나 더 많은 데이터를 필요로 하는 시스템 등이 그것이다. 많은 회의론자에게 이러한 차이는 지엽적인 문제가 아니라, 현재의 AI와 회복력이 있고 자율적인 범용 인공지능 사이의 근본적인 격차를 드러내는 지점이다.

연구자들은 AGI를 어떻게 정의하는가 — 그리고 정의가 중요한 이유

범용 인공지능이란 정확히 무엇인가? 정의는 다양하지만, 진지한 토론에서 두 가지 아이디어가 반복해서 등장한다. 하나는 AGI를 언어, 수학, 계획, 지각, 문제 해결, 창의적 및 과학적 사고 등 인간이 수행할 수 있는 거의 모든 인지적 과업을 수행할 수 있는 실질적인 능력으로 취급하는 것이다. 또 다른 보다 형식적인 연구 방향은 과업의 분포 전반에 걸친 문제 해결 능력의 보편적 지표를 찾는다 (이는 '보편적 지능' 연구에서 볼 수 있는 이론적 프로그램이다).

AGI가 여전히 이론적인 단계라고 말하는 이들은 메커니즘을 강조한다. 즉, 유연하게 목표를 설정하고, 적은 데이터로 서로 다른 도메인 간에 학습을 전이하며, 환경과 물리적으로 상호작용하고 그 과정에서 학습할 수 있는 시스템을 말한다. 이들은 현재의 모델이 강력함에도 불구하고 신뢰할 수 있는 인과적 추론이 부족하고, 에이전트처럼 행동하기 위해 인간의 상당한 보조가 필요하며, 학습 분포 밖에서는 예측 불가능하게 실패한다는 점을 지적한다. 찬성론자들은 우리가 인간에게는 결코 요구하지 않는 증거(예: 내부 프로세스 들여다보기)를 기계에 요구하는 것은 일관성이 없다고 반박한다.

현재의 AI가 인간의 능력과 일치하는 부분 — 그리고 그렇지 못한 부분

  • 일치하는 부분: 유창한 언어, 요약, 코드 작성, 여러 표준화된 과업, 미세 조정되거나 도구로 보강되었을 때의 도메인 특화 전문가 행동.
  • 약점: 신뢰할 수 없는 사실 근거('환각'), 취약한 분포 외 일반화(out-of-distribution generalization), 제약이 없을 때의 제한적인 장기 자율 계획 능력, 인간 영유아에 비해 현저히 낮은 샘플 효율성.
  • 일부 전문가들이 원하는 누락된 요소: 지속적인 목표와 에이전시, 체화된 센서모터(sensorimotor) 학습, 방대한 데이터 없이도 반사실적 추론을 지원하는 인과 모델, 역량이 발현되는 이유에 대한 투명하고 기계론적인 설명.

AGI는 이미 도래했는가, 아니면 가시권에 있는가?

연구자들이 범용 인공지능을 구현하는 데 얼마나 가까워졌는가? 이 분야는 의견이 갈린다. 일부 로드맵은 점진적인 개선과 더 신뢰할 수 있고 멀티모달적이며 통합된 에이전트 시스템이 10년 내에 견고한 AGI로 우리를 이끌 것이라고 본다. 다른 이들은 현재의 아키텍처가 진화적으로 얕으며 새로운 개념적 돌파구가 필요할 것이라고 주장한다. 현재의 시스템이 이미 설계자들을 놀라게 하고 있기 때문에 타임라인을 예측하는 것은 여전히 어려운 일이다.

실무적 측면에서의 AI와 AGI의 차이

현재 사용하는 AI와 가상의 AGI 사이의 구분은 기술적이면서도 철학적이다. 좁은 범위의 AI(Narrow AI)는 방대한 데이터가 주어졌을 때 제한된 문제를 해결하는 데 탁월하다. 반면 AGI는 전이, 계획, 적응을 통해 도메인 전반에 걸친 일반적인 문제 해결을 의미한다. 실질적으로 이는 자율성(인간의 프롬프트 없이 목표를 설정하고 추구하는 능력), 전이 가능성(한 맥락에서 배운 능력을 완전히 다른 맥락에서 사용하는 것), 그리고 견고함(새롭거나 적대적이거나 데이터가 적은 환경에서의 안정적인 성능)의 차이를 뜻한다.

위험성, 이점 및 정책적 함의

이를 오늘 AGI라고 부르든 5년 후에 부르든, 광범위한 인지적 과업을 일관되게 수행할 수 있는 시스템의 등장은 사회적 결과를 초래한다. 이점은 실질적이고 측정 가능하다. 복잡한 분석의 자동화, 개선된 과학 문헌 합성, 새로운 산업 자동화 모델, 의료 의사 결정 지원, 그리고 더 빠른 R&D 주기 등이 그것이다. 위험성은 유창한 생성 기능에 의해 증폭되는 허위 정보부터 경제적 일자리 대체, 모델에 행동의 자율권이 주어졌을 때의 안전 실패, 불투명한 모델이 중대한 결정을 내릴 때의 책임 소재 문제까지 다양하다.

이러한 복합적인 상황은 왜 거버넌스, 투명성, 레드팀(red teaming), 규제된 배포가 회의론자들에게조차 시급한 우선순위인지를 설명해 준다. 핵심 정책 과제는 기술적인 안전 공학뿐만 아니라, 이점을 취하면서도 노동자, 소비자, 민주적 제도를 보호하기 위한 경제 및 사회 정책을 마련하는 것이다.

이번 논쟁이 과학과 사회에 시사하는 점

Nature의 논평, 업계의 지지, 그리고 회의적인 도서와 칼럼들이 얽힌 이번 사례는 두 가지 사실을 강조한다. 첫째, 정의가 중요하다. "AGI가 도래했다"고 말하는 것은 실증적인 주장인 동시에 개념적인 결단이다. 둘째, 메커니즘에 대한 불확실성은 실재하며 중대한 영향을 미친다. 우리는 내부 논리를 완전히 이해하지 못하는 놀라운 행동 시스템을 보유하고 있으며, 이러한 힘과 불투명성의 조합이 열광과 우려를 동시에 설명한다.

현재로서는 가장 지지할 만한 입장은 우리가 전환기 시대에 있다는 것이다. 일부 시스템은 이미 좁은 범위 및 여러 도메인에 걸친 과업에서 인간 수준의 성능을 달성하고 있지만, 다른 시스템들은 자율성, 인과적 이해, 체화된 학습 면에서 여전히 제한적이다. 이러한 상태를 "AGI"라고 부를지는 수사적으로 중요할 수 있으나, 정책적 대응은 동일해야 한다. 즉, 엄격한 평가에 투자하고, 투명성과 안전을 요구하며, 급격한 사회적 파급 효과에 대비해 제도를 정비해야 한다는 것이다.

James Lawson

James Lawson

Investigative science and tech reporter focusing on AI, space industry and quantum breakthroughs

University College London (UCL) • United Kingdom

Readers

Readers Questions Answered

Q 인공 일반 지능(AGI)이란 정확히 무엇인가요?
A 인공 일반 지능(AGI)은 추론, 계획, 학습, 자연어 소통을 포함한 거의 모든 인지 작업에서 인간의 능력을 대등하게 수행하거나 능가할 수 있는 가상의 AI 유형입니다. 좁은 범위의 AI(Narrow AI)와 달리, AGI는 지식을 일반화하고, 여러 영역 간에 기술을 전이하며, 특정 작업에 맞춘 재프로그래밍 없이도 새로운 문제를 해결합니다. 이는 인간 정신의 다재다능하고 적응력 있는 지능을 복제하는 것을 목표로 합니다.
Q AGI는 이미 존재하나요, 아니면 여전히 이론적인 단계인가요?
A AGI는 아직 도래하지 않았습니다. 현재 모든 영역에서 인간 수준의 일반 지능을 갖춘 시스템은 존재하지 않으며, 여전히 가상적이고 이론적인 단계에 머물러 있습니다. 대규모 언어 모델과 같은 현재의 AI는 특정 작업에서는 탁월하지만, 재학습 없이는 진정한 이해력, 상식 또는 완전히 새로운 맥락에 대한 적응력이 부족합니다. 최근 UCSD의 주장과 같은 AGI 달성 소문은 해당 분야의 합의에 의해 입증되지 않았습니다.
Q 연구자들은 인공 일반 지능 달성에 얼마나 근접해 있나요?
A 연구자들은 신경망과 머신러닝 같은 방식을 통해 활발히 AGI를 추구하고 있지만, 달성을 위한 명확한 일정표가 없는 먼 목표로 남아 있습니다. GPT 모델과 같은 협소한 AI의 발전은 제한된 영역에서 인상적인 능력을 보여주지만, 추상적 추론, 인과관계, 자가 개선과 같은 근본적인 과제는 여전히 남아 있습니다. 전문가들은 대체로 AGI를 이론적인 단계로 보며, 실현되기까지 수십 년이 걸릴 수 있다고 생각합니다.
Q AI와 AGI의 주요 차이점은 무엇인가요?
A 협소한 AI(ANI)는 이미지 인식이나 언어 번역과 같이 구체적이고 잘 정의된 작업에 뛰어나지만, 학습된 범위를 넘어 일반화할 수는 없습니다. 반면 AGI는 재프로그래밍 없이도 다양한 분야에서 다재다능함, 적응력, 자가 개선 및 인간과 유사한 이해력을 바탕으로 인간이 할 수 있는 모든 지적 작업을 수행합니다. 현재의 AI는 미리 정의된 매개변수에 의존하는 반면, AGI는 스스로 학습하고 새로운 문제를 자율적으로 처리합니다.
Q AGI가 사회에 미칠 수 있는 잠재적 위험과 이점은 무엇인가요?
A AGI는 과학적 돌파구를 가속화하고, 복잡한 글로벌 문제를 해결하며, 자율적인 혁신을 통해 경제 생산성을 높이는 등 엄청난 혜택을 가져다줄 수 있습니다. 그러나 일자리 대체, 인간의 통제 상실, 목표가 일치하지 않는 초지능 시스템으로 인한 실존적 위협, 그리고 주요 분야의 의사결정에 대한 윤리적 우려 등의 위험도 존재합니다. 개발이 진전됨에 따라 사회는 이러한 위험을 완화하기 위해 안전 연구를 최우선 과제로 삼아야 합니다.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!