TOPICS

알림

#연구

【연구 성과】본교 교원이 국제학술회의에서 최우수 논문상을 수상했습니다!

AI의 「마음의 개성」을 해명! 36 종류의 AI 감정 이해 능력을 과학적으로 비교

이번에 본교 데이터 사이언스학부 백배교수가 2025년 10월 15일부터 17일까지 대만 타이중시에서 개최된 The 21st International Conference on Intelligent Information Hiding and Multimedia Signal Processing(IIHMSP 2025)에서 「Best Paper Award」(최우수 논문상)를 수상했습니다.이 수상은 세계를 선도하는 7개사 36종류의 AI 모델의 ‘감정이해의 개성’을 대규모로 통일적인 방법으로 과학적으로 해명한 획기적인 연구가 높게 평가된 것입니다.

본 연구는 특별 세션 ‘AI-Enhanced QoL, Economics, Affective Computing and Modern Technology’에서 발표되었으며, 회의 전체 채택률 약 60%(투고 143건 중 86건 채택) 중에서 특별 세션 내 최우수 논문으로 선출되었습니다.

❓ 왜 이 연구가 필요한가?

ChatGPT를 비롯한 대규모 언어 모델(LLM)은 우리의 삶에 급속히 침투하고 있지만, "어떤 AI가 인간의 감정을 더 정확하게 이해할 수 있는가?"라는 의문은 아직 충분히 해명되지 않았다.

지금까지의 연구에서는 특정 AI 모델을 개별적으로 평가하는 것이 주류였으며 다른 회사가 제공하는 여러 AI를 동일한 기준으로 공평하게 비교하는 것이 어려웠습니다.그 이유는 각 회사의 API 사양이 다르고 통일적인 평가가 기술적으로 어려웠기 때문입니다.

또한 AI에 ‘대학생’ ‘시인’ ‘연구자’와 같은 다른 ‘인격(페르소나)’을 주었을 경우 감정의 평가가 어떻게 변화할지도 미해명이었습니다.

백배교수들은 이러한 과제를 해결하기 위해 다른 회사의 AI를 동일한 모래판에서 공평하게 비교할 수 있는 표준화된 실험 기반을 개발하고 대규모 AI 감정 이해능력 비교 연구를 실시했습니다.

어떻게 연구를 진행했나요?

이 연구는 전 세계 7개 기업(OpenAI, Google, Anthropic, xAI, DeepSeek, Meta, Alibaba)의 AI 모델 36종류를 대상으로 대규모 비교 실험을 실시했다.

실험에서는 AI에 일본의 문학 작품(유메노 히사작의 「돈과 피스톨」, 타카무라 코타로의 「어려운 타조」 등)을 읽게 해, 「재미움」「놀라움」「슬노」의 4개의 감정을 어느 정도 느끼는지를 100점 만점으로 평가시켰습니다.

또한, 「대학생」「문예연구자」「시인」「로봇」이라는 4가지 다른 「인격(페르소나)」을 AI에 주어 각각의 시점에서 감정을 분석시키는 독특한 수법도 도입했습니다.

이 대규모 실험에 의해 수집된 4,067건의 데이터 포인트를 이원배치 분산분석(ANOVA) 및 클래스칼 월리스 검정 등의 엄밀한 통계 방법으로 분석했습니다.

놀라움의 발견!

이 대규모 실험에서 다음과 같은 중요한 사실이 과학적으로 입증되었습니다.

1. AI에도 ‘감정적 개성’이 있다!

통계 검증을 통해 AI 개발 회사들(벤더)마다 감정적 평가 경향이 크게 다르다는 것을 밝혀냈습니다(모든 감정 차원에서 p < 0.05)

Alibaba 모델: 긍정적인 감정 (특히 "재미있는")에 대해 높은 평가를 나타내는 경향
Google 모델: 모든 감정 차원에서 균형 잡힌 평가를 실시한다
Anthropic 모델: 매우 안정된 감정평가를 보여주는
Meta 모델: 독자적인 평가 패턴을 가진다

더욱 흥미롭게도 일부 모델은 ‘고정적 개성’을 가지고 어떤 페르소나를 주어도 평가가 별로 바뀌지 않았습니다.한편, 다른 모델은 "페르소나 카멜레온"으로 주어진 인격에 따라 유연하게 평가를 변화시킵니다.

2. 텍스트의 내용이 감정 평가를 크게 좌우한다!

통계적 근거 (모두 p < 0.001)에 의해 텍스트 내용이 감정 평가의 50% 이상의 변동을 설명하는 것으로 입증되었습니다.

이것은 많은 AI 모델이 문학 작품의 미묘한 감정적 뉘앙스를 파악하고 적절하게 반영 할 수 있음을 보여줍니다.예를 들어, 흥미로운 「돈과 권총」과 애수를 띤 「어린 타조」에서는 AI의 평가가 확연히 달랐습니다.

3. 신뢰성 높은 AI, 개발도상 AI

이번 실험에서는 Anthropic 사, xAI, DeepSeek사의 모델이 한번도 평가에 실패하지 않고 완벽한 신뢰성을 보여주었습니다.한편, 일부 모델은 수치 평가를 돌려주지 못하고, 아직 개발도상 부분이 있는 것도 판명되었습니다.

이는 비즈니스 및 서비스에서 AI를 활용할 때 어떤 모델을 선택해야 하는지의 중요한 지표입니다.

이 연구의 사회적 의의와 미래

이 연구에서 입증 된 지식은 감정에 민감한 AI 응용 프로그램을 개발할 때 모델 선택에 대한 실제 지침을 제공합니다.
장래적으로는, 이 성과를 응용해, 이하와 같은 서비스의 개발로 연결되어 갈 것으로 기대됩니다.

정신 건강 지원 AI: 사용자의 감정 상태를 정확하게 파악하고 적절한 지원을 제공
교육 지원 AI: 학습자의 감정적 반응을 이해하고 최적의 학습 경험을 제공
고객 서비스 AI: 고객의 감정을 이해하고 공감적인 대응을 실현
문학·예술 분야 AI: 보다 깊은 감정적 이해를 가진 AI 어시스턴트

또한 본교 학생들은 이러한 최첨단 연구를 접하고 차세대 AI 기술을 스스로 창조하는 힘을 익힐 수 있습니다.데이터 사이언스학부에서는 단순한 기술 습득에 그치지 않고 AI와 인간의 더 나은 공생을 실현하기 위한 연구에 임하고 있습니다.

쇼하쿠하바타 교수로부터의 코멘트

“이번에 이런 훌륭한 상을 받아 매우 영광으로 생각합니다.이번 연구는 AI가 단순한 도구가 아니라 인간의 감정을 이해하고 풍부한 커뮤니케이션을 가능하게 하는 파트너가 되기 위한 중요한 단계입니다.
특히 36가지의 AI 모델을 통일적인 기준으로 비교 평가할 수 있었던 것은 지금까지의 연구에서는 어려웠던 과제를 극복할 수 있다는 점에서 큰 의의가 있다고 생각합니다.각 AI가 가진 ‘감정적 개성’을 과학적으로 밝히는 것으로, 용도에 맞는 최적의 AI 선택이 가능합니다.
연구를 지지해 준 공저자인 나카타니 선생님, 와타나베 선생님, 그리고 날마다 탐구심을 가지고 계속 배우는 학생들에게 진심으로 감사드립니다.데이터 과학은 AI의 힘을 사회의 미래를 위해 어떻게 활용하는지를 생각하는 학문입니다.이 연구 성과가 미래의 데이터 사이언티스트를 목표로 하는 여러분의 마음에 울려 본학에서의 배움의 계기가 되면 다행입니다.

오토 논문 정보

논문 제목: Characterizing “Emotional Individuality” in 36 LLMs: Persona and Japanese Text Conditioning (36 종류의 LLM에서 "감정적 개성" 특성 평가: 페르소나와 일본어 텍스트 영향)
저자 :
- Naruki Shirahama (시라하마 나루키) – 시모노세키 시립 대학 데이터 사이언스학부 교수
- Naofumi Nakaya (나카타니 나오시) – 준텐도 대학
- Satoshi Watanabe (와타나베 시) – 시즈오카 리공과대학
수상: Best Paper Award(최우수 논문상)
학회: The 21st International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIHMSP 2025)
개최지: Splendor Hotel, Taichung, Taiwan
개최일: 2025년 10월 15일~17일
URL: https://iihmsp25.csie.cyut.edu.tw/
특별 세션: AI-Enhanced QoL, Economics, Affective Computing and Modern Technology
연구 지원: 본 연구는 JSPS 과학비 (과제 번호 : 24K13350)의 보조금을 받아 실시되었습니다.

Click here for the English version.

【문의처】
공립대학법인 시모노세키 시립대학
경영기획부 홍보브랜드전략과
TEL. 083-253-8967