Follow Us

뉴스레터 구독하기

No Result
View All Result
수요일, 2월 4, 2026
  • 기사제보
  • 회사소개
Newswave25 | 뉴스웨이브25 신문사
  • 홈
  • 최신뉴스
    • 로컬
    • 미국 / 국제
    • 한국 / 연예 / 스포츠
  • 사회
  • 경제
    • 비즈
    • 부동산
    • 자동차
    • 보험
  • 주식
  • 건강
  • 문화
    • 여행
    • 푸드
  • 교육
    • 뉴스피드
    • 학원찾기
  • 종교
    • 교회소식
    • 선교지
    • 인터뷰
  • 오피니언
    • 칼럼
    • 독자마당
    • 인물
  • 뉴스웨이브 TV
  • 홈
  • 최신뉴스
    • 로컬
    • 미국 / 국제
    • 한국 / 연예 / 스포츠
  • 사회
  • 경제
    • 비즈
    • 부동산
    • 자동차
    • 보험
  • 주식
  • 건강
  • 문화
    • 여행
    • 푸드
  • 교육
    • 뉴스피드
    • 학원찾기
  • 종교
    • 교회소식
    • 선교지
    • 인터뷰
  • 오피니언
    • 칼럼
    • 독자마당
    • 인물
  • 뉴스웨이브 TV
Newswave25 | 뉴스웨이브25 신문사
No Result
View All Result
  • 홈
  • 뉴스웨이브25 TV
  • 최신뉴스
  • 로컬
  • 미국 | 국제
  • 사회
  • 경제
  • 비즈
  • 부동산
  • 자동차
  • 보험
  • 주식
  • 건강
  • 문화
  • 여행
  • 푸드
  • 교육
  • 종교
  • 오피니언
  • 칼럼
  • 독자마당
  • 인물
  • 한국 | 연예 | 스포츠
Home 한국

“한국적 맥락 이해 최적화”…카카오, 멀티모달 2종 성능 공개

by Newswave25
12월 11, 2025
in 한국, 한국/연예/스포츠
Reading Time: 1 min read
카나나-o 멀티모달 벤치마크 성능 비교[카카오 제공. 재판매 및 DB 금지]

텍스트·음성·이미지 동시 이해·답변…”지시 이행력 개선”

카카오가 사람처럼 보고 듣고 말하면서 한국어는 물론 한국 문화를 이해하는 데 초점을 둔 최신 멀티모달(Multinodal) AI 기술 연구 성과를 공개했다.

카카오는 12일 테크블로그를 통해 한국적 맥락 이해에 최적화된 통합 멀티모달 언어모델 ‘카나나(Kanana)-o’와 멀티모달 임베딩 모델 ‘카나나-v-임베딩'(Kanana-v-embedding)’ 개발 과정과 성능을 발표했다.

멀티모달은 텍스트와 음성, 이미지 등 다양한 형태의 정보를 동시에 이해하고 처리·답변할 수 있는 능력이나 기술을 말한다.

먼저 ‘카나나-o’는 글로벌 모델과 비교해 한국어 맥락 이해에서 압도적 성능을 보유해 사람처럼 자연스럽고 풍부한 표현력을 갖췄다는 게 카카오 설명이다. 지난 5월 처음 공개된 뒤 이번에 지시 이행 능력이 개선됐다.

카카오는 기존 멀티모달 모델들이 텍스트에는 강점을 보이지만 음성으로 대화 땐 답변이 다소 단순해지고 추론 능력이 떨어진다는 점에 주목했다.

이에 카카오는 카나나-o 지시 이행을 고도화해 사용자의 숨은 의도와 복잡한 요구사항까지 파악할 수 있도록 개선했다고 전했다.

이와 함께 단순 질의응답을 넘어 요약, 감정·의도 해석, 오류 수정, 형식 변환, 번역 등 다양한 과업을 수행할 수 있게 성능을 끌어올렸다고 부연했다.

또한 고품질 음성 데이터와 직접 선호 최적화 기술을 적용해 억양과 감정, 호흡 등을 정교하게 학습시켰다.

카카오는 벤치마크(성능 검증) 평가 결과 카나나-o가 영어 음성 성능에서 GPT-4o와 유사한 수준을, 한국어 음성 인식·합성, 감정 인식 능력에서는 월등히 높은 수준을 기록했다고 밝혔다.

이번에 함께 공개된 카나나-v-임베딩은 이미지 기반 검색의 핵심 기술로, 텍스트와 이미지를 동시에 이해해 처리할 수 있는 한국형 멀티모달 모델이다.

실제 서비스 적용을 목표로 개발된 이 모델은 한국어와 한국 문화에 대한 이해도가 높아 ‘경복궁’, ‘붕어빵’ 같은 고유명사의 이미지도 찾아준다.

현재 이 모델은 카카오 내부에서 광고 소재의 유사도를 분석·심사하는 시스템에 적용 중이다.

김병학 카카오 카나나 성과리더는 “카나나를 단순 정보 나열 수준을 넘어 사용자의 감정을 이해하며 친숙하고 자연스럽게 대화하는 AI가 될 수 있게 하겠다”고 말했다.

 

Tags: 멀티모달성능카나나카카오
ShareTweet
Newswave25

Newswave25

Related Posts

스포츠

2028 LA 올림픽 축구, 뉴욕·내슈빌 등 7곳서 개최

2월 3, 2026
연예

로제, 마스와 피자로 그래미 뒤풀이…”생애 최고의 밤이었다”

2월 3, 2026
한국

올해부터 제헌절 ‘빨간날’ 확정…공휴일법 개정안 국무회의 의결

2월 3, 2026
연예

한국계팝스타 앤더슨팩 연출작 美서 개봉…한인 뿌리·문화 담아

2월 2, 2026
연예

BTS, 내달 21일 광화문 광장서 컴백 공연…넷플릭스 생중계

2월 2, 2026
스포츠

PGA 투어 피닉스오픈 5일 개막…상승세 김시우 우승 도전

2월 2, 2026
https://www.youtube.com/watch?v=vANVtj4X90Q

Wave25tv

Currently Playing

뼈에서 나는 우두둑 소리 과연 괜찮은 건가요?

뼈에서 나는 우두둑 소리 과연 괜찮은 건가요?

영상

내 차는 자차보험 안들어도 괜찮아 그러다 제대로 보상…

영상

내가 가지고 있는 건강보험에 대해 얼마나 알고 계신가요?

영상

세련된 스타일, 편안함, 최고의 입지 완벽하게 조화된 타운하우스

영상

마사지 잘못 받으면 병이 됩니다 건강하게 마사지 받는 방법

영상

뉴스레터 구독하기

  • 기사제보
  • 회사소개

© 2021 Newswave25 무단전재, 재배포 및 이용 (AI 학습 포함) 금지 - empowered by ApplaSo Software Company.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • 홈
  • 최신뉴스
    • 로컬
    • 미국 / 국제
    • 한국 / 연예 / 스포츠
  • 사회
  • 경제
    • 비즈
    • 부동산
    • 자동차
    • 보험
  • 주식
  • 건강
  • 문화
    • 여행
    • 푸드
  • 교육
    • 뉴스피드
    • 학원찾기
  • 종교
    • 교회소식
    • 선교지
    • 인터뷰
  • 오피니언
    • 칼럼
    • 독자마당
    • 인물
  • 뉴스웨이브 TV

© 2021 Newswave25 무단전재, 재배포 및 이용 (AI 학습 포함) 금지 - empowered by ApplaSo Software Company.

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
-
00:00
00:00

Queue

Update Required Flash plugin
-
00:00
00:00