SKT 초거대 AI ‘A.X K1’ 기술 공개…성능·효율 모두 잡았다

전자·IT / 최연돈 기자 / 2026-01-07 16:13:36
5190억 파라미터 모델로 글로벌 오픈소스와 정면 경쟁

[소셜밸류=최연돈 기자] SK텔레콤 정예팀이 매개변수 5190억 개 규모의 초거대 인공지능 모델 ‘A.X K1(에이닷엑스 케이원)’의 기술 보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔다. 

 

제한된 개발 기간과 GPU 자원 속에서도 세계 최고 수준의 성능과 효율성을 동시에 확보했다는 점에서 국내 AI 기술 경쟁력을 보여주는 사례로 평가된다.

 

▲SK텔레콤 로고 이미지/사진=자료

 

SK텔레콤 정예팀은 약 4개월의 개발 기간과 1000개 수준의 GPU 자원을 활용해 국내 최초의 500B급 초거대 모델을 완성했다. 매개변수 규모가 커질수록 최적화에 필요한 시간과 자원이 기하급수적으로 늘어나는 상황에서도, 효율 중심의 설계를 통해 글로벌 오픈소스 모델과 유사하거나 더 높은 성능을 달성했다는 설명이다.

 

A.X K1은 수학과 코딩 분야에서 특히 두드러진 성과를 보였다. 수학 성능을 측정하는 AIME25 벤치마크에서 89.8점을 기록하며 딥시크-V3.1 대비 102% 수준의 성능을 나타냈다. 실시간 코딩 문제 해결 능력을 평가하는 LiveCodeBench에서는 영어 기반 75.8점, 한국어 기반 73.1점을 기록해 딥시크-V3.1 대비 각각 109%, 110%에 달하는 성능을 입증했다.

 

이 같은 성과는 효율적인 학습 설계에서 비롯됐다. 정예팀은 사용 가능한 GPU 자원과 학습 기간을 고려해 최적의 학습 연산량을 수학적으로 설계하고, 약 10조 개에 달하는 고품질 데이터를 투입해 학습 효과를 극대화했다. 웹 데이터와 코드, 이공계 데이터, 추론 데이터는 물론 한국어 특화 문서와 합성 데이터를 활용하고, 난이도별 커리큘럼 학습 방식도 적용했다.

 

A.X K1은 실용성을 고려한 구조 설계도 강점으로 꼽힌다. 전체 519B 파라미터 가운데 33B만 선택적으로 활성화하는 전문가 혼합 방식 구조를 채택해 훈련 안정성과 효율을 동시에 확보했다. 또한 한 번에 128K 토큰의 긴 문맥을 처리할 수 있어, 기업 연간보고서나 소설 한 권 분량의 텍스트도 동시에 분석할 수 있다.

 

이번 모델은 정부 지원 없이 SK텔레콤이 자체적으로 GPU를 조달해 개발했다는 점에서도 의미가 크다. 글로벌 AI 개발 경쟁이 치열해지는 상황에서 민간 주도의 초거대 모델 개발 가능성을 입증했다는 평가다.

 

SK텔레콤은 향후 A.X K1에 더 많은 컴퓨팅 자원과 데이터를 투입해 성능을 고도화하고, 연내 멀티모달 기능을 추가한 뒤 조 단위 파라미터 규모로 모델을 확장할 계획이다. 초거대 AI를 기반으로 통신을 넘어 산업 전반에 활용 가능한 AI 경쟁력을 확보한다는 전략이다.

[ⓒ 사회가치 공유 언론-소셜밸류. 무단전재-재배포 금지]

    뉴스댓글 >

    SNS