지난 주요뉴스 한국경제TV에서 선정한 지난 주요뉴스 뉴스썸 한국경제TV 웹사이트에서 접속자들이 많이 본 뉴스 한국경제TV 기사만 onoff
오픈AI 신모델 GPT-5.4 공개…"이젠 제미나이에 안되네" 2026-03-06 11:07:49
구글 제미나이 3.1프로(85.9%) 앤스로픽 클로드 오퍼스 4.6(84%)보다 높은 점수를 받았다. 코딩 능력을 매기는 'SWE-벤치 프로 퍼블릭' 지표에서도 57.7%로 제미나이3.1 프로(54.2%)를 상회했다. 답변 정확성도 개선됐다. GPT-5.2 대비 개별 주장에서 오류가 발생할 확률은 33%, 전체 응답에 오류가 포함될 확률은...
오픈AI, 새 AI모델 GPT-5.4 공개…추론·코딩 모델 통합 2026-03-06 05:25:31
모델은 44개 직종의 지식 업무 수행 능력을 평가하는 "GDPval' 성능지표(벤치마크)에서 82%를 기록해 70% 수준이었던 전작을 뛰어넘었다. 또 정보검색 능력을 측정하는 '브라우즈컴프' 지표에서도 89.3%로 경쟁작인 구글 제미나이3.1 프로(85.9%)나 앤트로픽 클로드 오퍼스 4.6(84%)보다 점수가 높았다. 코딩...
"국가대표 AI, 산업현장에서 증명해야" 2026-03-05 16:59:08
이끌고 있다. 정 CTO는 “LLM 성능을 평가하는 기준은 굉장히 다양하지만 어쩔 수 없이 벤치마크 스코어를 갖고 평가한다”고 말했다. 그러면서 “정확히 점수가 공개되지는 않았지만 독자파운데이션모델 프로젝트 1위를 차지한 경쟁사 모델이 모든 분야에서 쓰기에 좋다고 보이지는 않는다”며 “수능을 제일 잘 보는 것과...
SKT "AI 경쟁, 수능 1등보다 '일 잘하는 모델'이 핵심" 2026-03-05 08:00:28
공개하지 않았으나, 엑사원은 벤치마크 평가 위주의 종합 점수에서 1위를 차지한 바 있다. 정 CTO는 "거대언어모델(LLM)의 성능을 평가하는 기준은 매우 다양하다"며 "현재는 경연 특성상 벤치마크 점수로 평가하고 있지만, 대입에 정시와 수시가 있듯 AI 평가 역시 그런 관점에서 봐야 한다"고 말했다. 그는 "수능을 제일 ...
SKT AI 수장 "LG 엑사원? 진짜 1등이라 생각 안 해" [MWC 2026] 2026-03-05 08:00:10
'엑사원' 성능에 대해서도 이야기했다. 정 CTO는 "정확히 점수가 공개되지는 않았지만 엑사원이 모든 분야에서 쓰기에 그게 가장 좋은 모델이다라고 보이지는 않는다"며 "수능을 제일 잘 보는 거랑 일을 제일 잘하는 게 다른 것이랑 마찬가지"라고 말했다. 정 CTO는 SK텔레콤의 '에이닷엑스 케이원'이 산업...
비드래프트, AI 메타인지 벤치마크 ‘FINAL Bench’ 공개 2026-03-03 11:34:33
교정 구조를 적용한 실험에서 성능 변화 양상을 분석한 결과, 오류 복구(ER) 항목의 점수 변동 폭이 상대적으로 크게 나타났다고 설명했다. 이를 통해 메타인지적 오류 수정 능력이 모델 성능 평가에서 별도의 지표로 활용될 수 있음을 제시했다. 관련 논문 ‘FINAL Bench: Measuring Functional Metacognitive Reasoning...
독자 기술 집약한 삼성 갤럭시S26…세트부문 구원투수될까 2026-03-01 06:31:01
확장했다. 실제로 엑시노스 2600은 AI 성능을 측정하는 벤치마크(성능평가)의 자연어 이해·객체 탐지·이미지 분류 항목에서 퀄컴의 스냅드래곤 8 엘리트 5세대보다 높은 점수를 기록했다. 이에 외신들은 실시간 번역과 같은 언어 처리 기능과 실시간 객체 인식·추적 성능에서 엑시노스 2600이 강점을 보일 수 있음을...
독자 기술 집약한 삼성 갤럭시S26…세트부문 구원투수될까 2026-03-01 06:31:01
확장했다. 실제로 엑시노스 2600은 AI 성능을 측정하는 벤치마크(성능평가)의 자연어 이해·객체 탐지·이미지 분류 항목에서 퀄컴의 스냅드래곤 8 엘리트 5세대보다 높은 점수를 기록했다. 이에 외신들은 실시간 번역과 같은 언어 처리 기능과 실시간 객체 인식·추적 성능에서 엑시노스 2600이 강점을 보일 수 있음을...
국가물산업클러스터가 키운 '미래 유니콘'…우수기업 8곳 선정 2026-02-26 16:20:33
1인이 개별 채점한 뒤 최고·최저점을 제외한 평균 점수로 순위를 산정하는 방식으로 이뤄졌다. 기술 혁신성, 시장 적용성, 실증성과, 해외 확장 가능성이 주요 기준이었다.월드워터 - '그린볼' 한 번 설치로 댐·강·호수 녹조 제거, 수질 정화 씨브이디다이아몬드코리아 - 유기오염물 없애는 다이아몬드 전극 소...
[AI픽] KT, MWC 26서 '믿:음 K 2.5 프로' 공개 2026-02-26 08:53:18
성능을 기록했다. 또 에이전틱 AI 성능을 측정하는 '타우 스쿠어 벤치'에서 87%를 기록, 글로벌 유수의 AI 모델과 동등한 수준의 도구 활용·과업 수행 능력을 입증했다. KT는 'K 데이터 얼라이언스'를 통해 공공·학계·언론·교육 등과 협력해 한국어 맥락이 반영된 고품질 데이터를 확보하고, 자체...