openai 4

GPT-5.4가 인간 전문가를 넘어섰다 - GDPval 83% 의미와 '100배 빠르고 100배 저렴한' 시대

들어가며2026년 3월 5일 조용히 출시된 GPT-5.4가 한 달여 만에 AI 업계의 가장 큰 화두가 됐습니다. 이유는 단 하나, GDPval 83%라는 수치입니다. 이 벤치마크는 숫자 하나 짜리 장난감이 아니라 "AI가 실제 직업 업무에서 인간 전문가와 경쟁할 수 있는가"를 44개 직군·9개 산업에 걸쳐 측정하는 OpenAI의 평가 체계입니다.1년 전 GPT-5.1은 같은 벤치마크에서 38.8%를 기록했습니다. 6개월 전 GPT-5.2가 70.9%로 올라섰고, 이제 GPT-5.4가 83%를 찍었습니다. 이는 7시간짜리 전문가 업무를 4.5시간 이상 단축하고, 같은 결과물을 인간 대비 100배 빠르고 100배 저렴하게 뽑아낸다는 OpenAI의 공식 주장을 뒷받침합니다.오늘 글은 이 수치가 실제로 무엇을 ..

최신 트렌드 2026.04.18

Claude Skills 완벽 가이드 - 프롬프트 반복에서 탈출하는 재사용 가능한 AI 워크플로우

들어가며2025년 12월 18일, Anthropic이 Agent Skills를 오픈 표준으로 공개했습니다. 4개월이 지난 지금(2026년 4월), 이 개념은 더 이상 Claude 전용이 아닙니다. OpenAI도 Skills 표준을 채택했고, Cursor 같은 IDE 에이전트도 호환 설계를 진행 중입니다. 공식 frontend-design skill 하나만 해도 27만 건 이상 설치되었습니다.그런데 막상 현업 개발자와 이야기해보면 여전히 "MCP와 Skills가 뭐가 다른지", "Subagent랑 헷갈린다", "Slash Command로 충분하지 않냐"는 질문이 많습니다. 저도 처음엔 그랬습니다. 기능이 비슷해 보이는 네 가지(Skills / MCP / Subagents / Commands)가 한꺼번에 쏟..

최신 트렌드 2026.04.17

OpenAI Codex 2026년 4월 대규모 업데이트 - 인앱 브라우저, Computer Use, GPT-5.3-Codex-Spark까지

들어가며2026년 4월 16일, OpenAI가 Codex 플랫폼을 대규모로 리뉴얼했습니다. 같은 날 Anthropic이 Claude Opus 4.7을 내놓은 것과 겹치면서 AI 코딩 도구 양대 산맥이 동시에 업데이트를 쏟아낸 셈입니다. Claude Opus 4.7 출시 완전 정리이번 Codex 업데이트의 핵심은 세 가지입니다. 첫째, 인앱 브라우저와 macOS computer-use가 내장돼 "코드 작성 → 브라우저 확인 → 네이티브 앱 테스트"가 Codex 안에서 완결됩니다. 둘째, GPT-5.3-Codex-Spark라는 실시간 코딩 전용 경량 모델이 등장해 1,000+ tok/s의 초고속 응답을 보여줍니다. 셋째, Memory 시스템이 프리뷰로 공개돼 세션 간 컨텍스트 이월이 가능해졌습니다.이 글에서..

최신 트렌드 2026.04.17

Claude Code + Codex 플러그인 실전 가이드 - AI 에이전트 크로스벤더 협업의 시작

들어가며2026년 3월 30일, 개발자 커뮤니티에 흥미로운 소식이 전해졌습니다. OpenAI가 경쟁사 Anthropic의 Claude Code에서 동작하는 공식 Codex 플러그인 openai/codex-plugin-cc를 GitHub에 공개한 것입니다. 경쟁 관계인 두 AI 회사의 제품이 하나의 워크플로우에서 협업하는 첫 공식 사례라는 점에서 큰 주목을 받고 있습니다.이 글에서는 실제로 이 플러그인을 설치하고 사용해본 경험을 바탕으로, 어떤 상황에서 유용한지, 어떻게 활용하면 좋은지를 정리합니다.1. 왜 주목해야 하는가단순히 새로운 플러그인이 나왔다는 것이 아닙니다. 핵심은 크로스벤더 에이전트 협업이라는 새로운 패러다임입니다.Claude가 코딩하고, Codex가 리뷰한다각 AI의 강점을 조합하여 더 높..

AI 2026.04.01