목차
기준 시각: 2026-05-22 10:00 KST · 조사 범위: OpenAI, Anthropic, Google Gemini/AI Studio, Runway, ElevenLabs, Perplexity, xAI 등 주요 생성형 AI 서비스 및 API 업데이트
오늘의 결론
오늘은 신규 모델보다 "에이전트형 워크플로우와 실시간 멀티모달 운영" 쪽 업데이트가 핵심이다. OpenAI는 Codex 작업 지속성과 Realtime Voice API를 강화했고, Google은 I/O 2026에서 Gemini 3.5 Flash와 Managed Agents를 전면에 세웠으며, Anthropic은 Claude Platform on AWS와 Managed Agents 기능을 확장했다. 영상/음성 쪽에서는 Runway Aleph 2.0, ElevenLabs API/워크스페이스 업데이트, xAI Grok Imagine 품질 모드가 실무 제작 파이프라인에 바로 영향을 준다.
꼭 봐야 할 업데이트 TOP 7
| 우선순위 | 회사/서비스 | 업데이트 | 유형 | 왜 중요한가 | 바로 할 일 | 판단 수준 | 출처 |
|---|---|---|---|---|---|---|---|
| 1 | OpenAI / Codex | 5월 21일 Codex에 Appshots, Goal mode GA, 브라우저 주석, locked computer use, 브라우저 사용 개선 추가 | agent/tooling | 장시간 개발 작업과 프론트엔드 피드백 루프가 더 운영형 자동화에 가까워짐 | Codex 기반 자동화/프론트 QA 작업에 Goal mode와 브라우저 주석 적용 가능성 점검 | 공식 | OpenAI ChatGPT Release Notes |
| 2 | Google Gemini / AI Studio / Antigravity | Google I/O 2026에서 Gemini 3.5 Flash GA, Antigravity 2.0, Gemini API Managed Agents 발표 | 모델/API/agent | Gemini가 단순 모델 호출보다 원격 환경 실행, 도구 호출, 웹 브라우징을 묶은 에이전트 API로 이동 | Gemini API PoC가 있다면 Managed Agents/Interactions API 문서 확인 | 공식 | Google I/O 2026 announcements |
| 3 | OpenAI Realtime API | GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper 공개 | API/audio/multimodal | 음성 에이전트가 reasoning, tool call, 실시간 번역, 스트리밍 전사를 한 흐름에서 처리 | 콜센터/회의록/다국어 음성 워크플로우에 가격과 지연시간 테스트 | 공식 | OpenAI voice API announcement |
| 4 | Anthropic Claude Platform | Claude Platform on AWS, Opus 4.7 fast mode, Managed Agents multiagent sessions/outcomes/webhooks beta | API/enterprise/agent | AWS 과금/IAM 기반 Claude 사용과 에이전트 운영 이벤트 관리가 가능해짐 | AWS 사용 조직은 인증/비용 경로와 beta header 의존성 확인 | 공식 | Anthropic Claude Platform release notes |
| 5 | Runway | Aleph 2.0 + Edit Studio 출시 | video/editing | 30초 1080p 클립, 국소 편집, 프레임 기반 제어, 멀티샷 편집으로 마케팅 영상 반복 제작 비용을 낮춤 | 기존 캠페인 영상 변형 작업에 Runway 테스트 후보 추가 | 공식 | Runway announcement |
| 6 | ElevenLabs | 5월 18일/13일 ElevenAgents, Workspaces, Voice Isolator, API endpoint/schema 업데이트 | audio/API/enterprise | 에이전트 지식베이스, 통화/SIP, 워크스페이스 분석, 음성 품질 관리 쪽 운영 기능이 계속 확장 | 사용 중인 SDK 버전과 endpoint 변경, 품질 preset 변경 여부 확인 | 공식 | ElevenLabs changelog |
| 7 | Perplexity / xAI | Perplexity Agent API finance_search, xAI Grok model retirement 및 Grok Imagine Quality Mode API |
API/tooling/cost | 검색형 에이전트의 구조화 금융 데이터 접근과 Grok 모델 slug/가격 변화가 자동화 비용·호환성에 영향 | Perplexity Agent API 사용 시 finance_search 권한 확인, xAI 구형 slug 사용 여부 점검 | 공식 | Perplexity changelog, xAI docs/news |
서비스별 업데이트 정리
| 회사/서비스 | 업데이트 요약 | 영향 대상(사용자/개발자/기업) | 한국 사용자 영향 | 확인 상태 | 출처 |
|---|---|---|---|---|---|
| OpenAI ChatGPT/Codex | Codex Appshots, Goal mode GA, 브라우저 주석, locked computer use, 브라우저 사용성 개선 | 개발자, 프론트엔드 작업자, 자동화 운영자 | Codex Desktop 기반 로컬 작업 자동화에 직접 영향 | 공식 | https://help.openai.com/en/articles/6825453-release-notes |
| OpenAI API | GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper 제공. GPT-Realtime-2는 128K 컨텍스트와 reasoning effort 조절 지원 | 개발자, 음성 서비스팀, 엔터프라이즈 | 한국어 입력/다국어 번역 워크플로우 실험 가치 큼 | 공식 | https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/ |
| Anthropic Claude Platform | Claude Platform on AWS, Opus 4.7 fast mode, Managed Agents multiagent sessions/outcomes/webhooks beta | 개발자, AWS 사용 기업, 에이전트 운영팀 | AWS 계정/IAM으로 Claude API를 쓰는 구조가 필요할 때 선택지 확대 | 공식 | https://platform.claude.com/docs/en/release-notes/overview |
| Google Gemini / AI Studio | Gemini 3.5 Flash GA, Antigravity 2.0, Gemini API Managed Agents, AI Studio Android vibe coding 발표 | 개발자, 모바일 앱팀, agent builder | Android/Google Cloud 생태계 중심 팀에 영향 큼 | 공식 | https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/ |
| Runway | Aleph 2.0과 Edit Studio로 30초 1080p 영상 편집, 국소 편집, 이미지 수준 제어, 멀티샷 편집 지원 | 콘텐츠/마케팅/영상 제작팀 | 광고 소재 현지화·변형 제작에 실무 영향 | 공식 | https://runwayml.com/news/introducing-aleph-2-and-edit-studio |
| ElevenLabs | ElevenAgents/Workspaces/Voice Isolator/API changelog: 워크스페이스 분석 요청, RAG chunk 조회, 파일 업데이트, agent versioning 기본값 변경 등 | 음성 에이전트 개발자, CX 팀, 엔터프라이즈 | 한국어 음성봇 운영 시 SDK/API 변경 확인 필요 | 공식 | https://elevenlabs.io/docs/changelog |
| Perplexity | Agent API에 finance_search tool 추가 |
개발자, 리서치/투자 자동화 사용자 | 금융 리서치 자동화에서 구조화 데이터 호출 가능성 증가 | 공식 | https://docs.perplexity.ai/docs/resources/changelog |
| xAI Grok | 5월 15일 구형 Grok 모델 retirement 및 redirect, Grok Imagine Quality Mode API 출시 | Grok API 개발자, 이미지 생성 사용자 | 구형 slug 사용 시 가격/동작 변경 확인 필요 | 공식 | https://docs.x.ai/developers/migration/may-15-retirement |
개발자/API 영향
| API/SDK/모델 | 변경 내용 | 마이그레이션 필요 여부 | 비용/제약 변화 | 체크할 코드/설정 | 출처 |
|---|---|---|---|---|---|
OpenAI gpt-realtime-2 |
Realtime voice reasoning, parallel tool calls, 128K context, reasoning effort 조절 | 신규 도입형. 기존 Realtime 앱은 모델 교체 테스트 필요 | audio input/output token 단가 존재. high/xhigh reasoning은 지연/비용 확인 필요 | model slug, session config, tool call logging, safety guardrail | OpenAI voice API |
OpenAI gpt-realtime-translate / gpt-realtime-whisper |
실시간 번역과 스트리밍 전사 모델 추가 | 음성 번역/회의록 파이프라인은 신규 endpoint 적용 검토 | 분당 과금 모델 | 언어 지원, fallback, 저장/개인정보 정책 | OpenAI voice API |
| Anthropic Claude Platform on AWS | AWS billing/IAM으로 Anthropic-managed Claude API 사용 | AWS 표준 통제 체계가 필요한 조직은 검토 가치 큼 | AWS 경유 과금·권한 모델 확인 필요 | IAM, endpoint, Files API/Managed Agents 권한 | Anthropic release notes |
| Anthropic Managed Agents | multiagent sessions, outcomes, webhooks public beta | beta header 의존. 운영 자동화는 안정성 확인 필요 | beta 기능, header 변경 리스크 | managed-agents-2026-04-01, webhook receiver, vault credentials |
Anthropic release notes |
| Gemini API Managed Agents | Antigravity agent가 원격 Linux 환경에서 reasoning, tool call, code/file 실행, web browsing | 신규 API. 기존 Gemini 호출과 구조 다름 | 원격 실행/브라우징 비용 정책 확인 필요 | Interactions API, sandbox 권한, web browsing 정책 | Google I/O developer highlights |
| ElevenLabs API | RAG chunk 조회, 문서 파일 업데이트, workspace analytics, agent versioning 기본값 변경 | 일부 endpoint/schema 영향 있음 | SDK 버전 고정 시 breaking-like behavior 가능 | agent versioning, widget file upload, quality preset highest 제거 여부 |
ElevenLabs changelog |
Perplexity Agent API finance_search |
quotes, financials, earnings, estimates, ETF 구성 등 구조화 금융 데이터 tool | Agent API 사용자만 적용 | tool 사용량/권한 확인 필요 | /v1/agent, tool allowlist, 응답 schema |
Perplexity changelog |
| xAI Grok retired slugs | 구형 Grok 모델 slug가 grok-4.3 또는 grok-build-0.1로 redirect |
구형 slug 사용자는 명시 slug 전환 권장 | redirect 후 가격이 달라질 수 있음 | model 값, reasoning effort, 비용 모니터링 |
xAI migration docs |
업무 활용 포인트
| 업데이트 | 적용 가능한 업무 | 기대효과 | 주의점 | 다음 액션 |
|---|---|---|---|---|
| Codex Goal mode/Appshots/browser annotations | 프론트엔드 QA, 로컬 앱 디버깅, 장시간 코드 수정 | 작업 목표와 화면 맥락을 더 적게 설명해도 됨 | Mac/앱 권한과 remote locked use 지역 제약 확인 | 반복 프론트 QA 태스크에 목표/성공 조건 템플릿 만들기 |
| Gemini Managed Agents | 코드 생성, 원격 실행, 리서치 자동화 | API 한 번으로 실행 환경+도구+브라우징을 엮는 방향 | sandbox 보안, 비용, 로그 보존 정책 필요 | 기존 Gemini PoC와 Antigravity 2.0 비교 |
| OpenAI Realtime Voice | 콜센터, 실시간 통역, 현장 업무 가이드, 회의록 | 음성 입력을 바로 tool/action으로 연결 | 개인정보/녹취 동의, 정책 준수 필요 | 한국어 음성 샘플로 latency/정확도 테스트 |
| Runway Aleph 2.0 | 광고 소재 변형, 숏폼 현지화, 제품 영상 수정 | 기존 영상을 다시 찍지 않고 국소 수정 | 저작권/모델 결과 검수 필요 | 한 개 기존 영상으로 Edit Studio 테스트 |
| ElevenLabs API/Workspace | 음성 에이전트 운영, RAG 기반 상담봇 | 지식베이스 검색/분석/버전 운영 개선 | SDK와 endpoint 변경 추적 필요 | 현재 SDK 버전 lock 및 changelog diff 점검 |
비용/정책/제약 변경
| 항목 | 변경/주의점 | 영향 | 대응 |
|---|---|---|---|
| OpenAI Realtime API | GPT-Realtime-2는 audio token 과금, Translate/Whisper는 분당 과금 | 음성 에이전트 비용 산정 방식이 텍스트 API와 다름 | 파일럿 전 평균 통화시간, 캐시 입력, reasoning effort별 비용 산정 |
| xAI Grok retirement | 5월 15일 이후 구형 모델 slug가 새 모델로 redirect되고 가격이 달라질 수 있음 | 코드가 깨지지 않아도 비용/품질이 변할 수 있음 | explicit model migration과 비용 모니터링 |
| ElevenLabs schema | dialogue quality preset의 highest 제거, agent versioning 기본값 변화 등 |
오래된 클라이언트/설정에서 예상과 다른 동작 가능 | SDK 업데이트 전 staging 테스트 |
| Anthropic beta features | Managed Agents 기능은 beta header 기반 | 운영 자동화에 바로 넣을 때 안정성 리스크 | beta header와 fallback 경로 분리 |
추적할 업데이트
| 항목 | 상태 | 확인할 다음 출처 | 재확인 시점 |
|---|---|---|---|
| Gemini 3.5 Pro | Google이 내부 사용 중이며 다음 달 출시 예정이라고 언급 | Google AI/Gemini API release notes | 2026-06 첫째 주 |
| Anthropic Managed Agents beta | multiagent sessions/outcomes/webhooks가 public beta | Anthropic Platform release notes | 다음 changelog 갱신 시 |
| xAI Grok retired slug redirect 품질/가격 | redirect 후 실사용 비용 변화 가능 | xAI models/migration docs 및 청구 대시보드 | 오늘 이후 API 사용량 발생 시 |
| OpenAI Realtime Voice 한국어 품질 | 공식 발표는 다국어 지원을 포함하지만 실제 한국어 성능은 업무별 테스트 필요 | OpenAI docs, 자체 샘플 테스트 | PoC 실행 후 |
중복/제외 메모
- Anthropic Claude 앱 release notes의 과거 항목, Cohere의 4월 모델 retirement, Mistral 3 페이지처럼 오늘 기준 신규성이 낮거나 날짜 확인이 약한 항목은 TOP 7에서 제외했다.
- 언론/소셜 단독 보도는 핵심 근거로 쓰지 않았다.
Source links
- OpenAI ChatGPT Release Notes: https://help.openai.com/en/articles/6825453-release-notes
- OpenAI Realtime Voice API announcement: https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/
- Anthropic Claude Platform release notes: https://platform.claude.com/docs/en/release-notes/overview
- Google I/O 2026 announcements: https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/
- Google I/O developer highlights: https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-developer-highlights/
- Runway Aleph 2.0 and Edit Studio: https://runwayml.com/news/introducing-aleph-2-and-edit-studio
- ElevenLabs changelog: https://elevenlabs.io/docs/changelog
- Perplexity changelog: https://docs.perplexity.ai/docs/resources/changelog
- xAI Grok model retirement: https://docs.x.ai/developers/migration/may-15-retirement
- xAI Grok Connectors: https://x.ai/news/grok-connectors
- xAI Grok Imagine Quality Mode API: https://x.ai/news/grok-imagine-quality-mode