2026.05.22 #01 생성형 AI 업데이트 브리핑

오늘의 결론
꼭 봐야 할 업데이트 TOP 7
서비스별 업데이트 정리
개발자/API 영향
업무 활용 포인트
비용/정책/제약 변경
추적할 업데이트
중복/제외 메모
Source links

기준 시각: 2026-05-22 10:00 KST · 조사 범위: OpenAI, Anthropic, Google Gemini/AI Studio, Runway, ElevenLabs, Perplexity, xAI 등 주요 생성형 AI 서비스 및 API 업데이트

오늘의 결론

오늘은 신규 모델보다 "에이전트형 워크플로우와 실시간 멀티모달 운영" 쪽 업데이트가 핵심이다. OpenAI는 Codex 작업 지속성과 Realtime Voice API를 강화했고, Google은 I/O 2026에서 Gemini 3.5 Flash와 Managed Agents를 전면에 세웠으며, Anthropic은 Claude Platform on AWS와 Managed Agents 기능을 확장했다. 영상/음성 쪽에서는 Runway Aleph 2.0, ElevenLabs API/워크스페이스 업데이트, xAI Grok Imagine 품질 모드가 실무 제작 파이프라인에 바로 영향을 준다.

꼭 봐야 할 업데이트 TOP 7

우선순위	회사/서비스	업데이트	유형	왜 중요한가	바로 할 일	판단 수준	출처
1	OpenAI / Codex	5월 21일 Codex에 Appshots, Goal mode GA, 브라우저 주석, locked computer use, 브라우저 사용 개선 추가	agent/tooling	장시간 개발 작업과 프론트엔드 피드백 루프가 더 운영형 자동화에 가까워짐	Codex 기반 자동화/프론트 QA 작업에 Goal mode와 브라우저 주석 적용 가능성 점검	공식	OpenAI ChatGPT Release Notes
2	Google Gemini / AI Studio / Antigravity	Google I/O 2026에서 Gemini 3.5 Flash GA, Antigravity 2.0, Gemini API Managed Agents 발표	모델/API/agent	Gemini가 단순 모델 호출보다 원격 환경 실행, 도구 호출, 웹 브라우징을 묶은 에이전트 API로 이동	Gemini API PoC가 있다면 Managed Agents/Interactions API 문서 확인	공식	Google I/O 2026 announcements
3	OpenAI Realtime API	GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper 공개	API/audio/multimodal	음성 에이전트가 reasoning, tool call, 실시간 번역, 스트리밍 전사를 한 흐름에서 처리	콜센터/회의록/다국어 음성 워크플로우에 가격과 지연시간 테스트	공식	OpenAI voice API announcement
4	Anthropic Claude Platform	Claude Platform on AWS, Opus 4.7 fast mode, Managed Agents multiagent sessions/outcomes/webhooks beta	API/enterprise/agent	AWS 과금/IAM 기반 Claude 사용과 에이전트 운영 이벤트 관리가 가능해짐	AWS 사용 조직은 인증/비용 경로와 beta header 의존성 확인	공식	Anthropic Claude Platform release notes
5	Runway	Aleph 2.0 + Edit Studio 출시	video/editing	30초 1080p 클립, 국소 편집, 프레임 기반 제어, 멀티샷 편집으로 마케팅 영상 반복 제작 비용을 낮춤	기존 캠페인 영상 변형 작업에 Runway 테스트 후보 추가	공식	Runway announcement
6	ElevenLabs	5월 18일/13일 ElevenAgents, Workspaces, Voice Isolator, API endpoint/schema 업데이트	audio/API/enterprise	에이전트 지식베이스, 통화/SIP, 워크스페이스 분석, 음성 품질 관리 쪽 운영 기능이 계속 확장	사용 중인 SDK 버전과 endpoint 변경, 품질 preset 변경 여부 확인	공식	ElevenLabs changelog
7	Perplexity / xAI	Perplexity Agent API `finance_search`, xAI Grok model retirement 및 Grok Imagine Quality Mode API	API/tooling/cost	검색형 에이전트의 구조화 금융 데이터 접근과 Grok 모델 slug/가격 변화가 자동화 비용·호환성에 영향	Perplexity Agent API 사용 시 finance_search 권한 확인, xAI 구형 slug 사용 여부 점검	공식	Perplexity changelog, xAI docs/news

서비스별 업데이트 정리

회사/서비스	업데이트 요약	영향 대상(사용자/개발자/기업)	한국 사용자 영향	확인 상태	출처
OpenAI ChatGPT/Codex	Codex Appshots, Goal mode GA, 브라우저 주석, locked computer use, 브라우저 사용성 개선	개발자, 프론트엔드 작업자, 자동화 운영자	Codex Desktop 기반 로컬 작업 자동화에 직접 영향	공식	https://help.openai.com/en/articles/6825453-release-notes
OpenAI API	GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper 제공. GPT-Realtime-2는 128K 컨텍스트와 reasoning effort 조절 지원	개발자, 음성 서비스팀, 엔터프라이즈	한국어 입력/다국어 번역 워크플로우 실험 가치 큼	공식	https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/
Anthropic Claude Platform	Claude Platform on AWS, Opus 4.7 fast mode, Managed Agents multiagent sessions/outcomes/webhooks beta	개발자, AWS 사용 기업, 에이전트 운영팀	AWS 계정/IAM으로 Claude API를 쓰는 구조가 필요할 때 선택지 확대	공식	https://platform.claude.com/docs/en/release-notes/overview
Google Gemini / AI Studio	Gemini 3.5 Flash GA, Antigravity 2.0, Gemini API Managed Agents, AI Studio Android vibe coding 발표	개발자, 모바일 앱팀, agent builder	Android/Google Cloud 생태계 중심 팀에 영향 큼	공식	https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/
Runway	Aleph 2.0과 Edit Studio로 30초 1080p 영상 편집, 국소 편집, 이미지 수준 제어, 멀티샷 편집 지원	콘텐츠/마케팅/영상 제작팀	광고 소재 현지화·변형 제작에 실무 영향	공식	https://runwayml.com/news/introducing-aleph-2-and-edit-studio
ElevenLabs	ElevenAgents/Workspaces/Voice Isolator/API changelog: 워크스페이스 분석 요청, RAG chunk 조회, 파일 업데이트, agent versioning 기본값 변경 등	음성 에이전트 개발자, CX 팀, 엔터프라이즈	한국어 음성봇 운영 시 SDK/API 변경 확인 필요	공식	https://elevenlabs.io/docs/changelog
Perplexity	Agent API에 `finance_search` tool 추가	개발자, 리서치/투자 자동화 사용자	금융 리서치 자동화에서 구조화 데이터 호출 가능성 증가	공식	https://docs.perplexity.ai/docs/resources/changelog
xAI Grok	5월 15일 구형 Grok 모델 retirement 및 redirect, Grok Imagine Quality Mode API 출시	Grok API 개발자, 이미지 생성 사용자	구형 slug 사용 시 가격/동작 변경 확인 필요	공식	https://docs.x.ai/developers/migration/may-15-retirement

개발자/API 영향

API/SDK/모델	변경 내용	마이그레이션 필요 여부	비용/제약 변화	체크할 코드/설정	출처
OpenAI `gpt-realtime-2`	Realtime voice reasoning, parallel tool calls, 128K context, reasoning effort 조절	신규 도입형. 기존 Realtime 앱은 모델 교체 테스트 필요	audio input/output token 단가 존재. high/xhigh reasoning은 지연/비용 확인 필요	model slug, session config, tool call logging, safety guardrail	OpenAI voice API
OpenAI `gpt-realtime-translate` / `gpt-realtime-whisper`	실시간 번역과 스트리밍 전사 모델 추가	음성 번역/회의록 파이프라인은 신규 endpoint 적용 검토	분당 과금 모델	언어 지원, fallback, 저장/개인정보 정책	OpenAI voice API
Anthropic Claude Platform on AWS	AWS billing/IAM으로 Anthropic-managed Claude API 사용	AWS 표준 통제 체계가 필요한 조직은 검토 가치 큼	AWS 경유 과금·권한 모델 확인 필요	IAM, endpoint, Files API/Managed Agents 권한	Anthropic release notes
Anthropic Managed Agents	multiagent sessions, outcomes, webhooks public beta	beta header 의존. 운영 자동화는 안정성 확인 필요	beta 기능, header 변경 리스크	`managed-agents-2026-04-01`, webhook receiver, vault credentials	Anthropic release notes
Gemini API Managed Agents	Antigravity agent가 원격 Linux 환경에서 reasoning, tool call, code/file 실행, web browsing	신규 API. 기존 Gemini 호출과 구조 다름	원격 실행/브라우징 비용 정책 확인 필요	Interactions API, sandbox 권한, web browsing 정책	Google I/O developer highlights
ElevenLabs API	RAG chunk 조회, 문서 파일 업데이트, workspace analytics, agent versioning 기본값 변경	일부 endpoint/schema 영향 있음	SDK 버전 고정 시 breaking-like behavior 가능	agent versioning, widget file upload, quality preset `highest` 제거 여부	ElevenLabs changelog
Perplexity Agent API `finance_search`	quotes, financials, earnings, estimates, ETF 구성 등 구조화 금융 데이터 tool	Agent API 사용자만 적용	tool 사용량/권한 확인 필요	`/v1/agent`, tool allowlist, 응답 schema	Perplexity changelog
xAI Grok retired slugs	구형 Grok 모델 slug가 `grok-4.3` 또는 `grok-build-0.1`로 redirect	구형 slug 사용자는 명시 slug 전환 권장	redirect 후 가격이 달라질 수 있음	`model` 값, reasoning effort, 비용 모니터링	xAI migration docs

업무 활용 포인트

업데이트	적용 가능한 업무	기대효과	주의점	다음 액션
Codex Goal mode/Appshots/browser annotations	프론트엔드 QA, 로컬 앱 디버깅, 장시간 코드 수정	작업 목표와 화면 맥락을 더 적게 설명해도 됨	Mac/앱 권한과 remote locked use 지역 제약 확인	반복 프론트 QA 태스크에 목표/성공 조건 템플릿 만들기
Gemini Managed Agents	코드 생성, 원격 실행, 리서치 자동화	API 한 번으로 실행 환경+도구+브라우징을 엮는 방향	sandbox 보안, 비용, 로그 보존 정책 필요	기존 Gemini PoC와 Antigravity 2.0 비교
OpenAI Realtime Voice	콜센터, 실시간 통역, 현장 업무 가이드, 회의록	음성 입력을 바로 tool/action으로 연결	개인정보/녹취 동의, 정책 준수 필요	한국어 음성 샘플로 latency/정확도 테스트
Runway Aleph 2.0	광고 소재 변형, 숏폼 현지화, 제품 영상 수정	기존 영상을 다시 찍지 않고 국소 수정	저작권/모델 결과 검수 필요	한 개 기존 영상으로 Edit Studio 테스트
ElevenLabs API/Workspace	음성 에이전트 운영, RAG 기반 상담봇	지식베이스 검색/분석/버전 운영 개선	SDK와 endpoint 변경 추적 필요	현재 SDK 버전 lock 및 changelog diff 점검

비용/정책/제약 변경

항목	변경/주의점	영향	대응
OpenAI Realtime API	GPT-Realtime-2는 audio token 과금, Translate/Whisper는 분당 과금	음성 에이전트 비용 산정 방식이 텍스트 API와 다름	파일럿 전 평균 통화시간, 캐시 입력, reasoning effort별 비용 산정
xAI Grok retirement	5월 15일 이후 구형 모델 slug가 새 모델로 redirect되고 가격이 달라질 수 있음	코드가 깨지지 않아도 비용/품질이 변할 수 있음	explicit model migration과 비용 모니터링
ElevenLabs schema	dialogue quality preset의 `highest` 제거, agent versioning 기본값 변화 등	오래된 클라이언트/설정에서 예상과 다른 동작 가능	SDK 업데이트 전 staging 테스트
Anthropic beta features	Managed Agents 기능은 beta header 기반	운영 자동화에 바로 넣을 때 안정성 리스크	beta header와 fallback 경로 분리

추적할 업데이트

항목	상태	확인할 다음 출처	재확인 시점
Gemini 3.5 Pro	Google이 내부 사용 중이며 다음 달 출시 예정이라고 언급	Google AI/Gemini API release notes	2026-06 첫째 주
Anthropic Managed Agents beta	multiagent sessions/outcomes/webhooks가 public beta	Anthropic Platform release notes	다음 changelog 갱신 시
xAI Grok retired slug redirect 품질/가격	redirect 후 실사용 비용 변화 가능	xAI models/migration docs 및 청구 대시보드	오늘 이후 API 사용량 발생 시
OpenAI Realtime Voice 한국어 품질	공식 발표는 다국어 지원을 포함하지만 실제 한국어 성능은 업무별 테스트 필요	OpenAI docs, 자체 샘플 테스트	PoC 실행 후

중복/제외 메모

Anthropic Claude 앱 release notes의 과거 항목, Cohere의 4월 모델 retirement, Mistral 3 페이지처럼 오늘 기준 신규성이 낮거나 날짜 확인이 약한 항목은 TOP 7에서 제외했다.
언론/소셜 단독 보도는 핵심 근거로 쓰지 않았다.

Source links

OpenAI ChatGPT Release Notes: https://help.openai.com/en/articles/6825453-release-notes
OpenAI Realtime Voice API announcement: https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/
Anthropic Claude Platform release notes: https://platform.claude.com/docs/en/release-notes/overview
Google I/O 2026 announcements: https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/
Google I/O developer highlights: https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-developer-highlights/
Runway Aleph 2.0 and Edit Studio: https://runwayml.com/news/introducing-aleph-2-and-edit-studio
ElevenLabs changelog: https://elevenlabs.io/docs/changelog
Perplexity changelog: https://docs.perplexity.ai/docs/resources/changelog
xAI Grok model retirement: https://docs.x.ai/developers/migration/may-15-retirement
xAI Grok Connectors: https://x.ai/news/grok-connectors
xAI Grok Imagine Quality Mode API: https://x.ai/news/grok-imagine-quality-mode