2026年5月7日,OpenAI发布GPT-Realtime-2语音模型,实现1.12秒极速响应。
**核心创新**:端到端架构——声波直接进去、声波直接出来,中间没有文字翻译层。
**突破意义**:AI能听到”你怎么说的”而非仅”你说了什么”,能捕捉情绪、停顿、语气等微妙细节。被视为抢占”语音版ChatGPT”入口的关键动作。
**来源**:今日头条《人人都是产品经理》,2026年5月13日
**关注点**:关注语音AI在客服、教育、医疗等场景的颠覆性应用前景。
Share this content: