OpenAI成功为自己制造了危机

2024-12-23 13:23:22
浏览次数:
返回列表

  OpenAI将一场原本可以2个小时讲完的发布会,拆成了12天,每天讲15分钟左右。这场精心策划的营销盛宴,给人制造了一种“生怕错过”的紧迫感。

  然而,本以为可以吊足观众的胃口,但它成为了对手的靶子。在过去12天里,Google从未如此积极、密集地发布自家AI产品进展。每一次都是对OpenAI的狠狠狙击。

  在此期间,Google先是发布了自己大语言模型Gemini 2.0,在外媒评测中,其在多模态能力和处理速度上相比openai的GPT-o1已经有明显优势。

  接着,Google又发布了对标Sora的视频生成模型Veo 2,在实测中被认为很多方面好于Sora。比如,Voe 2 在生成视频的真实感和细节上更强,而Sora 在这些方面的表现相对较弱,更容易出现不自然的动作和物体;比如,Voe 2 可以让用户通过简单的提示来指定更多镜头类型和拍摄方式,使得视频生成过程更加灵活。

  即便在第12天,OpenAI一扫此前11天的平淡,发布了新一代模型 GPT-o3,在各方面的性能上逼近AGI(通用人工智能),但用户并不买账。人们认为,GPT-o3依旧是“期货”,如同曾经的sora一样,短期内无法向用户开放。

  不能说OpenAI不强了,它在3个月内连续发布两个顶尖模型GPT-o1、GPT-o3,但奈何被对手们步步逼近。

  曾经断层式领先的OpenAI,在2年的时间里从“神”变为了“优秀”,逐渐和越来越多的对手们站在了同一条起跑线上,甚至开始被超越。

  为了尽快提高营收,OpenAI 首席商务官 Lionetti 表示,该公司一直在试图与医疗保健、制造业和法律公司、教育等行业客户达成合作。比如,OpenAI在今年5月发布了面向校园的 ChatGPT EDU,还招聘了美国在线教育巨头Coursera 的前高管,担任其教育业务负责人。

  OpenAI从万众期待,到期望落空,再到市场份额迅速丢失,局面的急剧扭转是怎么发生的?

  就在OpenAI为期12天的漫长发布会期间,据the information报道,又有两位核心人物从OpenAI离职。

  伴随着他的离职,GPT-1、GPT-2两代模型的核心论文作者已经全部离开OpenAI。

  在此之前,2022年12月1日,ChatGPT发布,2个月用户数突破1亿,全球互联网行业沸腾了,共识迅速达成:这是新时代的号角。于是,科技巨头、创业公司们集体追赶openai。截至2024年第一季度,全球人工智能大模型的数量已达到 1328个。其中,美国的占比最高,约 44%,中国则占 36%。

  到2023年3月14日,OpenAI发布GPT-4,再次惊艳了世界,它的每一次更新迭代都在刷新着人们对AI的认知边界,它就是AI行业的灯塔。

  他们极少数是自己创业,大多数则是加入了OpenAI的竞争对手,比如谷歌、亚马逊、anthropic、xAI、META、微软等等。

  密切参与硅谷顶尖人才招聘的Databricks 的 AI 副总裁Naveen Rao最近在接受访谈时表示,随着顶尖人才频繁地在不同组织之间流动,几乎不再存在什么商业秘密了。

  他是一位连续创业者,在将上一家公司 MosaicML 于 2023 年以 13 亿美元的价格卖给了 Databricks后,他开始负责 Databricks 的 AI 产品。数据分析公司Databricks在本月刚刚完成了硅谷历史上最大一笔融资,100亿美元。

  在他看来,全球真正能够建立新的前沿大模型的研究人员数量小于1000人,这也是为何这些顶尖人才的争夺战如此激烈的原因。极少有一个行业,顶尖人才能够如此频繁地跳槽,“供不应求”的局面给了他们更大的自由和权力。

  Naveen Rao说,在大模型赛道,研究人员在组织中拥有的影响力是前所未有的,一个研究人员的想法可以完全改变产品,对一家公司的未来产生巨大影响。

  OpenAI核心人员的大量出走,无疑一边将崛起的秘密和影响力带给了对手,也一边瓦解了OpenAI的商业壁垒。

  在OpenAI连续举办了12天发布会的最后一天——这个本应是“大喜”的日子,华尔街日报却披露了一则重磅消息:GPT-5的研发进展受阻。

  据报道,自2023年3月GPT-4发布以来,OpenAI一直在全力推进GPT-5的研发工作。GPT-5项目的内部代号为Orion,至今已筹备了18个月之久。

  作为OpenAI的最大投资者,微软原本希望能够在今年年中看到新模型的问世,但这一目标并未实现。

  OpenAI已经进行了至少两轮大规模训练,每轮训练都需要几个月时间处理海量的数据,而每一次训练都会遇到新的技术难题。知情人士透露,单是六个月的训练运行,计算成本可能已经达到约5亿美元。如今,是否值得投入如此巨额的资金,已经让人动摇。

  此外,大模型训练所需的数据一般来自于书籍、学术出版物、新闻文章、社交媒体帖子等各种渠道。经验表明,给大模型输入的数据越多,它的智能表现就越好。然而,参与Orion项目的研究人员表示,现有的互联网数据已经不再足够,他们需要更加多样化和高质量的数据。

  这一观点与OpenAI已经离职的联合创始人Ilya Sutskever的看法一致,他曾指出,互联网上的数据接近枯竭。

  有知情人士透露,OpenAI甚至开始探索所谓的“合成数据”——即由人工智能生成的数据,用以训练Orion。然而,研究表明,人工智能生成的数据往往会导致系统故障或产生无意义的回答。

  为了训练大模型,行业急需新的解决方案,但什么方法才是最佳选择,业内依然没有达成共识。正如Ilya所言,“在过去十年的AI预测中,我几乎一直是对的,但现在,我完全不知道下一步会发生什么。”

  尽管如此,部分业内人士认为,尽管大模型的能力发展可能面临瓶颈,但我们不必因此而过度焦虑。如今的大模型已经远超过去的AI技术,它们依然能够显著改变商业运营,甚至重塑整个行业竞争格局。

  有AI投资人认为,AI的传播热度或许在下降,但AI领域每个月都有新的进展,大模型正在逐渐深入到不同场景和行业中,这些可能不那么容易出现在大众视野里。

  可以说,现在正是人工智能产业的黄金时代,但OpenAI面临的挑战和危机,确实比以往更多了。

搜索