智人飞扬

探索强化学习:概述与核心概念

强化学习(Reinforcement Learning,简称 RL)是一种极具威力的机器学习方法,在机器人控制、游戏、自动化系统等众多领域都有广泛应用。本文将深入探讨强化学习的关键概念与基础原理,帮助大家全面理解其本质、在人工智能中的重要地位,以及它与其他学习方法之间的区别。 什么是强化学习? 强化学习的核心思想是让智能体通过与环境不断交互,从而学会做出决策。智能体的目标是通过选择合适的...

Y Combinator 2025 创业机遇:14 个 AI 新时代的黄金赛道 [译]

引言 过去几个月的 AI 突破解锁了一波新的创业机会。我们过去每年最多发布一次创业项目需求,但这次我们决定在上一次发布仅 3 个月后就发布这个清单,以帮助创业者找到刚刚出现的创意空间。 你可能已经关注了这些想法背后的最新进展。通过 Operator 和 Computer Use,AI 系统现在可以使用计算机。像 OpenAI 的 o1/o3 和 Deepseek R1 这样的推理模型使构...

CES 2025:NVIDIA CEO 表示 AI 正以「惊人速度」发展 [译]

NVIDIA 创始人兼 CEO 黄仁勋在 CES 2025 上发表了 90 分钟的主题演讲,介绍了推动游戏、自动驾驶汽车、机器人和智能 AI 发展的新产品。 他在拉斯维加斯 Michelob Ultra Arena 向超过 6000 名观众表示,AI「正以惊人的速度发展」。 「这始于感知型 AI — 理解图像、文字和声音。然后是生成式 AI — 创造文本、图像和声音」,黄仁勋说道,「现在...

反思 - Sam Altman [译]

ChatGPT 迎来两岁生日才过去一个多月,我们已经迈入了新的范式,AI 模型可以进行复杂推理了。新年总会让人心生感慨,我想分享一些个人的思考,以及这一路走来的收获。 随着我们离 AGI 越来越近,现在似乎是回顾公司发展历程的好时机。还有很多东西需要理解,还有很多未知的领域,而且我们依然处于早期阶段。但比起刚开始时,我们已经懂得更多了。 近九年前我们创立了 OpenAI,因为我们相信 A...

2024 年我们对大语言模型的认知 [译]

在 2024 年「大语言模型」领域发生了很多事情。以下是过去 12 个月我们在这个领域的发现,以及我对关键主题和重要时刻的总结。 这是对我的 2023 年回顾的续篇。 本文内容: GPT-4 的门槛被彻底打破了 部分 GPT-4 级别的模型可以在我的笔记本电脑上运行 由于竞争和效率提升,LLM 价格大幅下跌 多模态视觉能力已经普及,语音和视频也开始涌现 语音和实时...

构建高效智能体:Anthropic 实践指南 [译]

构建高效智能体 过去一年,我们与数十个团队合作,帮助他们在不同行业构建大语言模型(LLM)智能体。我们发现,最成功的实现并非依赖复杂的框架或专门的库,而是采用简单、可组合的模式。 本文将分享我们从客户合作和自身智能体开发中获得的经验,为开发者提供构建高效智能体的实用建议。 什么是智能体? 「智能体」可以有多种定义。一些客户将智能体定义为能够长期独立运行、使用各种工具完成复杂任务的完全...

2025 年 AI 工程师必读清单 [译]

自从我们写了关于论文俱乐部的文章后,经常有人问我们:对于那些在工作中或与朋友一起从零开始的人,有什么推荐的阅读清单?我们最初参考了2023 年的 a16z 规范,但它需要 2025 年的更新,而且需要更注重实践。 在这里,我们为 AI 工程师精选「必读」论文。我们的设计目标是: 选择约 50 篇论文(约一年每周一篇),可选择额外补充。这是一个任意的限制。 ...

OpenAI o3 在 ARC-AGI-Pub 上取得突破性高分 [译]

OpenAI 的新系统 o3 —— 在 ARC-AGI-1 公共训练集上训练 —— 在我们的公开排行榜上,在 $10k 计算限制下,对半私有评估集取得了突破性的 75.7% 高分。高计算量(172 倍)o3 配置的得分为 87.5%。 这是 AI 能力的一个令人惊讶且重要的阶跃式提升,展示了 GPT 系列模型前所未见的新颖任务适应能力。作为背景,ARC-AGI-1 从 2020 年 G...

OpenAI 发布 o1 模型与开发者新工具 [译]

今天,我们推出了一系列重要更新:性能更强的模型、全新的定制工具,以及多项升级功能,这些都将帮助开发者构建性能更优、更灵活且更具成本效益的 AI 应用。主要包括: OpenAI o1 API:支持函数调用、开发者消息、结构化输出和视觉处理能力。 实时 API 更新:引入简化的 WebRTC 集成、GPT-4o 音频价格降低 60%,并推出更经济的 GPT-...