探索强化学习：概述与核心概念

强化学习（Reinforcement Learning，简称 RL）是一种极具威力的机器学习方法，在机器人控制、游戏、自动化系统等众多领域都有广泛应用。本文将深入探讨强化学习的关键概念与基础原理，帮助大家全面理解其本质、在人工智能中的重要地位，以及它与其他学习方法之间的区别。什么是强化学习？强化学习的核心思想是让智能体通过与环境不断交互，从而学会做出决策。智能体的目标是通过选择合适的...

2025/02/04 人工智能, 技术前沿

Y Combinator 2025 创业机遇：14 个 AI 新时代的黄金赛道 [译]

引言过去几个月的 AI 突破解锁了一波新的创业机会。我们过去每年最多发布一次创业项目需求，但这次我们决定在上一次发布仅 3 个月后就发布这个清单，以帮助创业者找到刚刚出现的创意空间。你可能已经关注了这些想法背后的最新进展。通过 Operator 和 Computer Use，AI 系统现在可以使用计算机。像 OpenAI 的 o1/o3 和 Deepseek R1 这样的推理模型使构...

2025/02/03 创投观察, AI趋势

为什么 AI 的进步越来越难被察觉 [译]

OpenAI 联合创始人 Ilya Sutskever 在 11 月引发热议，他在当时提到 AI 的进步正在放缓，并表示仅仅扩大 AI 模型规模已无法带来相应的性能提升。 Sutskever 的评论恰逢《The Information》和《Bloomberg》报道 Google 与 Anthropic 也遭遇类似的发展瓶颈。这引发了一波又一波文章宣称 AI 进展已陷入停滞，进一步印证了一种...

2025/01/11 AI, 技术

CES 2025：NVIDIA CEO 表示 AI 正以「惊人速度」发展 [译]

NVIDIA 创始人兼 CEO 黄仁勋在 CES 2025 上发表了 90 分钟的主题演讲，介绍了推动游戏、自动驾驶汽车、机器人和智能 AI 发展的新产品。他在拉斯维加斯 Michelob Ultra Arena 向超过 6000 名观众表示，AI「正以惊人的速度发展」。「这始于感知型 AI — 理解图像、文字和声音。然后是生成式 AI — 创造文本、图像和声音」，黄仁勋说道，「现在...

2025/01/08 AI、科技

反思 - Sam Altman [译]

ChatGPT 迎来两岁生日才过去一个多月，我们已经迈入了新的范式，AI 模型可以进行复杂推理了。新年总会让人心生感慨，我想分享一些个人的思考，以及这一路走来的收获。随着我们离 AGI 越来越近，现在似乎是回顾公司发展历程的好时机。还有很多东西需要理解，还有很多未知的领域，而且我们依然处于早期阶段。但比起刚开始时，我们已经懂得更多了。近九年前我们创立了 OpenAI，因为我们相信 A...

2025/01/06 AI

2024 年我们对大语言模型的认知 [译]

在 2024 年「大语言模型」领域发生了很多事情。以下是过去 12 个月我们在这个领域的发现，以及我对关键主题和重要时刻的总结。这是对我的 2023 年回顾的续篇。本文内容： GPT-4 的门槛被彻底打破了部分 GPT-4 级别的模型可以在我的笔记本电脑上运行由于竞争和效率提升，LLM 价格大幅下跌多模态视觉能力已经普及，语音和视频也开始涌现语音和实时...

2025/01/03 AI, Machine Learning, LLM

构建高效智能体：Anthropic 实践指南 [译]

构建高效智能体过去一年，我们与数十个团队合作，帮助他们在不同行业构建大语言模型（LLM）智能体。我们发现，最成功的实现并非依赖复杂的框架或专门的库，而是采用简单、可组合的模式。本文将分享我们从客户合作和自身智能体开发中获得的经验，为开发者提供构建高效智能体的实用建议。什么是智能体？「智能体」可以有多种定义。一些客户将智能体定义为能够长期独立运行、使用各种工具完成复杂任务的完全...

2025/01/03 AI, 智能体

2025 年 AI 工程师必读清单 [译]

自从我们写了关于论文俱乐部的文章后，经常有人问我们：对于那些在工作中或与朋友一起从零开始的人，有什么推荐的阅读清单？我们最初参考了2023 年的 a16z 规范，但它需要 2025 年的更新，而且需要更注重实践。在这里，我们为 AI 工程师精选「必读」论文。我们的设计目标是：选择约 50 篇论文（约一年每周一篇），可选择额外补充。这是一个任意的限制。 ...

2025/01/03 人工智能, 技术指南, LLM, 翻译

OpenAI o3 在 ARC-AGI-Pub 上取得突破性高分 [译]

OpenAI 的新系统 o3 —— 在 ARC-AGI-1 公共训练集上训练 —— 在我们的公开排行榜上，在 $10k 计算限制下，对半私有评估集取得了突破性的 75.7% 高分。高计算量（172 倍）o3 配置的得分为 87.5%。这是 AI 能力的一个令人惊讶且重要的阶跃式提升，展示了 GPT 系列模型前所未见的新颖任务适应能力。作为背景，ARC-AGI-1 从 2020 年 G...

2024/12/23 人工智能, 技术突破, AGI, 翻译

OpenAI 发布 o1 模型与开发者新工具 [译]

今天，我们推出了一系列重要更新：性能更强的模型、全新的定制工具，以及多项升级功能，这些都将帮助开发者构建性能更优、更灵活且更具成本效益的 AI 应用。主要包括： OpenAI o1 API：支持函数调用、开发者消息、结构化输出和视觉处理能力。实时 API 更新：引入简化的 WebRTC 集成、GPT-4o 音频价格降低 60%，并推出更经济的 GPT-...

2024/12/18 技术, 翻译