从感知机到 GPT 的关键技术、框架、公司与硬件
Pierre François Verhulst 提出逻辑方程,为 sigmoid 函数奠定数学基础
Frank Rosenblatt 发明感知机,第一个可学习的神经网络模型
多元线性回归广泛应用,最小二乘法理论成熟
逻辑回归正式提出;统计学习理论发展,偏差-方差权衡与正则化理论基础确立
Breiman 等人提出 CART,奠定现代决策树基础
Quinlan 引入 ID3(信息增益);Rumelhart 等人推广反向传播算法
SVM、随机森林、Boosting、贝叶斯方法成熟,机器学习作为独立领域确立
Hinton 提出 Deep Belief Network,深度学习概念重新进入主流
ImageNet 数据集发布(李飞飞团队),为大规模视觉识别竞赛奠定基础
IBM Watson 在 Jeopardy! 中击败人类冠军
AlexNet 赢得 ImageNet,深度学习革命正式开启;Word2Vec 发布
Torch 开源;深度强化学习(DQN)在 Atari 游戏超越人类
GAN(生成对抗网络)提出;VGG、GoogLeNet 等关键架构涌现;Adam 优化器发布
ResNet 解决深度网络退化问题;TensorFlow 开源;AlphaGo 击败李世石
Keras 发布,极大降低深度学习入门门槛
PyTorch 开源,以动态图设计赢得学术界青睐
"Attention Is All You Need" — Transformer 架构诞生,彻底改变 NLP
BERT(双向预训练)、GPT-1(生成式预训练);ELMo 引入上下文化词向量;Hugging Face Transformers 开源
GPT-2 展示强大文本生成能力(一度因风险拒绝公开);XLNet、RoBERTa 等 BERT 变体涌现;T5 统一文本到文本框架
GPT-3(175B 参数)展示 In-Context Learning;DALL·E 开创文生图;ViT 将 Transformer 引入计算机视觉
CLIP 连接文本与图像;Stable Diffusion 引领开源生图浪潮;GitHub Copilot 发布(AI 编程助手元年)
ChatGPT 引爆全球 AI 应用浪潮;Stable Diffusion、Midjourney 民主化图像生成;Whisper 开源语音识别;DALL·E 2 发布
GPT-4 多模态;Claude 1/2 发布;Llama 开源引发开源 LLM 浪潮;RAG 架构成熟;LangChain 生态爆发;MCP 协议提出
GPT-4o 端到端多模态;Claude 3.5 系列发布;Gemini 多模态理解;Sora 视频生成;MCP 协议铺开;Claude Code 引领 AI 编程 Agent 赛道
DeepSeek-R1 开源推理模型;AI Agent 大规模落地;claw-code 等 Agent 框架爆发;端侧推理进入生产化(LiteRT);多 Agent 协作标准化
Agent 技能框架(superpowers)定义 AI 开发方法论;托管式 Agent 平台兴起;本地推理成为标配(Ollama 167K stars);Claude Code 生态成熟