AI 技术演进史 — ML Learning

🧮 经典机器学习时代（1950s–1990s）

1845

Pierre François Verhulst 提出逻辑方程，为 sigmoid 函数奠定数学基础

1958

Frank Rosenblatt 发明感知机，第一个可学习的神经网络模型

1960s

多元线性回归广泛应用，最小二乘法理论成熟

1970s

逻辑回归正式提出；统计学习理论发展，偏差-方差权衡与正则化理论基础确立

1984

Breiman 等人提出 CART，奠定现代决策树基础

1986

Quinlan 引入 ID3（信息增益）；Rumelhart 等人推广反向传播算法

1990s

SVM、随机森林、Boosting、贝叶斯方法成熟，机器学习作为独立领域确立

🔑 引领者与工具

🧠 SVM (Vapnik) 🌳 CART / C4.5 🌲 随机森林 (Breiman) 📐 MATLAB 📊 R 语言 🏛️ Bell Labs 🏛️ AT&T Research

🌅 深度学习黎明（2006–2011）

2006

Hinton 提出 Deep Belief Network，深度学习概念重新进入主流

2009

ImageNet 数据集发布（李飞飞团队），为大规模视觉识别竞赛奠定基础

2011

IBM Watson 在 Jeopardy! 中击败人类冠军

🔑 引领者与工具

🧠 DBN / Autoencoder 📸 ImageNet 🏢 IBM 🏫 Stanford (李飞飞) 🏫 Toronto (Hinton) 🖥️ NVIDIA GPU 开始用于训练

🧠 神经网络复兴（2012–2016）

2012

AlexNet 赢得 ImageNet，深度学习革命正式开启；Word2Vec 发布

2013

Torch 开源；深度强化学习（DQN）在 Atari 游戏超越人类

2014

GAN（生成对抗网络）提出；VGG、GoogLeNet 等关键架构涌现；Adam 优化器发布

2015

ResNet 解决深度网络退化问题；TensorFlow 开源；AlphaGo 击败李世石

2015

Keras 发布，极大降低深度学习入门门槛

2016

PyTorch 开源，以动态图设计赢得学术界青睐

🔑 引领者与工具

🖼️ CNN (AlexNet/VGG/ResNet) 🎮 GAN ⚡ DQN / 强化学习 🔥 TensorFlow (Google) 🔥 PyTorch (Meta) 🧱 Keras 🏢 Google DeepMind 🏢 Meta AI 🏢 NVIDIA 🖥️ NVIDIA GTX / Tesla GPU 🖥️ NVIDIA CUDA

⚡ Transformer 革命（2017–2019）

2017

"Attention Is All You Need" — Transformer 架构诞生，彻底改变 NLP

2018

BERT（双向预训练）、GPT-1（生成式预训练）；ELMo 引入上下文化词向量；Hugging Face Transformers 开源

2019

GPT-2 展示强大文本生成能力（一度因风险拒绝公开）；XLNet、RoBERTa 等 BERT 变体涌现；T5 统一文本到文本框架

🔑 引领者与工具

⚡ Transformer 🔄 BERT 📝 GPT-1/2 🤗 Hugging Face ⚡ DeepSpeed (Microsoft) 🏢 Google Brain 🏢 OpenAI 🏢 Microsoft 🖥️ Google TPU v2/v3 🖥️ NVIDIA V100

🔤 大模型时代（2020–2023）

2020

GPT-3（175B 参数）展示 In-Context Learning；DALL·E 开创文生图；ViT 将 Transformer 引入计算机视觉

2021

CLIP 连接文本与图像；Stable Diffusion 引领开源生图浪潮；GitHub Copilot 发布（AI 编程助手元年）

2022

ChatGPT 引爆全球 AI 应用浪潮；Stable Diffusion、Midjourney 民主化图像生成；Whisper 开源语音识别；DALL·E 2 发布

2023

GPT-4 多模态；Claude 1/2 发布；Llama 开源引发开源 LLM 浪潮；RAG 架构成熟；LangChain 生态爆发；MCP 协议提出

🔑 引领者与工具

📝 GPT-3/4 🎨 Diffusion Models 🔍 RAG 🤖 Agent 架构 🦜 LangChain 🔗 LlamaIndex 🤗 Hugging Face Hub 🛠️ GitHub Copilot 🦙 Ollama 🏢 OpenAI 🏢 Anthropic 🏢 Google DeepMind 🏢 Meta (Llama) 🏢 NVIDIA 🖥️ NVIDIA A100 🖥️ NVIDIA H100 🖥️ Google TPU v4

🎨 多模态与 Agent 时代（2024–）

2024

GPT-4o 端到端多模态；Claude 3.5 系列发布；Gemini 多模态理解；Sora 视频生成；MCP 协议铺开；Claude Code 引领 AI 编程 Agent 赛道

2025

DeepSeek-R1 开源推理模型；AI Agent 大规模落地；claw-code 等 Agent 框架爆发；端侧推理进入生产化（LiteRT）；多 Agent 协作标准化

2026

Agent 技能框架（superpowers）定义 AI 开发方法论；托管式 Agent 平台兴起；本地推理成为标配（Ollama 167K stars）；Claude Code 生态成熟

🔑 引领者与工具

🤖 AI Agent 🎨 多模态大模型 🔌 MCP 协议 📱 端侧推理 🛠️ Claude Code 🛠️ Cursor 🦙 Ollama 🔗 MCP Servers 🧠 DeepSeek 🏢 Anthropic 🏢 OpenAI 🏢 Google 🏢 DeepSeek 🏢 NVIDIA 🏠 Hugging Face 🖥️ NVIDIA B100/Blackwell 📱 Apple Silicon (M系列) 📱 Google Edge TPU 🖥️ Groq LPU

🏷️ 图例说明

🧠 技术/算法 🔧 框架/工具 🏢 公司/机构 🖥️ 硬件

📜 AI 技术演进史

🧮 经典机器学习时代（1950s–1990s）

1845

1958

1960s

1970s

1984

1986

1990s

🔑 引领者与工具

🌅 深度学习黎明（2006–2011）

2006

2009

2011

🔑 引领者与工具

🧠 神经网络复兴（2012–2016）

2012

2013

2014

2015

2015

2016

🔑 引领者与工具

⚡ Transformer 革命（2017–2019）

2017

2018

2019

🔑 引领者与工具

🔤 大模型时代（2020–2023）

2020

2021

2022

2023

🔑 引领者与工具

🎨 多模态与 Agent 时代（2024–）

2024

2025

2026

🔑 引领者与工具

🏷️ 图例说明