KeyChan's blog

从 RNN 到 Transformer：时间建模的变革

发表于 2025-11-25 分类于深度学习本文字数： 14k 阅读时长 ≈ 50 分钟

1. 时间依赖与梯度消失：序列建模的困境

在很多经典的图像任务中，我们通常假设不同样本之间是独立同分布的（i.i.d.）——也就是说，一张图片与另一张图片在统计上是相互独立的，模型只需要把一张图片看作一个整体输入来处理即可。卷积网络（CNN）则利用图像内部像素之间强烈的局部相关性，通过卷积核在空间上提取局部到全局的层级特征。

但在处理序列任务（sequence modeling）时情况就完全不同了：语言、语音、时间序列信号都具有明显的时间依赖，同一个序列内部，不同时间步之间往往高度相关。要正确预测下一个值、下一个词或下一个声音，模型必须记住同一条序列中之前发生过什么。这一点正是循环神经网络（Recurrent Neural Network, RNN）诞生的核心动机。

阅读全文 »

「无人机系列④」飞行控制算法入门——从PID到仿真验证

发表于 2025-11-18 分类于无人机本文字数： 11k 阅读时长 ≈ 42 分钟

1. 控制系统的物理与数学基础

在研究飞控算法（Flight Control Algorithm）之前，理解姿态描述方式、闭环反馈思想及采样周期的作用至关重要。本章节主要介绍这些基础概念，为后续的建模与 PID 控制奠定直观认知。

1.1 坐标系与姿态描述

无人机的姿态描述通常基于两个参考系：惯性系（Inertial Frame）与机体系（Body Frame）。

惯性系：固定在地面或某个空间参考点上，其坐标轴多采用“东北下（NED）”方式定义，即以北（North）、东(East)、下(Down)三个方向作为基准，用来描述无人机相对于地球的运动状态。
机体系：固定在无人机机体上，原点通常位于质心，$x_b$ 轴沿机头方向，$y_b$ 轴指向右翼，$z_b$ 轴指向机体下方。

阅读全文 »

「无人机系列③」飞控硬件与传感器系统

发表于 2025-11-11 分类于无人机本文字数： 14k 阅读时长 ≈ 52 分钟

1. 飞控结构与数据流

飞控系统（Flight Controller, FC）是无人机的“大脑”，负责接收传感器信息、进行状态估计、计算控制量，并最终驱动电机或舵机执行动作。要理解一台无人机如何保持稳定飞行，我们首先要弄清楚飞控的内部结构组成与数据流动路径。

1.1 模块组成：从“感知”到“执行”

一个典型的飞控系统由四大核心模块构成，每个模块既有明确的功能分工，又通过标准化接口实现数据协作。

阅读全文 »

为什么卷积神经网络能看懂世界？——CNN 的思维方式

发表于 2025-11-06 分类于深度学习本文字数： 15k 阅读时长 ≈ 55 分钟

1. 从滤波到认知：卷积的结构假设

在计算机视觉领域，卷积（Convolution）不仅是一种数学运算，更是一种关于世界结构的假设。这一假设的核心思想在于：图像的语义信息是局部相关的。换言之，空间上相邻的像素往往属于同一个物体或纹理区域，它们的统计特征并非独立存在，而是具有强烈的局部依赖性。卷积神经网络（Convolutional Neural Network, CNN）正是基于这一假设构建的。

阅读全文 »

深度学习的底层逻辑：从函数逼近到智能涌现

发表于 2025-11-01 更新于 2025-11-06 分类于深度学习本文字数： 15k 阅读时长 ≈ 53 分钟

1. 什么是深度学习？——从函数到映射的思想

在讨论深度学习的“智能”之前，我们必须回答一个更基础的问题——深度学习到底在学什么？ 它究竟是神经元的堆叠，还是某种数据结构？为什么看似简单的线性代数运算，能孕育出近似人类思维的能力？

从本质上讲，深度学习不是魔法，而是一种函数逼近的科学。所有的神经网络，无论是用于图像识别、语言理解还是游戏博弈，其根本目标都是——寻找一个能够将输入 $x$ 映射到输出 $y$ 的函数 $f_\theta(x)$。这里的 $\theta$ 表示函数中的可学习参数，也就是神经网络中的权重与偏置。

阅读全文 »

「无人机系列②」天上飞的力学：空气动力与结构设计

发表于 2025-10-28 更新于 2025-11-06 分类于无人机本文字数： 9k 阅读时长 ≈ 33 分钟

1. 为什么无人机能飞？——从推力说起

想象一下，当你打开一台电风扇时，风扇叶片旋转，会将空气往前“推”，而你能感受到一股反方向的力。这股力其实就是空气反作用在风扇上的推力。无人机的螺旋桨与此类似，只不过它不是把空气往前吹，而是把空气往下推，于是空气反过来向上“托起”整台无人机。

这就是无人机能悬停在空中的根本原因：它依靠桨叶高速旋转，使气流形成“下洗”（Downwash），从而获得一个向上的空气动力。

阅读全文 »

智能体的十年：遗忘，是智慧的特性

发表于 2025-10-24 分类于深度学习，趋势与洞察本文字数： 3k 阅读时长 ≈ 11 分钟

Karpathy 的最终洞见极具哲学意味：也许 AGI 的关键，不在于让机器记住更多，而在于让它学会智能地遗忘。”记忆不是智能的核心，抽象与反思才是。人类的遗忘能力，正是我们能够理解、概括、创造的基础。未来的 AI 发展方向，也许不是更大的模型，而是更像人脑的模型—— 能遗忘、能重组、能在噪声中找到秩序。

阅读全文 »

「无人机系列①」从玩具到系统工程：无人机的全景

发表于 2025-10-21 更新于 2025-10-24 分类于无人机本文字数： 9.9k 阅读时长 ≈ 36 分钟

1. 无人机是什么：从航模到系统

在多数人的印象里，无人机似乎就是一架“能飞起来的玩具”。但当我们深入一点去看就会发现，真正意义上的“无人机”，并不仅仅指一台可以在空中保持平衡的飞行器，而是一套复杂的无人系统（Unmanned System）。它既包含飞行平台，也包含控制、通信、感知、能源等完整子系统。换句话说——无人机不仅仅是能飞，而是一个能自主感知、判断与执行的系统工程。

阅读全文 »

「Flutter系列⑥」跨平台交互、插件开发与发布运维

发表于 2025-10-15 分类于跨平台框架本文字数： 7.2k 阅读时长 ≈ 26 分钟

1. 概述

可能有人刚使用 Flutter 时，会有类似疑问：“为什么我在 Flutter 里调用不了系统相机？”，“蓝牙、NFC、推送这些底层能力怎么都得靠插件？”
这类问题背后，其实反映了一个事实——Flutter 并不是一个“包揽一切”的框架。它的核心职责，是负责跨平台 UI 渲染和逻辑运行，而真正和系统打交道的，仍然是 Android、iOS、Web、桌面这些原生层。

阅读全文 »

「Flutter系列⑤」性能剖析：帧、内存、启动与并发优化

发表于 2025-10-12 更新于 2025-10-15 分类于跨平台框架本文字数： 11k 阅读时长 ≈ 41 分钟

1. 从感知到数据驱动

性能问题，往往是从“感觉”开始的。比如——滑动列表时明显掉帧、点击按钮后界面迟迟不响应、应用启动时间漫长、或突然出现 OOM（内存溢出）从而导致崩溃。这些“感知问题”是用户最先接触到的体验信号，也是性能优化的出发点。
但“感觉”并不等于“原因”。一个卡顿，可能是因为主线程被阻塞，也可能是图片解码过慢，甚至只是动画过渡时 CPU 和 GPU 同时被抢占。

阅读全文 »