尝试从底层原理的角度去理解和解释技术问题

尝试从底层原理的角度去理解和解释技术问题：音视频/摄像头/智能家居/蓝牙/WiFi/无线通信/AI。

Pavel Han的技术博客

本文以RK3588+Debian Linux系统为基础，搭建瑞芯微平台的NPU开发环境与板端推理环境，并以Model Zoo中的Yolov5模型为例进行该模式上板运行流程的总结。

瑞芯微RK3588 NPU开发环境搭建笔记

本文详细总结了Transformer模型架构中Decoder部分的总体网络结构，以及数据在其中的运算和流转流程。

一文彻底搞懂Transformer模型的Decoder结构与计算流程

本文对阿里于2025年9月份发布的Qwen3-VL视觉语言模型进行了简单介绍，并对其预训练模型进行了本地推理测试以及在生产环境中使用vLLM进行部署的流程进行了总结。

详解QWen3-VL模型的测试以及vLLM生产环境部署流程

在基于Github上的开源软件（像 Ultralytics 这样活跃且更新频繁的仓库）进行二次开发或预研学习的过程中，最头疼的莫过于：项目源仓库中的上游代码始终处于频繁更新的状态，而我自己在学习和预研的过程中所做的修改到处乱飞，最后连我自己都忘了改过哪里，一单合并代码就出现大量冲突，解决起来非常低效。
本文基于对网络上查询到的资料进行学习，找到了解决以上问题的一个合理的技术路径。而这一套工作流程也是很多团队做开源项目预研过程中的标准做法。简单总结起来就是：在Git 版本控制层面和 软件项目代码架构层面双管齐下，使用Fork + 分支隔离 + 模块化侵入的方式保证开源软件项目学习和研究的高效率。
本文以Github上的qiuqiangkong/audioset_tagging_cnn这个项目详细总结整个流程的具体实践方式。

开源软件项目学习中源码管理的最佳实践

本文针对简单的MNIST手写数字数据集识别的需求，完成了一个最简单的Vision Transformer模型的实现、训练和验证测试，建立对Vision Transformer模型实现流程的完整理解。
MNIST手写数字数据集是最简单的机器视觉数据集，基于MNIST实现一个Vision Transformer模型来实现手写数字字符的识别，难度不会太大，对于模型训练所需要的数据以及算力资源要求也不高，因此通过训练一个MNIST数据集的ViT识别模型，是一个绝佳的入门Vision Transformer模型的实验。

从头实现一个Vision Transformer（ViT）模型

本文详细总结了Vision in Transformer模型的设计架构，以及图像其该模型架构中的完整处理流程，帮助建立对ViT模型的基础认识。

Transformer架构在自然语言处理领域（Natural Language Processing）中的各种大语言模型中的到了非常广泛的应用，而2020年Google的一篇论文《An Image is Worth 16×16 Words》，把Transformer架构引入了计算机视觉领域，利用其Patch Embedding和自注意力机制对计算机视觉领域中传统的卷积神经王CNN的统治地位造成了极大的冲击，从而在人工智能的各个领域中已经显示出一统江湖的态势。

一文入门Vision in Transformer（ViT）模型的架构

本文详细总结了Transformer架构中的自注意力及其多头自注意力机制背后的工作原理和计算流程，以助于更深入的理解完整的Transformer设计架构。

如何理解Transformer架构中的多头注意力机制？

本文通过对一个标准的Encoder-Only类型的Transformer架构，详细的总结了Encoder类型的网络架构以及数据流在其中的计算流程。

一文彻底搞懂Transformer模型的Encoder结构与计算流程

YOLOv5模型的配置文件详解

本文详细以YOLOv5的P3版本为基础，详细总结了该模块的整体网络架构、各个子模块的工作逻辑，可为后续更深入的学习YOLOv5模型打好基础。
注：本文所总结的YOLOv5版本为YOLOv5l，v6.0，P5版本。具体各个版本的差异可以参考YOLOv5模型的不同版本总结。

YOLOv5模型网络架构解读

本文基于模型规模、算法迭代、输出结构等各方面的维度，对YOLOv5模型的不同版本及其相互之间的差异进行了总结。

YOLOv5模型的不同版本总结

YOLO模型的前三个版本v1（2015年6月），v2（2016年12月），v3（2018年4月）全都都是由Joseph Redmon提出和开发，但该作者因为YOLO模型不可避免地被用于军事领域，所以决定退出计算机视觉领域（为作者伟大的博爱精神点赞）。新的YOLOv4版本则于2020年4月由俄罗斯的Alexey Bochkovskiy以及中国台湾省的两名研究员廖弘源和王建尧联合推出。

YOLOv4模型网络架构解读

本文对YOLOv3模型在输出数据的组织格式、Anchor预测框以及损失函数的计算等方面的内容进行了总结。


YOLOv3-输出、Anchor与损失函数的进化总结

本文详细总结了YOLOv3模型的整体架构方面的内容，包括其主干网络Darknet-53、特征金字塔的概念以及多级特征图检测头的设计思路和实现理论。

YOLOv3模型网络架构解读

本文对YOLOv2在YOLOv1基础上所进化的特性进行了完整的总结，解释模型在进化中各项指标得以提升的特性和工作逻辑。
YOLOv2模型在YOLOv2的设计基础上进行了多项模型设计、训练等方面的调整和优化，在VOC2007数据集上的mAP指标由63.4%大幅度提升到了78.6%，同时保持了YOLOv1 one-stage进行目标检测+类别识别的设计，推理速度依然很快，并且能够识别更多的物体类别。

YOLOv2特性总结-从YOLOv1的进化

本文总结了YOLOv2模型基于Faster R-CNN的理论，在其模型网格预测框设计上增加的Anchor机制的来源、在YOLOv2模型中的计算和训练流程，尝试更清楚的认识YOLOv2模型的工作原理。

YOLOv2的Anchor锚框机制详解

本文对YOLOv1模型的训练正样本标记方法、损失函数以及基于训练样本对模型进行训练的完整过程进行了总结，为理解YOLO后续版本的处理流程打好基础。。

YOLOv1模型的损失函数与训练过程解读

本文对YOLOv1模型的输出信息，以及对模型推理输出进行的NMS算法过滤等方面的信息进行总结和学习，为后续阶段解读更近的YOLO模型打好基础。

YOLOv1输出信息以及NMS过滤算法详细解读

本文对YOLOv2模型的BN层、Darknet-19主干网络，以及模型的总体结构进行了详细的总结和学习。

YOLOv2模型网络架构解读

虽然YOLOv1早已过时，但是其为one-stage架构奠定了重要的基础，本文对该模型的架构进行了详细的总结，为学习YOLO后续版本的架构打好基础。

YOLOv1模型网络架构解读

Resnet网络架构是由微软亚洲研究院的何恺明等人在2015年提出，其论文为《Deep Residual Learning for Image Recognition》，在2015年的ImageNet图像识别竞赛中获得了分类、检测、定位等多个任务的冠军。这个模型的核心贡献在于解决了深层网络的训练难题，使得训练上百层甚至上千层的网络成为可能，极大地推动了计算机视觉的发展。

CNN经典网络模型架构学习之Resnet

对于计算机视觉中的目标检测领域而言，主要的评估指标就是mAP与召回率、准确率。本文对IoU、准确率、召回率、AP以及mAP的概念和计算逻辑进行了详细的整理。

目标检测模型的评价指标详解：mAP，召回率，准确率

本文简要总结了基于短波红外光频段成像的SWIR传感器及其成像系统的技术概念以及在工业和生活中的常见应用，为理解和在实际产品中应用该技术做好基础。

短红外（SWIR）传感器的工作原理与应用总结

本文对经典卷积神经网络存在的问题，以及计算机视觉图像识别领域经典的GoogLeNet架构设计的相关知识点进行了完整和详细的总结。

CNN经典网络模型架构学习之GoogleNet

本文总结了卷积神经网络经典模型中的NiN（Network in Network）的设计理念、整体网络架构和具体的网络实现细节。

CNN经典网络模型架构学习之NiN

本文对计算机视觉图像识别领域经典的VGGNet模型的组成架构以及在Pytorch中的实现进行了详细的总结。

CNN经典网络模型架构学习之VGGNet

Softmax激活函数一般用于多分类问题的分类器实现，本文详细介绍和总结了基于Softmax激活函数以及交叉熵损失函数来实现神经网络多分类器的完整计算流程。

实际的人工智能项目，经常会遇到多分类问题，最典型的就是基于MNIST手写数字识别数据集，对手写的0-9总共10个手写数字进行识别和分类，以及基于ImageNet的图片数据集，对日常生活中看到的1000个物体进行分类。在人工智能的机器学习领域中，最常用的多分类器的实现就是Softmax分类器。

Softmax分类器的计算流程详细总结

本文对计算机视觉图像识别领域经典的AlexNet模型的组成架构以及在Pytorch中的实现进行了详细的总结。
在CNN经典网络模型架构学习之LeNet一文中，对Yann LeCun针对手写数字识别的LeNet5网络模型的结构进行了总结。接下来，继续学习计算机视觉领域中的那些经典模型的框架，本文总结了在ImageNet图像识别竞赛中脱颖而出的AlexNet。

CNN经典网络模型架构学习之AlexNet

本文以用于进行手写数字识别功能的LeNet为例，分析该网络的结构以及典型的卷积神经网络的整体架构，对用于进行图像识别和处理的卷积神经网络建立初步认识。

CNN经典网络模型架构学习之LeNet

本文详细总结了基于用户自己指定的训练数据集，对训练数据集及其标注按照YOLO的格式进行预处理，然后对YOLOv5模型进行训练、测试以及ONNX导出等的完整流程。

一文总结YOLOv5模型的自定义训练、测试与模型导出的全过程

本文详细总结了图像ISP处理流程中的Gamma校正模块，解释了在ISP处理流程中要包含Gamma校正模块的原因，以及主流ISP在进行Gamma校正的处理过程中的主要思路和工作流程。

详细总结图像ISP处理流程之Gamma校正

本文总结了目前的人工智能领域中，针对计算机视觉方面的主要应用方向（图像分类，图像定位，目标检测，图像分割，语义分割，实例分割）的差异以及各个应用方向所存在的主流模型。
在当前的计算机视觉领域，图像分类、物体检测以及图像分割是最基础，也是目前发展最为迅速的三大领域。

计算机视觉类AI应用领域及其主流模型总结

本文详细总结了基于Pytorch框架开发和训练好的模型导出为通用的onnx文件，并且通过onnxruntime进行部署和Python/C++访问的流程和步骤。

Pytorch模型的ONNX导出和部署入门

本文详细介绍和总结了基于Pytorch框架实现一个卷积神经网络CNN，用于对手写数字数据集MNIST进行识别的代码流程，以此作为对Pytorch框架以及神经网络编程实践的入门基础。

基于Pytorch实现手写数字识别的卷积神经网络

本文基于对网络资料的学习，对一个简单的卷积神经网络CNN的架构、数据计算和传递流程进行详细的解析和总结，作为理解卷积神经网络架构的基础。

卷积神经网络CNN的架构解析入门

本文对深度学习神经网络中常用的损失函数进行详细的学习和总结，对各种损失函数的特性及其适用性进行整理，方便以后理解各种深度神经网络的架构设计。

盘点深度学习神经网络架构中的常用损失函数

本文对深度学习神经网络中常用的激活函数进行详细的学习和总结，对各个激活函数的特性及其适用性进行整理，方便以后理解各种深度神经网络的架构设计。

盘点深度学习神经网络架构中的常用激活函数

本文基于对参考资料的学习，以一个简单的卷积神经网络结构为例，对卷积神经网络中的卷积与池化操作的完整计算过程进行了详细的总结和解释。

详细解释卷积神经网络中的卷积与池化计算

本文对镜头成像中普遍存在的Lens Shading问题进行详细的总结，分析该问题出现的原因，以及在相机产品进行图像调试中解决该问题的思路进行整理。

镜头成像的Lens Shading问题

音频3A处理简介：AEC，ANS，AGC

本文对WiFi通信无线漫游的概念和传统的漫游流程进行了解释，并对支持WiFi无线漫游过程的三大协议IEEE 802.11K/V/R进行了详细总结，阐述各自解决的问题。

WiFi漫游协议详解-IEEE 802.11 kvr

CRA：Chief Ray Angle，也就是主入射光线角度。对于镜头和Image Sensor而言，虽然两者都有CRA参数，但是其实际定义是明显不同的。
Lens的CRA参数则由镜头的设计本身决定，表示从镜心到成像面的光线角度分布模式。也就是就是镜头各个位置的主光线（过入瞳中心的光线）通过光学系统到达像面以后，与像面交点位置处的法线之间的夹角。

图像传感器和镜头的CRA参数解释及其匹配

本文基于对Novatek NT98567相关资料的学习，整理出来该平台Secure Boot流程中对启动过程中各个阶段进行加解密操作和保护的完整过程，为更清楚的理解嵌入式系统Secure Boot的概念和流程提供了一个很好的实际案例。

Novatek IPC平台Secure Boot流程详细解析

本系列文章的目标是从非AI从业者的角度出发，去尝试理解AI及其大模型在应用中的基本概念，争取通过对这些概念的深入理解和澄清，建立对大模型的工作机制流程以及应用框架方面的知识结构，从而在我们的生活和工作中更好的使用AI。

非专业人士的AI课6：LLM大模型的典型应用级别

非专业人士的AI课5：AI Agent的框架与工作流程解析

非专业人士的AI课4：一文说清楚RAG的工作流程以及与微调的区别

非专业人士的AI课3：LLM大语言模型项目的典型开发流程详解

非专业人士的AI课2：对大模型多模态以及开源闭源概念的总结

本系列文章的目标是从非AI从业者的角度出发，去尝试理解AI及其大模型在应用中的基本概念，争取通过对这些概念的深入理解和澄清，建立对大模型的工作机制流程以及应用框架方面的知识结构，从而能够帮助我们在生活和工作中更好的使用AI。

非专业人士的AI课1：深度神经网络学习入门

众所周知，大语言模型本身只是一个文本生成的工具，虽然有很强的文本生成能力和逻辑推理能力，但是LLM并不具备直接去执行外部功能操作的能力。因此，如果我们要把大模型用于实际产品的应用场景之中，只能利用大模型来生成文本信息的话，那么整个系统真正能够解决问题的能力就会大打折扣。
如果能够将大语言模型所具备的自然语言处理能力，与外部工具/API调用功能相结合的话，就能够显著增强大模型在实际应用场景中解决问题的能力。大模型所具备的function calling就提供了这样一种机制，能够把大模型处理文本的能力，与本地通过function调用的能力相结合，从而为大模型的实际运用提供了极大的拓展空间。

以代码案例来详细介绍Function Calling

MCP：Model Context Protocol，即模型上下文协议，是由Anthropic公司（也就是Claude大模型的开发商）在2024年11月份所开源的标准通信协议，其目的是为大语言模型（LLM）与外部服务之间的通信提供一个标准化的接口协议，实现与外部数据源、工具等的无缝连接，从而扩展大模型的能力。

大模型的MCP到底是什么

本文对SD卡插入后，在SD主控和卡之间的完整初始化流程进行完整的分析和解释：对于一个支持SD卡的消费类电子产品而言，当SD卡插入该产品的SD卡插槽以后，SD主控与SD卡之间的完整初始化通信流程，如何通过这个初始化的设置流程做好进一步读写SD卡的准备。
• 本文仅关注SD卡的SD模式，不考虑SPI模式。
从SD卡插入卡槽，到最后主控对SD卡进行数据内容的读写之间，主要存在以下五个阶段。后续部分对这五个阶段进行详细的解释说明。
• 物理检测与上电阶段
• 卡识别初始化阶段（识别模式）
• 卡识别配置阶段
• 数据传输模式准备
• 数据通信阶段

SD卡插入检测后的完整初始化流程解析

在SD协议中，SD主控与SD卡之间交互流程中的CMD6是一个相对比较复杂的命令。其复杂性体现在：
- 同一个命令既可以实现对SD卡支持特性的读取，也可以对其进行设置。
- CMD6命令的执行及其从SD卡上读取的响应消息，双方不仅在SD的CMD pin上通信，也涉及到了在DAT引脚上传输部分数据，而其他CMD命令的交互执行基本上都只涉及到CMD pin。
- CMD6命令中所支持的功能比较多，包含多个function group，每个function group又包含多个function mode。

所以，本篇比较在较为深入的学习SD物理层协议规范文件（V6.00版本）的基础上，详细的整理出来CMD6命令交互的流程。

CMD6执行的前提就是，先要通过CMD7指令选中SD卡，让SD卡进入传输状态Transfer Mode。

SD通信命令协议解析之CMD6

SDIO（Secure Digital Input Output）和SD卡（Secure Digital Memory Card）同属于SD（Secure Digital）的标准体系，但二者的设计目标与功能实现有明显差异：SD卡是存储类的专用设备，而SDIO则为泛用型外设利用相同的SD接口以及类似的SD协议框架提供了高速扩展接口。简单的说，SDIO和SD卡两者在硬件物理层上完全兼容，但是具体的通信协议上各自发展出来自己的体系。

SD卡与SDIO接口、eMMC之间的联系与区别

众所周知，在SD卡与其控制器之间的SD接口上，有一个专门的CMD引脚。CMD与CLK引脚配合，在SD卡和其主控之间进行控制和配置命令的传输。每次命令模式的通信，SD主控向卡在CMD引脚上发出一个CMD命令结构，根据CMD命令的不同由SD卡给出该命令的答复消息Rx。

SD卡的CMD命令及其响应消息数据结构

本篇笔记在以上笔记的基础上，仍然利用OpenAI的API，访问Kimi多模态模型实现图片中对象识别的功能，同时使用Python和C代码实现并提供案例解析。能够利用C语言来访问多模态大模型开放出来的HTTP API接口，也就能够在低成本的MCU处理器上，基于合理的提示词设计，实现需要大模型服务支持才能提供出来的功能，

基于多模态大模型的HTTP API实现图像识别的功能（Python+C）

对于基于大语言模型的AI应用程序开发而言，用户的应用程序与Kimi或者OpenAI这类大语言模型之间基本上都是使用标准的HTTP接口进行请求，Kimi和OpenAI服务器针对用户应用程序提出的问题进行答复，答复的结果同样封装在HTTP的reponse message中传回给用户应用程序，用户应用程序对结果进行解析后呈现给用户，或者调用其他更加智能化的功能处理（例如AI Agent）。

在此选择国内大语言模型开发商月之暗面Moonshot（也就是Kimi）为例进行与LLM Server之间的AI应用程序交互逻辑的学习和总结。使用Kimi的原因在于：
- 在deepseek之前，Kimi一直是我本人稳定使用的AI工具，其稳定性和输出结果的质量，相比于国内的其他大模型而言一直是名列前茅的。
- Moonshot为每个注册用户提供了15元的预充值费用，这个费用对于通过API进行测试开发而言，基本上是够用了。

对于开发基于Moonshot的AI应用程序而言，提前要做的准备工作主要包括两个部分：
- 按照Moonshot的要求安装python及其Openai library。
- 申请访问Moonshot服务器的API Key，并且为安全起见以环境变量的方式配置到自己的开发机中。

基于Python快速实现与Kimi的AI对话

尺寸类型
- SD：32×24×2.1mm（全尺寸），基本上以及很少使用了
- microSD：11×15×1.0mm，目前应用的主流

引脚触点差异：
- UHS-I及其之前：9个触点（VCC，两个VSS，CLK，CMD，DAT3-DAT0），仍然是目前应用的主流
- UHS-II/UHS-III：17个触点（新增差分对）
- SD Express：保留传统触点+隐式PCIe通道设计

电压兼容性
- 普通SD卡：仅支持3.3V
- UHS卡：可支持3.3V/1.8V双电压（需主控匹配，双方协商电压切换）

SD卡的分类及其各种规格参数总结

在802.11ax也就是WiFi6中引入了一种BSS Coloring特性，这种特性用于优化和解决在高密度环境中多个基本服务集（BSS）之间的无线干扰问题。

在传统的Wi-Fi网络中，如果两个相邻的BSS网络使用相同的信道，它们之间在通信的过程中所发送的信号会相互干扰，导致两个网络的通信性能均明显下降。因为，一旦发生同信道的无限冲突，对于每一个通信节点，都需要增加重传尝试来把数据包放到通信的对端，这样才能避免潜在的数据丢失，无线冲突和重传太多，严重劣化了网络的通信性能。而WiFi6中所推出的BSS Coloring机制可以减少这种不必要的干扰，提高了网络性能和信道利用率。

WiFi6的Bss Coloring特性详解

OFDMA：全称是Orthogonal Frequency Division Multiple Access，即正交频分多址。

在WiFi6之前的WiFi4/WiFi5，甚至更早的802.11a协议中，已经导入了OFDM机制，即把整个通信信道的频宽划分为多个相互重叠但是正交的子载波，以尽可能提升数据传输速率以及频谱利用率，并且克服无线传输中存在的多径干扰问题。

但是单独OFDM的使用，WiFi AP和STA之间的每次通信都是针对单用户的，也就是说每次发送数据的时候，不管这个用户数据量的大小，与这个用户的通信每次都要占用全部的子载波进行通信。如果把整个信道全部的子载波整体看成一辆送货的小车，当用户要通信的数据量很小的时候，例如即时消息，浏览网页等，这些通信的数据量根本用不了全部的子载波，因此这个小车是装不满的，但根据OFDM的工作机制和流程，这个装不满的小车里面也只能装这个用户的数据，小车里多余的空间（即剩下闲置的子载波）就被白白浪费了。

WiFi6的OFDMA特性详解

WiFi6（802.11ax）中OFDMA（正交频分多址接入）的实现依赖于触发帧（Trigger Frame, TF） 这一关键机制。本文从技术角度深入剖析其触发帧的详细细节。

WiFi6的触发帧（Trigger Frame）帧结构详解

君正的A1系列是针对NVR市场所推出的集成式解决方案，相比于传统的NVR方案，君正方案最大的特色是继承了较强的AI算力，所以君正在这个方案的命名上也刻意的以xVR这样的形式进行命名，以强调其AI算力。

对AI NVR的思考以及君正的AI NVR平台A1

本篇笔记对无线射频电路中常用的各种元器件电路的基本工作原理和应用进行简单的总结，为后续理解和设计完整的射频电路系统架构打好基础。

对射频电路元器件的学习总结

总结起来：
- Diplexer主要用于不同频段之间共享同一根天线或者传输链路来进行通信的应用，最典型的就是双频WiFi两个频段，以及LTE多个BAND之间。
- Duplexer则主要在用于同一个频段内，使用FDD模式下的不同上下行信道通信频点上，实现同时收发全双工通信的应用。最典型的应用就是LTE FDD模式的通信。

对双频WiFi天线复用理解的纠正以及对Duplexer和Diplexer的比较

半波振子天线是天线最基本的结构单位，相当于是化学中的分子。所以要想对不同形态和应用中的天线有完整的理解，就要从其源头，也就是半波对称振子天线的工作原理来开始。

本文对半波对称振子天线相关的各方面基础知识进行整理和总结，作为学习更复杂的天线系统技术的基础。

半波对称振子天线基础及其天线增益

G-Sensor：Gravity Sensor即重力传感器，或者Accelerometer即加速度传感器，其作用主要是检测物体在运动过程中加速度的突然变化。GSensor最典型的应用就是在行车记录仪中，当GSensor检测到瞬间的加速、碰撞或者减速（例如急刹车）状态，会自动触发行车记录仪摄像头的内部记录事件，保存一个紧急录影文件作为后续进行事故分析的证据。

G-Sensor的工作原理及其应用总结

G.711是ITU-T所定义的一种音频压缩标准，广泛应用于电话通信网络和VoIP领域。在具体的实现上，G711的音频编解码又可以分为u-law（主要应用于北美和日本）和A-law（主要应用于欧洲和世界的其他地方）两种形式，在本文中分别进行说明。

G711音频压缩标准的实现详解

基础相位调制技术之BPSK/QPSK/DQPSK

本文详细解释了无线通信中非常常用的IQ调整的信号，其调制的工作原理和流程，以及在无线通信中使用所具备的优势。

无线数字通信之IQ调制工作原理

双频WiFi和蓝牙之间的天线是如何复用的？

本文整理出来各种wifi制式下能够支持的速率列表，以及这些理论速率是如何计算出来的。

WiFi不同制式下最大速率的计算

本文对BLE在实际应用中所具备的三种典型安全模式和各个安全模式下的安全级别进行了完整的整理。重点是其中的安全模式1。

蓝牙BLE通信的安全模式和安全级别总结

BLE设备配对模式和流程详细解析

BLE设备之间安全密钥总结

通过对Amazon US市场上的主流消费类NVR产品相关宣传资料的学习，整理出来该行业中主流产品所具备的功能列表和规格参数。

2024 US主流消费类NVR功能与规格参数总结

本文对BLE的跳频工作流程，跳频机制的相关参数，以及跳频信道的计算逻辑进行了详细的整理。

BLE的跳频机制和流程实现详细总结

本文对广芯微电子提供的PKE方案进行了完整的分析，重点整理出来在基站和钥匙端进行的LF以及HF通信的工作流程。

对广芯微车钥匙PKE方案的深入学习总结

本文重点解读了Apple的《Software Token Authentication Server Specification》规范文档，对Apple MFI认证所需要的配件厂商服务器的部署要求，以及配件厂商服务器与Apple Server之间的交互流程进行了完整的整理。

MFI Software Token认证服务器规范解读

本文基于对MFI认证相关文档的学习，整理了MFI认证的两种类型（硬件加密芯片/Software Token），MFI认证的流程，以及Software Token Based MFI外设产品与Token认证和管理相关流程的技术细节。

基于Software Token的Apple MFI认证及其工作流程

本文汇总了Nordic在2024年11月份最新发布的nRF54L系列蓝牙系列芯片方案的规格参数。

Nordic nRF54L系列信息汇总

本文总结了基于深圳创视微电子推出的CV4003IoT Image Sensor，实现完整的低成本pre roll电池摄像头的方案，与对比了该pre roll方案与AOV方案之间的优劣势。

基于CV4003IoT Sensor实现Pre Roll电池摄像头方案

本文对不同类型的NAT工作流程进行了整理，在此基础上总结了DMZ的概念和工作原理，以及DMZ在普通路由器上的配置以及使用中存在的限制因素。

路由器DMZ配置工作原理及其限制总结

本文详细总结了TEE和ARM TrustZone技术的概念及其背后的发展历程，从ARM SOC硬件设计和CPU上代码执行流程的两个角度TrustZone技术的执行流程和系统框架。

一文入门TEE与ARM TrustZone安全技术

本文对目前主流的汽车无钥匙解决方案RKE、PKE以及PEPS三种系统进行了详细的介绍，会尝试回答在理解这些系统中所存在的技术方面的问题。

汽车的无钥匙解决方案之RKE/PKE/PEPS

本文对Ring Doorbell以及OmniVision所主推的Pre Roll功能的工作原理进行了整理，基于OV的OA7600系统设计框架总结了Pre Roll模式下系统的完整工作流程，以及AOV与Pre Roll模式的优劣势对比。

Ring Doorbell的Pre Roll功能及其工作原理

通过两篇总结对Linux系统下UBI及其UBIFS文件系统的核心概念、使用流程、文件系统内容的存储结构进行完整的整理，为Linux下高效使用UBIFS文件系统打好理论方面的基础。

对Linux的UBI以及UBIFS文件系统的学习总结

本文总结了Linux系统下应用程序运行经常出现的OOM错误，针对该错误在kernel中所提供的处理方式，以及这些OOM的处理方式在嵌入式系统应用中的思考。

Linux的OOM错误及其处理思路

本文总结了在WiFi6中引入的新的低功耗工作模式TWT的工作流程及其与传统的Legacy Power Saving Mode的对比，三种TWT模式的交互流程以及对TWT在实际产品应用中的思考。

WiFi6的低功耗特性TWT简介

本文对Linux应用编程中经常出现的Signal 11也就是SIGSEGV错误的原因及其在kernel中的处理流程进行了总结，以及整理了在实践中遇到这类错误通用的调试手段。

对于Signal 11 SIGSEGV错误的简单总结

本文基于对腾讯微信IoT及其IoT Video相关宣传资料的学习，整理了在IoT尤其是IPC品类产品中整合IoT Video功能（重点是微信的双向音视频通话）的相关信息，作为后续产品规划的参考。

对微信IoT平台及其音视频能力在物联网产品中接入的调研

本文对SBOM的概念、由来、主要的作用以及目前主流的SBOM文件格式进行了总结，并提供了一些关于SBOM自动生成的信息。

软件物料清单SBOM及其标准格式

本文对LTE注网流程相关的APN以及PLMN两个概念做了非常详细的总结，在对这两个概念理解的基础上，整理了LTE模块的典型注网流程及其注意事项。

LTE模块注网过程及其APN设置

本文重点对LTE-M和NB-IoT两种LPWAN移动通信技术的应用特点做了总结，并对LTE CAT 1bis、LTE-M以及NB-IoT这三者在各个维度上进行了全面的比较。

LTE CAT 1bis、LTE-M、NB-IoT的对比

本文基于对网络资料的学习，整理了在项目中经常用到的LTE CAT 1模块的一些技术背景信息，对其选型优劣势和工作原理做了一些简单的总结。

LTE CAT 1技术的相关信息汇总

通过对网络资料的学习整理了exFAT文件系统的结构，对其内部如何管理数据和文件进行总结。

exFAT文件系统详细解析

本文对FAT32文件系统的结构进行详细解析，整理了与该文件系统相关的一些核心概念，在此基础上理解整个文件系统的存储结构以及增删操作的逻辑，对FAT32文件系统如何保存数据可以建立一个更为宏观的认识，指导后续工作中存在的与FAT32文件系统相关问题的解决。

FAT32文件系统详细解析

本文档对嵌入式系统中所使用的Secure Boot机制的作用，背后的工作流程和软硬件设计原理，以及完整的嵌入式系统Secure Boot启动流程进行了总结和学习。

嵌入式产品SecureBoot的启动流程总结

本文对嵌入式产品中经常使用的防抄板类型的加密芯片和更高级的加密通信和身份验证的加密芯片做了总结。并且以广泛使用的ATECC608加密芯片为例，通过网络资料的学习，整理了该加密芯片方案在嵌入式MCU和Linux系统中的应用逻辑和大体流程。

嵌入式产品硬件加密芯片的工作原理总结

本文基于对最新的1.3版本Matter规范文档的学习，整理了在最新的Matter生态协议中可以支持的设备类型，以及当前这些设备类型在平台和设备开发商中的支持现状。

Matter支持的智能家居设备类型及其现状

本文基于自己阅读《持续交付2.0》一书的心得体会，以及与客户交流所学习得到的信息，整理出来一些把敏捷开发和持续集成等软件工程理念应用在嵌入式软件领域中的思路。

基于多模态大模型的HTTP API实现图像识别的功能（Python+C）

多模态大模型进行图像识别的Python实现

多模态大模型进行图像识别的C实现