课程更新总结与期末项目选题
更新日期: 2026年5月18日
📚 课程内容更新
重要说明
课时安排: 所有课程均为每周3小时一次课
更新的周次
| 周次 | 原内容 | 新内容 | 课时 | 变更原因 |
|---|---|---|---|---|
| 第9周 | OpenCV基础+图像处理 | 数学基础(网课) | 3小时录播 | 改为网课,讲解数学理论 |
| 第10周 | YOLO检测 | 保持不变 | 3小时 | 已完成,不改 |
| 第11周 | 目标追踪 | 保持不变 | 3小时 | 已完成,不改 |
| 第12周 | Sim2Real | 视觉+语音+项目启动 | 3小时 | 加入语音技术和项目分组 |
| 第13周 | - | 四足机器人+项目实施 | 3小时 | 新增内容 |
第9周:数学基础(网课)
课程类型: 线上录播,3小时
模块内容
模块1:线性代数基础(50分钟)
- 向量与坐标系
- 矩阵运算
- 旋转矩阵与齐次变换
- 实践: Python实现坐标变换
模块2:机器人运动学数学(50分钟)
- 正运动学(Forward Kinematics)
- 逆运动学(Inverse Kinematics)
- 雅可比矩阵(Jacobian Matrix)
- 实践: 2/3自由度机械臂仿真
模块3:计算机视觉数学(50分钟)
- 图像的数学表示
- 卷积运算(Convolution)
- 特征提取(梯度、角点)
- 相机成像模型
- 实践: OpenCV实现各种滤波器
学习目标
- 理解机器人控制的数学基础
- 掌握基本线性代数工具
- 了解图像处理的数学原理
- 为后续实战课程打基础
第12周:视觉与语音入门 + 项目启动
课时: 3小时(一次课)
课程大纲(180分钟)
| 模块 | 时长 | 内容 |
|---|---|---|
| 模块1 | 60分钟 | OpenCV视觉处理 |
| 模块2 | 40分钟 | 语音识别与合成 |
| 茶歇 | 10分钟 | 休息 |
| 模块3 | 70分钟 | 期末项目启动 |
模块1:OpenCV视觉处理(60分钟)
- 图像读取、显示、保存
- 颜色空间转换(BGR/RGB/HSV)
- 图像变换(缩放、裁剪、旋转)
- 边缘检测(Canny)
12.2 颜色检测与追踪
- HSV颜色空间原理
- 颜色范围过滤
- 轮廓检测
- 实时物体追踪
- 实践: HSV调节工具开发
模块2:语音技术入门(40分钟)
语音识别
- SpeechRecognition库使用
- 麦克风输入处理
- 中文语音识别
- 语音命令识别
语音合成
- pyttsx3离线合成
- gTTS在线合成
- 简单对话机器人
模块3:期末项目启动(70分钟)
- 项目要求说明
- 分组与选题
- 制定开发计划
- 技术答疑
第13周:四足机器人入门 + 项目实施
课时: 3小时(一次课)
课程大纲(180分钟)
| 模块 | 时长 | 内容 |
|---|---|---|
| 模块1 | 80分钟 | 四足机器人基础 |
| 茶歇 | 10分钟 | 休息 |
| 模块2 | 90分钟 | 项目开发辅导 |
模块1:四足机器人基础(80分钟)
13.1 四足机器人概述
- 四足 vs 轮式 vs 双足
- 应用场景介绍
- 机器人结构(12自由度)
- 真实产品介绍(Spot/Unitree等)
13.2 PyBullet仿真入门
- PyBullet安装与基本使用
- 加载四足机器人模型
- 物理仿真基础
13.3 简单步态控制
- 步态类型(Walk/Trot)
- 正弦波步态生成
- Trot步态实现
- 实践: PyBullet中实现步态
13.4 进阶话题(了解)
- 控制方法对比(MPC/RL/CPG)
- Sim-to-Real挑战
- 前沿研究方向
模块2:项目开发辅导(90分钟)
13.5 项目开发指导
- 进度检查与答疑
- 常见问题解答(FAQ)
- 项目展示准备
- 演示视频录制指导
- 自由开发时间
🎯 期末项目选题(10个)
📦 初级项目(⭐⭐)
适合单人或2人组队
1. 视觉颜色追踪机器人
- 技术栈: OpenCV + ROS2
- 功能: 识别并追踪特定颜色物体
- 扩展: 多颜色识别、轨迹记录
- 适合人群: 视觉入门
2. 语音控制小乌龟
- 技术栈: SpeechRecognition + ROS2 Turtlesim
- 功能: 语音命令控制小乌龟运动
- 扩展: 语音反馈、复杂命令
- 适合人群: 语音技术入门
3. 简单目标检测系统
- 技术栈: YOLO + ROS2
- 功能: 实时检测并标注物体
- 扩展: 物体计数、类别统计
- 适合人群: YOLO应用
🚀 中级项目(⭐⭐⭐)
适合2-3人组队
4. 物体追踪与跟随
- 技术栈: YOLO + Sort + ROS2
- 功能: 识别特定物体并跟随
- 扩展: 保持安全距离、避障
- 适合人群: 视觉追踪
5. 多传感器融合导航
- 技术栈: 相机 + 激光雷达 + Nav2
- 功能: 机器人自主避障导航
- 扩展: 语音目标点设置
- 适合人群: 传感器融合
6. 手势识别控制
- 技术栈: MediaPipe + ROS2
- 功能: 手势控制机器人运动
- 扩展: 自定义手势命令
- 适合人群: 手势识别
🏆 高级项目(⭐⭐⭐⭐+)
适合3人或有基础学生
7. 智能巡检机器人
- 技术栈: SLAM + 目标检测 + 语音
- 功能: 自主巡检并识别异常
- 扩展: 生成巡检报告
- 难点: 系统集成
8. 人脸识别门禁系统
- 技术栈: 人脸识别 + 数据库 + ROS2
- 功能: 识别授权人员并控制
- 扩展: 陌生人告警、访客登记
- 难点: 人脸识别准确率
9. 机械臂物体抓取
- 技术栈: 目标检测 + 逆运动学 + MoveIt
- 功能: 识别并抓取物体
- 扩展: 物体分类存放
- 难点: 运动规划
10. 四足机器人基础控制
- 技术栈: PyBullet + 步态生成
- 功能: 四足机器人行走控制
- 扩展: 地形适应、避障
- 难点: 动力学控制
📖 单人选项:论文/代码阅读笔记
如果选择单人完成,除了简单项目外,也可以选择阅读笔记方式:
阅读笔记要求
格式要求
- 字数: 3000-5000字
结构:
- 论文/项目背景
- 核心技术讲解
- 代码实现分析
- 实验结果复现(可选)
- 个人思考与总结
提交物:
- Markdown格式笔记(GitHub)
- 核心代码运行截图
- 参考论文PDF链接
推荐阅读方向
1. 视觉SLAM方向
- ORB-SLAM2/3 论文与代码
- VINS-Mono 视觉惯性里程计
- 参考: ORB-SLAM3
2. 目标检测方向
- YOLO系列论文演进(v1-v8)
- Faster R-CNN经典论文
- 参考: YOLOv8 Paper
3. 四足机器人方向
- MIT Cheetah 控制论文
- ANYmal 强化学习论文
- 参考: "Learning Quadrupedal Locomotion" (MIT, 2020)
4. 强化学习方向
- PPO算法论文详解
- DQN/A3C经典论文
- 参考: OpenAI Spinning Up文档
5. 机器人规划方向
- A*/RRT路径规划算法
- MoveIt! 运动规划
- 参考: MoveIt Tutorials
6. ROS2生态方向
- Nav2导航栈架构
- MoveIt2操作规划
- 参考: Nav2 Documentation
📋 项目评分标准
评分细则
| 评分项 | 权重 | 优秀(90-100) | 良好(75-89) | 及格(60-74) |
|---|---|---|---|---|
| 功能完整度 | 40% | 核心+扩展功能 | 核心功能完整 | 部分功能 |
| 技术难度 | 30% | 复杂算法+创新 | 多技术应用 | 基本技术 |
| 代码质量 | 15% | 结构清晰+注释 | 可读性好 | 可运行 |
| 文档报告 | 15% | 详细+视频优秀 | 文档完整 | 基本说明 |
加分项
- 🌟 开源贡献(+5分)
- 🌟 创新性强(+5分)
- 🌟 实际部署(+10分)
- 🌟 技术难度高(+5分)
📦 提交要求
必须提交
GitHub仓库
- 完整源代码
- README.md(使用提供的模板)
- requirements.txt
- 项目结构清晰
演示视频
- 时长: 2-5分钟
- 格式: MP4
- 内容: 功能演示+技术介绍
效果截图
- 至少3张运行效果图
- 关键功能展示
可选提交
- 项目报告PDF
- 答辩PPT
- 测试数据集
- 技术博客链接
🗓️ 时间节点
| 时间点 | 任务 | 说明 |
|---|---|---|
| 第12周周五 | 提交项目登记表 | 确定选题和组员 |
| 第13周周三 | 核心功能实现 | 基本功能可运行 |
| 第13周周五 | 功能测试完成 | Bug修复 |
| 第13周周日 | 录制演示视频 | 最终提交前准备 |
| 第14周周一 | 最终提交 | GitHub+视频 |
| 第14周 | 项目答辩(可选) | 现场演示 |
💡 开发建议
项目成功的关键
- 及早开始: 不要拖到最后一周
- 小步快跑: 先实现简单版本,再迭代
- 频繁测试: 每个功能完成后立即测试
- 版本控制: 经常commit,便于回退
- 文档同步: 边开发边写文档
常见误区
❌ 误区1: 选题过于复杂,最后完不成 ✅ 正确: 选择稍简单的题目,做精做细
❌ 误区2: 代码堆砌,缺少注释和文档 ✅ 正确: 代码规范,注释清晰,README完整
❌ 误区3: 拖到最后一天才开始 ✅ 正确: 第12周就开始,留足测试时间
❌ 误区4: 闭门造车,不寻求帮助 ✅ 正确: 遇到问题及时提问,利用答疑时间
📚 参考资源
官方文档
课程资源
- GitHub组织: ai-robot-class
- 课程网站: course.a-real.me
- 示例代码: 参考各周的作业代码
社区资源
- ROS Answers: https://answers.ros.org/
- OpenCV Forum: https://forum.opencv.org/
- Stack Overflow: 搜索相关问题
✉️ 联系方式
答疑时间
- 第13周第二次课: 现场答疑3小时
- 微信群: 随时提问
- GitHub Issues: 在课程仓库提issue
提交方式
- 代码: 提交GitHub仓库链接到课程平台
- 视频: 上传到课程平台或提供链接
- 报告: 放在GitHub仓库的docs文件夹
🎉 总结
本次课程更新主要目的是:
- ✅ 将数学基础作为网课单独讲解,减轻线下课压力
- ✅ 增加语音技术入门,丰富技术栈
- ✅ 引入四足机器人主题,提升课程前沿性
- ✅ 系统化项目选题,给学生更多选择
- ✅ 提供单人选项(阅读笔记),照顾不同需求
期待看到大家的精彩项目!加油!🚀
最后更新: 2026年5月18日