课程更新总结与期末项目选题

更新日期: 2026年5月18日


📚 课程内容更新

重要说明

课时安排: 所有课程均为每周3小时一次课

更新的周次

周次 原内容 新内容 课时 变更原因
第9周 OpenCV基础+图像处理 数学基础(网课) 3小时录播 改为网课,讲解数学理论
第10周 YOLO检测 保持不变 3小时 已完成,不改
第11周 目标追踪 保持不变 3小时 已完成,不改
第12周 Sim2Real 视觉+语音+项目启动 3小时 加入语音技术和项目分组
第13周 - 四足机器人+项目实施 3小时 新增内容

第9周:数学基础(网课)

课程类型: 线上录播,3小时

模块内容

模块1:线性代数基础(50分钟)

  • 向量与坐标系
  • 矩阵运算
  • 旋转矩阵与齐次变换
  • 实践: Python实现坐标变换

模块2:机器人运动学数学(50分钟)

  • 正运动学(Forward Kinematics)
  • 逆运动学(Inverse Kinematics)
  • 雅可比矩阵(Jacobian Matrix)
  • 实践: 2/3自由度机械臂仿真

模块3:计算机视觉数学(50分钟)

  • 图像的数学表示
  • 卷积运算(Convolution)
  • 特征提取(梯度、角点)
  • 相机成像模型
  • 实践: OpenCV实现各种滤波器

学习目标

  • 理解机器人控制的数学基础
  • 掌握基本线性代数工具
  • 了解图像处理的数学原理
  • 为后续实战课程打基础

第12周:视觉与语音入门 + 项目启动

课时: 3小时(一次课)

课程大纲(180分钟)

模块 时长 内容
模块1 60分钟 OpenCV视觉处理
模块2 40分钟 语音识别与合成
茶歇 10分钟 休息
模块3 70分钟 期末项目启动

模块1:OpenCV视觉处理(60分钟)

  • 图像读取、显示、保存
  • 颜色空间转换(BGR/RGB/HSV)
  • 图像变换(缩放、裁剪、旋转)
  • 边缘检测(Canny)

12.2 颜色检测与追踪

  • HSV颜色空间原理
  • 颜色范围过滤
  • 轮廓检测
  • 实时物体追踪
  • 实践: HSV调节工具开发

模块2:语音技术入门(40分钟)

语音识别

  • SpeechRecognition库使用
  • 麦克风输入处理
  • 中文语音识别
  • 语音命令识别

语音合成

  • pyttsx3离线合成
  • gTTS在线合成
  • 简单对话机器人

模块3:期末项目启动(70分钟)

  • 项目要求说明
  • 分组与选题
  • 制定开发计划
  • 技术答疑

第13周:四足机器人入门 + 项目实施

课时: 3小时(一次课)

课程大纲(180分钟)

模块 时长 内容
模块1 80分钟 四足机器人基础
茶歇 10分钟 休息
模块2 90分钟 项目开发辅导

模块1:四足机器人基础(80分钟)

13.1 四足机器人概述

  • 四足 vs 轮式 vs 双足
  • 应用场景介绍
  • 机器人结构(12自由度)
  • 真实产品介绍(Spot/Unitree等)

13.2 PyBullet仿真入门

  • PyBullet安装与基本使用
  • 加载四足机器人模型
  • 物理仿真基础

13.3 简单步态控制

  • 步态类型(Walk/Trot)
  • 正弦波步态生成
  • Trot步态实现
  • 实践: PyBullet中实现步态

13.4 进阶话题(了解)

  • 控制方法对比(MPC/RL/CPG)
  • Sim-to-Real挑战
  • 前沿研究方向

模块2:项目开发辅导(90分钟)

13.5 项目开发指导

  • 进度检查与答疑
  • 常见问题解答(FAQ)
  • 项目展示准备
  • 演示视频录制指导
  • 自由开发时间

🎯 期末项目选题(10个)

📦 初级项目(⭐⭐)

适合单人或2人组队

1. 视觉颜色追踪机器人

  • 技术栈: OpenCV + ROS2
  • 功能: 识别并追踪特定颜色物体
  • 扩展: 多颜色识别、轨迹记录
  • 适合人群: 视觉入门

2. 语音控制小乌龟

  • 技术栈: SpeechRecognition + ROS2 Turtlesim
  • 功能: 语音命令控制小乌龟运动
  • 扩展: 语音反馈、复杂命令
  • 适合人群: 语音技术入门

3. 简单目标检测系统

  • 技术栈: YOLO + ROS2
  • 功能: 实时检测并标注物体
  • 扩展: 物体计数、类别统计
  • 适合人群: YOLO应用

🚀 中级项目(⭐⭐⭐)

适合2-3人组队

4. 物体追踪与跟随

  • 技术栈: YOLO + Sort + ROS2
  • 功能: 识别特定物体并跟随
  • 扩展: 保持安全距离、避障
  • 适合人群: 视觉追踪

5. 多传感器融合导航

  • 技术栈: 相机 + 激光雷达 + Nav2
  • 功能: 机器人自主避障导航
  • 扩展: 语音目标点设置
  • 适合人群: 传感器融合

6. 手势识别控制

  • 技术栈: MediaPipe + ROS2
  • 功能: 手势控制机器人运动
  • 扩展: 自定义手势命令
  • 适合人群: 手势识别

🏆 高级项目(⭐⭐⭐⭐+)

适合3人或有基础学生

7. 智能巡检机器人

  • 技术栈: SLAM + 目标检测 + 语音
  • 功能: 自主巡检并识别异常
  • 扩展: 生成巡检报告
  • 难点: 系统集成

8. 人脸识别门禁系统

  • 技术栈: 人脸识别 + 数据库 + ROS2
  • 功能: 识别授权人员并控制
  • 扩展: 陌生人告警、访客登记
  • 难点: 人脸识别准确率

9. 机械臂物体抓取

  • 技术栈: 目标检测 + 逆运动学 + MoveIt
  • 功能: 识别并抓取物体
  • 扩展: 物体分类存放
  • 难点: 运动规划

10. 四足机器人基础控制

  • 技术栈: PyBullet + 步态生成
  • 功能: 四足机器人行走控制
  • 扩展: 地形适应、避障
  • 难点: 动力学控制

📖 单人选项:论文/代码阅读笔记

如果选择单人完成,除了简单项目外,也可以选择阅读笔记方式:

阅读笔记要求

格式要求

  1. 字数: 3000-5000字
  2. 结构:

    • 论文/项目背景
    • 核心技术讲解
    • 代码实现分析
    • 实验结果复现(可选)
    • 个人思考与总结
  3. 提交物:

    • Markdown格式笔记(GitHub)
    • 核心代码运行截图
    • 参考论文PDF链接

推荐阅读方向

1. 视觉SLAM方向

  • ORB-SLAM2/3 论文与代码
  • VINS-Mono 视觉惯性里程计
  • 参考: ORB-SLAM3

2. 目标检测方向

  • YOLO系列论文演进(v1-v8)
  • Faster R-CNN经典论文
  • 参考: YOLOv8 Paper

3. 四足机器人方向

  • MIT Cheetah 控制论文
  • ANYmal 强化学习论文
  • 参考: "Learning Quadrupedal Locomotion" (MIT, 2020)

4. 强化学习方向

  • PPO算法论文详解
  • DQN/A3C经典论文
  • 参考: OpenAI Spinning Up文档

5. 机器人规划方向

6. ROS2生态方向


📋 项目评分标准

评分细则

评分项 权重 优秀(90-100) 良好(75-89) 及格(60-74)
功能完整度 40% 核心+扩展功能 核心功能完整 部分功能
技术难度 30% 复杂算法+创新 多技术应用 基本技术
代码质量 15% 结构清晰+注释 可读性好 可运行
文档报告 15% 详细+视频优秀 文档完整 基本说明

加分项

  • 🌟 开源贡献(+5分)
  • 🌟 创新性强(+5分)
  • 🌟 实际部署(+10分)
  • 🌟 技术难度高(+5分)

📦 提交要求

必须提交

  1. GitHub仓库

    • 完整源代码
    • README.md(使用提供的模板)
    • requirements.txt
    • 项目结构清晰
  2. 演示视频

    • 时长: 2-5分钟
    • 格式: MP4
    • 内容: 功能演示+技术介绍
  3. 效果截图

    • 至少3张运行效果图
    • 关键功能展示

可选提交

  • 项目报告PDF
  • 答辩PPT
  • 测试数据集
  • 技术博客链接

🗓️ 时间节点

时间点 任务 说明
第12周周五 提交项目登记表 确定选题和组员
第13周周三 核心功能实现 基本功能可运行
第13周周五 功能测试完成 Bug修复
第13周周日 录制演示视频 最终提交前准备
第14周周一 最终提交 GitHub+视频
第14周 项目答辩(可选) 现场演示

💡 开发建议

项目成功的关键

  1. 及早开始: 不要拖到最后一周
  2. 小步快跑: 先实现简单版本,再迭代
  3. 频繁测试: 每个功能完成后立即测试
  4. 版本控制: 经常commit,便于回退
  5. 文档同步: 边开发边写文档

常见误区

误区1: 选题过于复杂,最后完不成 ✅ 正确: 选择稍简单的题目,做精做细

误区2: 代码堆砌,缺少注释和文档 ✅ 正确: 代码规范,注释清晰,README完整

误区3: 拖到最后一天才开始 ✅ 正确: 第12周就开始,留足测试时间

误区4: 闭门造车,不寻求帮助 ✅ 正确: 遇到问题及时提问,利用答疑时间


📚 参考资源

官方文档

课程资源

社区资源


✉️ 联系方式

答疑时间

  • 第13周第二次课: 现场答疑3小时
  • 微信群: 随时提问
  • GitHub Issues: 在课程仓库提issue

提交方式

  • 代码: 提交GitHub仓库链接到课程平台
  • 视频: 上传到课程平台或提供链接
  • 报告: 放在GitHub仓库的docs文件夹

🎉 总结

本次课程更新主要目的是:

  1. ✅ 将数学基础作为网课单独讲解,减轻线下课压力
  2. ✅ 增加语音技术入门,丰富技术栈
  3. ✅ 引入四足机器人主题,提升课程前沿性
  4. ✅ 系统化项目选题,给学生更多选择
  5. ✅ 提供单人选项(阅读笔记),照顾不同需求

期待看到大家的精彩项目!加油!🚀


最后更新: 2026年5月18日

results matching ""

    No results matching ""