小智 AI 聊天机器人
小智 AI 聊天机器人(XiaoZhi AI Chatbot)是虾哥设计并开源的一个硬件作品,主控制器是 ESP32。该项目使用 MIT 许可证,这意味着任何人都可以免费使用、复刻自己的小智 AI 机器人,甚至用于商业用途。
该项目的初衷是帮助更多人入门 AI 硬件开发,了解如何将当下飞速发展的大语言模型应用到实际的硬件设备中。无论你是对 AI 感兴趣的学生,还是想要探索新技术的开发者,都可以通过这个项目获得宝贵的学习经验。
主要功能
- 支持 Wi-Fi、ML307 Cat.1 4G 网络通信模块
- BOOT 键唤醒和打断,支持点击和长按两种触发方式
- 离线语音唤醒 ESP-SR
- 流式语音对话(WebSocket 或 UDP 协议)
- 支持国语、粤语、英语、日语、韩语 5 种语言识别 SenseVoice
- 声纹识别,识别是谁在喊 AI 的名字 3D Speaker
- 大模型 TTS(火山引擎 或 CosyVoice)
- 大模型 LLM(Qwen, DeepSeek, Doubao)
- 可配置的提示词和音色(自定义角色)
- 短期记忆,每轮对话后自我总结
- OLED / LCD 显示屏,显示信号强弱或对话内容
- 支持 LCD 显示图片表情
- 支持多语言(中文、英文)
支持硬件
小智 AI 聊天机器人的固件目前已经支持多款硬件,包括: