AI空间轻改造
入舍 — AI 驱动的室内轻改造平台,从拍照到出方案,10 分钟搞定
项目简介
入舍(Rù Shè)是一个基于 AI 的室内轻改造平台,支持厨房、卧室、卫生间等 10+ 空间类型。用户只需上传一张空间照片,AI 就能自动分析布局、推荐设计方案、生成效果图,并给出预算报价。整个流程从拍照到出方案,10 分钟内完成。
核心理念是"轻改造"——不搞大拆大建,通过更换家具、调整布局、升级表面等针对性改变,让空间焕然一新。
用户流程
- 选择空间 — 厨房、卧室、卫生间等,每种空间有独立的 AI 人设和知识库
- 上传照片 — Qwen-VL 视觉模型分析空间布局、固定设施和痛点
- 获取方案 — AI 推荐三套差异化设计方向,支持重新生成
- 逐元素设计 — 选择感兴趣的元素(橱柜、台面、灯具等),AI 逐一生成效果图
- 方案总结 — 前后对比图 + 元素清单 + 价格报价 + 风格描述
技术架构
技术栈
| 层级 | 技术 |
|---|---|
| 后端 | FastAPI + Uvicorn + SQLAlchemy + Alembic |
| 数据库 | PostgreSQL + pgvector (向量检索) |
| LLM | Qwen (文本) + Qwen-VL (视觉) + text-embedding-v3 (向量) |
| 图片生成 | 即梦 API |
| 前端 | React + Vite + TypeScript |
| 通信 | SSE 流式推送 (14 种事件类型) |
| 部署 | Docker + Docker Compose + Nginx |
核心模块
1. 显式状态机对话引擎
对话流程由 10 个状态驱动,而非 if-else 判断:
IDLE → ANALYZING → AWAITING_ACTION → CLEARING/STYLING → PLANNING → PICKING → DESIGNING → ADDING → SUMMARY不同空间类型通过数据库配置跳过特定状态(如卧室跳过"清空家具"),添加新空间只需插入数据库记录,零代码修改。
2. 双层检索引擎
- 语义检索:DashScope text-embedding-v3 生成 1024 维向量,pgvector HNSW 索引
- 结构化过滤:SQL WHERE 过滤风格、价格、空间类型
- 性能:单次查询 < 200ms(比之前的 LightRAG 快 100 倍)
3. LLM Function Calling
定义 6 个工具供 LLM 调用:图片分析、方案检索、效果图生成、操作按钮、元素选择器、方案总结。LLM 自动从对话上下文提取参数。
4. 图片处理管道
四类图片统一管理:方案参考图、元素素材图、用户上传图、AI 生成图。素材图在录入时由 Qwen-VL 预提取描述,生图时自动注入 prompt 提升效果。
关键设计决策
| 决策 | 原因 |
|---|---|
| pgvector 替代 LightRAG | 统一基础设施,支持结构化过滤,检索延迟从 5-10s 降到 50ms |
| PostgreSQL 替代 JSON 文件 | 会话/消息并发安全,支持事务和关系查询 |
| 显式状态机 | 可审计的状态转换,支持多空间流程定制 |
| 抽象图片存储接口 | MVP 用本地文件,生产环境无缝切换到 OSS |
开发进度
| 阶段 | 内容 | 状态 |
|---|---|---|
| Phase 0 | 基础设施:PostgreSQL + pgvector, ORM, 种子数据 | 完成 |
| Phase 1 | 会话存储迁移:JSON → PostgreSQL | 完成 |
| Phase 2 | 状态机 + 多空间抽象 | 完成 |
| Phase 3 | 前端多空间支持 | 完成 |
| Phase 4 | 新空间验证(卧室完整流程) | 进行中 |
17 项任务已完成 16 项,剩余卧室端到端验证。