BookSpeak —— 一本书学英语
项目灵感
我想做一件事:读完一本英语书,同时提升词汇量和口语。
不是用Duolingo刷题,不是背单词表,而是拿一本真正想读的书——比如《纳瓦尔宝典》英文版——一页一页读下去,读完这本书,英语也提升了。
现在市面上的工具,要么只教阅读,要么只练口语,没有一个把两件事串起来的。
现有工具的痛点
我调研了市面上已有的开源项目:
| 项目 | 功能 | 痛点 |
|---|---|---|
| LWT | 阅读文本+标记生词 | 没有口语功能,UI老旧 |
| ReadBridge | AI辅助阅读 | 偏学术,没有口语输出 |
| OpenKoto | AI翻译+阅读 | 大而全,不聚焦”一本书” |
| English Reading Assessment | 发音评估 | 只是一个评估工具,没有学习闭环 |
| LinGo | 终端阅读工具 | 纯阅读,无口语 |
核心缺失:
- ❌ 没有”以一本书为核心”的学习体验
- ❌ 读完一段后,没有口语输出环节
- ❌ 没有”读完这本书=词汇+口语双提升”的闭环
- ❌ 要么太复杂,要么太简单
BookSpeak 的定位
“读完一本书,学会一门技能”
一本书 = 一个完整的学习周期。
- 有始有终(从第一章到最后一章)
- 有成就感(读完一本书的满足感)
- 有上下文(同一批词汇在书中反复出现,自然记忆)
- 有深度(不是碎片,是完整内容)
核心功能
1. 导入一本书
支持格式:
- EPUB(电子书标准格式)
- TXT
- 甚至直接粘贴网页链接
2. 分段阅读
把书拆成小段(段落/章节),每天读一段。
界面:
- 左侧:原文
- 右侧:翻译/注释(可选,默认隐藏)
- 点击生词 → 弹出释义 + 发音 + 收藏到生词本
3. 生词本(基于这本书)
不是背整本字典,只背这本书里出现的生词。
- 自动统计这本书的词汇难度
- 根据你的水平标记”已知/未知”
- 已收藏的生词,在书中再次出现时高亮提醒
4. 口语练习(核心差异化)
读完一段后,进入”口语输出”环节:
模式A:朗读评估
- 用户朗读刚才读的段落
- AI(Web Speech API 或 Whisper)识别发音
- 给出评分 + 具体发音纠错
模式B:AI对话
- AI基于书中内容提问
- 用户用英语回答
- AI纠正语法和用词,给出更好的表达
模式C:复述练习
- 用户用自己的话复述段落大意
- AI评估流畅度和准确性
5. 进度追踪
可视化面板:
- 阅读进度(第几章/共几章)
- 词汇量增长(这本书帮我又认识了多少词)
- 口语评分趋势(朗读分数越来越高)
- 连续打卡天数
6. 导出功能
- 生词本导出为 Anki 格式
- 学习报告导出为 PDF
- 口语录音导出(回顾自己的进步)
MVP(最小可行产品)
第一步目标:能跑起来,我自己先用
技术栈:
- 前端:React + Vite(简单、快)
- 后端:Node.js + Express(我熟悉)
- 数据库:SQLite(轻量、本地、零配置)
- AI:OpenAI API(解释词汇、口语对话)
- 语音:浏览器 Web Speech API(语音识别+朗读,免费)
- 部署:Electron 打包桌面应用 或 直接浏览器运行
MVP功能清单:
- 上传 TXT 文件
- 分段显示文本
- 点击查词(调用AI或在线词典)
- 朗读按钮(浏览器朗读)
- 用户录音 + AI评分(最简单版本:识别率对比)
- 生词收藏 + 简单统计
预计开发时间: 2-3周(业余时间)
后续迭代
| 版本 | 功能 |
|---|---|
| v0.1 | TXT上传、分段阅读、查词、朗读、录音 |
| v0.2 | EPUB支持、生词本、进度追踪 |
| v0.3 | AI口语对话、复述练习 |
| v0.4 | 多本书管理、学习报告、Anki导出 |
| v1.0 | 桌面应用(Electron)、离线模式 |
开源策略
- License:MIT(最开放)
- 平台:GitHub
- 文档:README + 开发文档 + 使用教程
- 社区:Issue区收集反馈,Discord/微信群交流
- 商业模式:软件免费,未来可卖”精选书籍包”或”高级AI功能”
为什么这个项目能成
- 我自己是第一个用户 —— 真实需求,边做边用
- 技术栈匹配 —— Java底子+正在学AI,刚好用上
- 差异化明确 —— “一本书学英语”,不是又一个语言学习App
- 开源有传播力 —— 程序员群体天然关注开源工具
- 契合长期目标 —— 学好英语→去澳洲/做独立开发/更多可能性
下一步行动
- 创建GitHub仓库
- 写README和项目文档
- 搭建最基础的React+Vite框架
- 实现”上传TXT+显示文本”功能
- 集成Web Speech API(朗读+识别)
- 导入《纳瓦尔宝典》英文版作为测试数据
状态:💡 想法(刚诞生,准备启动)