BookSpeak —— 一本书学英语

项目灵感

我想做一件事:读完一本英语书,同时提升词汇量和口语。

不是用Duolingo刷题,不是背单词表,而是拿一本真正想读的书——比如《纳瓦尔宝典》英文版——一页一页读下去,读完这本书,英语也提升了。

现在市面上的工具,要么只教阅读,要么只练口语,没有一个把两件事串起来的。

现有工具的痛点

我调研了市面上已有的开源项目:

项目功能痛点
LWT阅读文本+标记生词没有口语功能,UI老旧
ReadBridgeAI辅助阅读偏学术,没有口语输出
OpenKotoAI翻译+阅读大而全,不聚焦”一本书”
English Reading Assessment发音评估只是一个评估工具,没有学习闭环
LinGo终端阅读工具纯阅读,无口语

核心缺失:

  • ❌ 没有”以一本书为核心”的学习体验
  • ❌ 读完一段后,没有口语输出环节
  • ❌ 没有”读完这本书=词汇+口语双提升”的闭环
  • ❌ 要么太复杂,要么太简单

BookSpeak 的定位

“读完一本书,学会一门技能”

一本书 = 一个完整的学习周期。

  • 有始有终(从第一章到最后一章)
  • 有成就感(读完一本书的满足感)
  • 有上下文(同一批词汇在书中反复出现,自然记忆)
  • 有深度(不是碎片,是完整内容)

核心功能

1. 导入一本书

支持格式:

  • EPUB(电子书标准格式)
  • PDF
  • TXT
  • 甚至直接粘贴网页链接

2. 分段阅读

把书拆成小段(段落/章节),每天读一段。

界面:

  • 左侧:原文
  • 右侧:翻译/注释(可选,默认隐藏)
  • 点击生词 → 弹出释义 + 发音 + 收藏到生词本

3. 生词本(基于这本书)

不是背整本字典,只背这本书里出现的生词

  • 自动统计这本书的词汇难度
  • 根据你的水平标记”已知/未知”
  • 已收藏的生词,在书中再次出现时高亮提醒

4. 口语练习(核心差异化)

读完一段后,进入”口语输出”环节:

模式A:朗读评估

  • 用户朗读刚才读的段落
  • AI(Web Speech API 或 Whisper)识别发音
  • 给出评分 + 具体发音纠错

模式B:AI对话

  • AI基于书中内容提问
  • 用户用英语回答
  • AI纠正语法和用词,给出更好的表达

模式C:复述练习

  • 用户用自己的话复述段落大意
  • AI评估流畅度和准确性

5. 进度追踪

可视化面板:

  • 阅读进度(第几章/共几章)
  • 词汇量增长(这本书帮我又认识了多少词)
  • 口语评分趋势(朗读分数越来越高)
  • 连续打卡天数

6. 导出功能

  • 生词本导出为 Anki 格式
  • 学习报告导出为 PDF
  • 口语录音导出(回顾自己的进步)

MVP(最小可行产品)

第一步目标:能跑起来,我自己先用

技术栈:

  • 前端:React + Vite(简单、快)
  • 后端:Node.js + Express(我熟悉)
  • 数据库:SQLite(轻量、本地、零配置)
  • AI:OpenAI API(解释词汇、口语对话)
  • 语音:浏览器 Web Speech API(语音识别+朗读,免费)
  • 部署:Electron 打包桌面应用 或 直接浏览器运行

MVP功能清单:

  1. 上传 TXT 文件
  2. 分段显示文本
  3. 点击查词(调用AI或在线词典)
  4. 朗读按钮(浏览器朗读)
  5. 用户录音 + AI评分(最简单版本:识别率对比)
  6. 生词收藏 + 简单统计

预计开发时间: 2-3周(业余时间)

后续迭代

版本功能
v0.1TXT上传、分段阅读、查词、朗读、录音
v0.2EPUB支持、生词本、进度追踪
v0.3AI口语对话、复述练习
v0.4多本书管理、学习报告、Anki导出
v1.0桌面应用(Electron)、离线模式

开源策略

  • License:MIT(最开放)
  • 平台:GitHub
  • 文档:README + 开发文档 + 使用教程
  • 社区:Issue区收集反馈,Discord/微信群交流
  • 商业模式:软件免费,未来可卖”精选书籍包”或”高级AI功能”

为什么这个项目能成

  1. 我自己是第一个用户 —— 真实需求,边做边用
  2. 技术栈匹配 —— Java底子+正在学AI,刚好用上
  3. 差异化明确 —— “一本书学英语”,不是又一个语言学习App
  4. 开源有传播力 —— 程序员群体天然关注开源工具
  5. 契合长期目标 —— 学好英语→去澳洲/做独立开发/更多可能性

下一步行动

  • 创建GitHub仓库
  • 写README和项目文档
  • 搭建最基础的React+Vite框架
  • 实现”上传TXT+显示文本”功能
  • 集成Web Speech API(朗读+识别)
  • 导入《纳瓦尔宝典》英文版作为测试数据

状态:💡 想法(刚诞生,准备启动)